Prüfmethodik

Prüfbar. Nachvollziehbar. Manipulationssichtbar.

Echte Aufgaben. Klare Bewertung. Nachvollziehbarer Nachweis.

AI-RENA fragt dich nicht, KI-Kompetenz zu behaupten. Es zeichnet auf, wie du echte Aufgaben bearbeitest, bewertet gegen definierte Rubriken und stellt Nachweise nur aus, wenn die Belegkette intakt ist.

AI-RENA macht KI-Kompetenz nachvollziehbar.

Echte Aufgabe. Echtes Ergebnis. Belegbarer Nachweis.

✓ Kein Nachweis ohne Trace•✓ Standardmäßig privat•✓ Keine Fake-Rankings•✓ Echte Aufgaben, kein Trivia

Was wir bewerten

Praktische KI-Arbeit in fünf Kompetenzbereichen

Jede Challenge ist einem Kompetenzbereich mit expliziten Rubrikdimensionen zugeordnet. Du siehst vor dem Start, was zählt – keine Blackbox nach der Einreichung.

Prompt-Steuerung

AufgabenverständnisKontextqualitätNützlichkeit der AusgabeRisikobewusstsein

Echte AufgabeDefinierte RubrikBelegt

Quellen & Vertrauen

AufgabenverständnisKontextqualitätNützlichkeit der AusgabeRisikobewusstsein

Echte AufgabeDefinierte RubrikBelegt

Business-Umsetzung

AufgabenverständnisKontextqualitätNützlichkeit der AusgabeRisikobewusstsein

Echte AufgabeDefinierte RubrikBelegt

Agentische Workflows

AufgabenverständnisKontextqualitätNützlichkeit der AusgabeRisikobewusstsein

Echte AufgabeDefinierte RubrikBelegt

Agentensteuerung

AufgabenverständnisKontextqualitätNützlichkeit der AusgabeRisikobewusstsein

Echte AufgabeDefinierte RubrikBelegt

Wie wir bewerten

Vom Challenge-Lauf zum geprüften Nachweis

Scoring ist keine einzelne undurchsichtige Zahl. Es ist eine Pipeline: Lauf aufzeichnen, Integrität prüfen, gegen Rubriken bewerten und optional einen Nachweis ausstellen.

01

Lauf

Du bearbeitest eine echte KI-Aufgabe im Challenge-Workspace. Finale Einreichung und Laufaktivität werden aufgezeichnet.

Challenge gestartet · Entwurfsaktivität · Einreichung aufgezeichnet

02

Trace

AI-RENA erstellt einen append-only Run Trace mit hash-verknüpften Events vom Start bis zum bewerteten Ergebnis.

Lifecycle: gestartet -> bewertet -> geschlossen

03

Score

Deterministische Gates prüfen zuerst objektive Anforderungen. Ein semantischer Judge bewertet Rubrikdimensionen, wenn Live-Evaluation verfügbar ist.

Gates + Rubrikbelege · Light oder Full Tier

04

Nachweis

Starke Läufe können zu privaten, teilbaren Nachweisen werden – nur wenn Trace, Einreichungs-Fingerprint und Score zusammenpassen.

Standardmäßig privat · Teilbar, wenn du es wählst

Bewertungs-Pipeline (Detail zu Schritt 3)

Deterministische Gates

Objektive Prüfungen laufen zuerst – Pflichtmarker, Struktur, Fixture-Regeln, Kapselgrenzen. Fehler erzeugen klare, verständliche Erklärungen.

Semantischer Judge

Rubrikdimensionen werden mit Live-KI-Bewertung gescored, wenn Anbieter verfügbar sind. Das Label Full Evaluation gilt nur, wenn der Judge erfolgreich abgeschlossen hat. Wo Provider-APIs es erlauben, werden Sampling-Einstellungen stabilisiert, um vermeidbare Score-Varianz zu senken, ohne Rubrikbewertung zu ersetzen.

Provider-Resilienz

Evaluation versucht Primary- und Fallback-Provider nacheinander. Wenn kein Live-Provider erfolgreich ist, schlägt der Lauf sichtbar fehl – AI-RENA ersetzt echte Bewertung nicht durch heuristische Scores.

Light Evaluation

Kostenloser täglicher Lauf: Score, kompaktes Feedback, wichtigste Verbesserungslücken. Genug zum Lernen – nicht die volle Audit-Tiefe.

Full Evaluation

Bezahlte Läufe: vollständige Rubrikaufschlüsselung, tiefere Verbesserungshinweise, reichhaltiges privates Laufprotokoll. Gebaut für nachweisfähige Verbesserungsloops.

Lauf

Trace

Score

Nachweis

Warum es manipulationssichtbar ist

Eine hash-verknüpfte Belegkette – kein Screenshot

Nachweise werden nur ausgestellt, wenn aufgezeichneter Run Trace, tatsächliche Einreichung und Bewertungsscore perfekt zusammenpassen. Die Kette macht nachträgliche Manipulation erkennbar.

Hash-verknüpfte Trace-Events

event_1

challenge started

a4f8c2…e91b

↓

event_2

submission recorded

7d3a1f…4c82

prev_hash -> Kettenlink

↓

event_3

evaluation completed

b9e2d0…1a7f

prev_hash -> Kettenlink

Jedes Event enthält den vorherigen Hash. Eine Änderung an einem Event macht die nachfolgende Kette ungültig.

Append-only Run Trace

Jeder bewertete Lauf erzeugt eine hash-verknüpfte Ereigniskette. Neue öffentlich prüfbare Traces nutzen traceVersion 3 mit sekundengenauen Zeitstempeln und kanonischen JSON-Payloads, damit Event-Hashes auch nach Speicherung reproduzierbar bleiben.

Einreichungs-Fingerprint

Deine finale Einreichung erhält einen SHA-256-Fingerabdruck. Die Nachweiserstellung prüft, ob die gespeicherte Einreichung weiterhin zum Trace-Datensatz passt.

Integritätsurteil

Jeder Trace erhält ein Urteil: gültig, teilweise oder gebrochen. Gebrochene Traces blockieren Nachweise. Teilweise Legacy-Traces können dem Eigentümer einen privaten Nachweis erlauben; öffentliches Teilen braucht eine gültige Kette.

Nachweise werden nur ausgestellt, wenn aufgezeichneter Run Trace, tatsächliche Einreichung und Bewertungsscore perfekt zusammenpassen.

Was du wirklich bekommst

Tiefes privates Laufprotokoll. Klare öffentliche Nachweise.

Du behältst vollen Audit-Zugriff auf deinen Lauf. Recruiter und Peers sehen eine bereinigte, professionelle Nachweisseite – ohne deinen privaten Entwurfstext.

Privates Laufprotokoll

87/100 · Solide

Privat

Gesamtdauer: 12m 34s
Aktive Bearbeitung: 8m 12s · 4 revisions
Bewertung: Full · 42s
Einreichung: 1,842 chars

Rubrikbelege

Klarheit der AnweisungStark

GrenzenStark

AusgabeformatStark

Trace-Integrität: gültig

Hash-Kette geprüft. Einreichungs-Fingerprint passt zum gespeicherten Attempt.

Bestätigter KI-Kompetenznachweis

Ausgestellt von AI-RENA · Belegter Lauf

Prompt-Steuerungs-Lauf

Beispielkandidat

87/100 · Solide

Prompt-SteuerungBelegtDefinierte Rubrik

Öffentliche Nachweis-ID: AR-a1b2c3d4

Bereinigter Prüftrace

Challenge gestartet

Laufaktivität aufgezeichnet

Bewertung abgeschlossen

Dieser Nachweis wurde aus einem aufgezeichneten Challenge-Lauf erstellt. Öffentliche Daten sind bereinigt und zeigen keine Entwürfe oder privaten Eingaben.

Privater Nachweislink

Teile nur mit Menschen, die du auswählst. Sichtbarkeit bleibt unter deiner Kontrolle.

HR-Ansicht

Recruiter-freundliches Nachweis-Layout über ?view=hr – ein praktisches Kompetenzsignal, keine automatisierte Hiring-Entscheidung.

LinkedIn Share

Öffentliche Nachweisseiten enthalten dynamische OG-Metadaten, damit geteilte Links Score, Kompetenzbereich und AI-RENA Branding zeigen.

Was AI-RENA unterscheidet

Für Belege gebaut – nicht für Engagement-Tricks

Sichtbare Steuerung, nicht Originalität

AI-RENA misst, ob der Lauf aktives Formen, Prüfen und Verbessern KI-gestützter Arbeit zeigt.

Echte Aufgaben, kein Multiple Choice

Du löst praktische KI-Arbeit – Prompts, Policies, Missionen – keine Trivia oder selbstberichteten Checkboxen.

Belegte Bewertung statt Blackbox-Grading

Scores stammen aus einem aufgezeichneten Lauf mit definierten Rubrikbelegen. Es gibt keine zweite, unkontrollierte Nachbewertung.

Standardmäßig privat statt öffentliche Leaderboards

Dein Nachweis bleibt privat, bis du ihn teilst. Daily Rankings nutzen echte abgeschlossene Läufe – keine Fake-Perzentil-Claims.

Definierte Rubriken statt Bauchgefühl

Jede Challenge ist expliziten Rubrikdimensionen je Kompetenzbereich zugeordnet. Du weißt vor dem Start, was bewertet wird.

Manipulationssichtbare Hash-Kette

Run-Trace-Events sind hash-verknüpft. Änderungen an der Historie brechen die Integritätsprüfung und blockieren öffentliche Nachweise.

Kein Unlimited Plan

Credits begrenzen Retakes und tiefe Evaluation. Das hält Bewertungen ehrlich und kostenkontrolliert statt unbegrenzt viele Low-Quality-Läufe zu erlauben.

Häufige Annahme

AI-RENA Realität

Externe KI-Nutzung schwächt den Nachweis

Externe KI-Tools sind erlaubt

Alles selbst zu schreiben beweist Kompetenz

Sichtbare Steuerung beweist Kompetenz

Ein Score reicht

Ein Score braucht Trace-Kontext

Zertifikate beweisen Kompetenz

Echte Arbeit beweist Kompetenz

Nachweisstufen

Nachweis-Assurance-Level (L0-L3)

AI-RENA trennt die Ergebnisqualität davon, wie sichtbar der Arbeitsweg war und ob der kurze Verständnischeck bestanden wurde.

L0

Aufgezeichnetes Ergebnis

Aufgezeichnetes Ergebnis — der Score stammt aus einer echten Aufgabe mit klaren Kriterien.

L1

Belegt

Belegter Lauf — der Lauf ist mit Ereigniskette und Signatur abgesichert.

L2

Prozess sichtbar

Arbeitsweg sichtbar — zusammengefasste Signale zeigen Einfügen, Bearbeitung und Zeitverlauf.

L3

Interaktion bestätigt

Verständnis bestätigt — ein kurzer, zeitbegrenzter Check prüft, ob die Person die eigene Lösung erklären kann.

Nachweisstufen beschreiben, was ein Nachweis unterstützt — keine automatisierte Einstellungsentscheidung. Copy-Paste und externe KI-Tools sind erlaubt; die Aufzeichnung erklärt sichtbare Kontrolle, nicht Originalität.

FAQ

Fragen zur Prüfung

Wie genau wird ein Lauf bewertet?+

Zuerst prüfen deterministische Gates objektive Anforderungen – Struktur, Marker, Grenzen, Fixture-Regeln. Danach bewertet ein semantischer Judge Rubrikdimensionen gegen deine Einreichung und den Challenge-Kontext. Der finale Score ist trace-basiert belegt und wird mit Rubrikbelegen pro Dimension gespeichert. Um vermeidbare Score-Schwankungen zu reduzieren, fixiert AI-RENA Sampling-Einstellungen dort, wo Anbieter-APIs es unterstützen. Das ersetzt keine Rubrikbewertung und senkt nicht die Modellqualität: deterministische Gates, Live-Judge und Provider-Fallback bleiben aktiv.

Warum kann derselbe Prompt leicht unterschiedliche Scores bekommen?+

Derselbe Prompt kann bei erneuter Ausführung leichte Score-Unterschiede erzeugen, weil Live-KI-Bewertung nicht bytegenau deterministisch ist. AI-RENA reduziert vermeidbare Varianz mit stabilen Scoring-Einstellungen, wo Anbieter-APIs es unterstützen, ohne die Rubrikbewertung durch einen schlechteren Shortcut zu ersetzen.

Was bedeutet "trace-backed" technisch?+

Jeder bewertete Lauf erzeugt eine append-only Event-Kette in run_traces und run_trace_events. Events sind hash-verknüpft, sodass spätere Änderungen die Prüfung brechen. Öffentliche Nachweisseiten zeigen eine bereinigte Projektion – nicht deinen privaten Entwurfstext.

Sind externe KI-Tools erlaubt?+

Ja. AI-RENA ist für KI-gestützte Arbeit gebaut. Externe Tools, Notizen, Vorlagen und Entwürfe sind erlaubt; Nachweisstärke entsteht aus dem finalen Ergebnis plus sichtbarer Steuerung im Lauf – wie du Ausgabe geformt, geprüft und verbessert hast.

Was ist der Unterschied zwischen Light und Full Evaluation?+

Light Evaluation (kostenloser täglicher Lauf) gibt Score und kompaktes Feedback – größte Lücken und einen fokussierten Verbesserungsblick. Full Evaluation schaltet tiefere Rubrikaufschlüsselung, mehr Verbesserungshinweise und reichere Audit-Details für bezahlte Läufe frei.

Kann jemand einen Nachweis fälschen oder erneut ausspielen?+

Nein. Nachweiserstellung erfordert einen geschlossenen Run Trace, passenden Einreichungs-Hash, passenden Attempt-Score und genügend Credits. Nachweise sind pro Attempt idempotent – aus demselben Lauf kann kein zweiter Nachweis mit anderem Score erstellt werden.

Was passiert, wenn der Trace kaputt ist?+

Gebrochene Integrität blockiert Nachweise vollständig. Teilweise Legacy-Traces können dem Eigentümer noch einen privaten Nachweis erlauben, aber kein öffentliches Teilen. Neue Läufe nutzen strikte traceVersion-3-Prüfung für öffentlich vertrauenswürdige Nachweise.

Ist mein Einreichungstext öffentlich?+

Nein. Öffentliche Nachweisseiten zeigen Aufgabenkontext, Score-Band, Rubrikzusammenfassung und einen bereinigten Prüftrace. Voller Einreichungstext und SHA-256-Fingerprints sind nur in deinem privaten Laufprotokoll sichtbar.

Warum gibt es keinen Unlimited Plan?+

Ernsthafte KI-Bewertung hat echte Verarbeitungskosten. Credits halten Retakes und tiefe Evaluation fair, verhindern Missbrauch und richten die Plattformökonomie an Qualitätsnachweisen aus – nicht an unbegrenzten Low-Signal-Läufen.

Wie unterscheidet sich das von Quiz-Plattformen oder LinkedIn Skill Badges?+

AI-RENA prüft praktische KI-Arbeit mit definierten Rubriken, zeichnet einen manipulationssichtbaren Run Trace auf und stellt Nachweise nur aus, wenn Trace, Einreichung und Score zusammenpassen. Es ist ein Leistungsbeleg – kein selbst erklärtes Badge oder Multiple-Choice-Zertifikat.

Bereit, die Methode live zu sehen? Starte mit der heutigen Challenge oder vergleiche bezahlte Proof-Pfade.

Challenge starten Pläne ansehen