Prüfmethodik
Prüfbar. Nachvollziehbar. Manipulationssichtbar.
Echte Aufgaben. Klare Bewertung. Nachvollziehbarer Nachweis.
AI-RENA fragt dich nicht, KI-Kompetenz zu behaupten. Es zeichnet auf, wie du echte Aufgaben bearbeitest, bewertet gegen definierte Rubriken und stellt Nachweise nur aus, wenn die Belegkette intakt ist.
AI-RENA macht KI-Kompetenz nachvollziehbar.
Echte Aufgabe. Echtes Ergebnis. Belegbarer Nachweis.
Was wir bewerten
Praktische KI-Arbeit in fünf Kompetenzbereichen
Jede Challenge ist einem Kompetenzbereich mit expliziten Rubrikdimensionen zugeordnet. Du siehst vor dem Start, was zählt – keine Blackbox nach der Einreichung.
Prompt-Steuerung
Quellen & Vertrauen
Business-Umsetzung
Agentische Workflows
Agentensteuerung
Wie wir bewerten
Vom Challenge-Lauf zum geprüften Nachweis
Scoring ist keine einzelne undurchsichtige Zahl. Es ist eine Pipeline: Lauf aufzeichnen, Integrität prüfen, gegen Rubriken bewerten und optional einen Nachweis ausstellen.
Lauf
Du bearbeitest eine echte KI-Aufgabe im Challenge-Workspace. Finale Einreichung und Laufaktivität werden aufgezeichnet.
Challenge gestartet · Entwurfsaktivität · Einreichung aufgezeichnet
Trace
AI-RENA erstellt einen append-only Run Trace mit hash-verknüpften Events vom Start bis zum bewerteten Ergebnis.
Lifecycle: gestartet -> bewertet -> geschlossen
Score
Deterministische Gates prüfen zuerst objektive Anforderungen. Ein semantischer Judge bewertet Rubrikdimensionen, wenn Live-Evaluation verfügbar ist.
Gates + Rubrikbelege · Light oder Full Tier
Nachweis
Starke Läufe können zu privaten, teilbaren Nachweisen werden – nur wenn Trace, Einreichungs-Fingerprint und Score zusammenpassen.
Standardmäßig privat · Teilbar, wenn du es wählst
Bewertungs-Pipeline (Detail zu Schritt 3)
Deterministische Gates
Objektive Prüfungen laufen zuerst – Pflichtmarker, Struktur, Fixture-Regeln, Kapselgrenzen. Fehler erzeugen klare, verständliche Erklärungen.
Semantischer Judge
Rubrikdimensionen werden mit Live-KI-Bewertung gescored, wenn Anbieter verfügbar sind. Das Label Full Evaluation gilt nur, wenn der Judge erfolgreich abgeschlossen hat. Wo Provider-APIs es erlauben, werden Sampling-Einstellungen stabilisiert, um vermeidbare Score-Varianz zu senken, ohne Rubrikbewertung zu ersetzen.
Provider-Resilienz
Evaluation versucht Primary- und Fallback-Provider nacheinander. Wenn kein Live-Provider erfolgreich ist, schlägt der Lauf sichtbar fehl – AI-RENA ersetzt echte Bewertung nicht durch heuristische Scores.
Light Evaluation
Kostenloser täglicher Lauf: Score, kompaktes Feedback, wichtigste Verbesserungslücken. Genug zum Lernen – nicht die volle Audit-Tiefe.
Full Evaluation
Bezahlte Läufe: vollständige Rubrikaufschlüsselung, tiefere Verbesserungshinweise, reichhaltiges privates Laufprotokoll. Gebaut für nachweisfähige Verbesserungsloops.
Warum es manipulationssichtbar ist
Eine hash-verknüpfte Belegkette – kein Screenshot
Nachweise werden nur ausgestellt, wenn aufgezeichneter Run Trace, tatsächliche Einreichung und Bewertungsscore perfekt zusammenpassen. Die Kette macht nachträgliche Manipulation erkennbar.
Hash-verknüpfte Trace-Events
event_1
challenge started
a4f8c2…e91b
event_2
submission recorded
7d3a1f…4c82
prev_hash -> Kettenlink
event_3
evaluation completed
b9e2d0…1a7f
prev_hash -> Kettenlink
Jedes Event enthält den vorherigen Hash. Eine Änderung an einem Event macht die nachfolgende Kette ungültig.
Append-only Run Trace
Jeder bewertete Lauf erzeugt eine hash-verknüpfte Ereigniskette. Neue öffentlich prüfbare Traces nutzen traceVersion 3 mit sekundengenauen Zeitstempeln und kanonischen JSON-Payloads, damit Event-Hashes auch nach Speicherung reproduzierbar bleiben.
Einreichungs-Fingerprint
Deine finale Einreichung erhält einen SHA-256-Fingerabdruck. Die Nachweiserstellung prüft, ob die gespeicherte Einreichung weiterhin zum Trace-Datensatz passt.
Integritätsurteil
Jeder Trace erhält ein Urteil: gültig, teilweise oder gebrochen. Gebrochene Traces blockieren Nachweise. Teilweise Legacy-Traces können dem Eigentümer einen privaten Nachweis erlauben; öffentliches Teilen braucht eine gültige Kette.
Nachweise werden nur ausgestellt, wenn aufgezeichneter Run Trace, tatsächliche Einreichung und Bewertungsscore perfekt zusammenpassen.
Was du wirklich bekommst
Tiefes privates Laufprotokoll. Klare öffentliche Nachweise.
Du behältst vollen Audit-Zugriff auf deinen Lauf. Recruiter und Peers sehen eine bereinigte, professionelle Nachweisseite – ohne deinen privaten Entwurfstext.
Privates Laufprotokoll
- Gesamtdauer
- 12m 34s
- Aktive Bearbeitung
- 8m 12s · 4 revisions
- Bewertung
- Full · 42s
- Einreichung
- 1,842 chars
Rubrikbelege
Trace-Integrität: gültig
Hash-Kette geprüft. Einreichungs-Fingerprint passt zum gespeicherten Attempt.
Bestätigter KI-Kompetenznachweis
Ausgestellt von AI-RENA · Belegter Lauf
Prompt-Steuerungs-Lauf
Beispielkandidat
Öffentliche Nachweis-ID: AR-a1b2c3d4
Bereinigter Prüftrace
Dieser Nachweis wurde aus einem aufgezeichneten Challenge-Lauf erstellt. Öffentliche Daten sind bereinigt und zeigen keine Entwürfe oder privaten Eingaben.
Privater Nachweislink
Teile nur mit Menschen, die du auswählst. Sichtbarkeit bleibt unter deiner Kontrolle.
HR-Ansicht
Recruiter-freundliches Nachweis-Layout über ?view=hr – ein praktisches Kompetenzsignal, keine automatisierte Hiring-Entscheidung.
LinkedIn Share
Öffentliche Nachweisseiten enthalten dynamische OG-Metadaten, damit geteilte Links Score, Kompetenzbereich und AI-RENA Branding zeigen.
Was AI-RENA unterscheidet
Für Belege gebaut – nicht für Engagement-Tricks
Sichtbare Steuerung, nicht Originalität
AI-RENA misst, ob der Lauf aktives Formen, Prüfen und Verbessern KI-gestützter Arbeit zeigt.
Echte Aufgaben, kein Multiple Choice
Du löst praktische KI-Arbeit – Prompts, Policies, Missionen – keine Trivia oder selbstberichteten Checkboxen.
Belegte Bewertung statt Blackbox-Grading
Scores stammen aus einem aufgezeichneten Lauf mit definierten Rubrikbelegen. Es gibt keine zweite, unkontrollierte Nachbewertung.
Standardmäßig privat statt öffentliche Leaderboards
Dein Nachweis bleibt privat, bis du ihn teilst. Daily Rankings nutzen echte abgeschlossene Läufe – keine Fake-Perzentil-Claims.
Definierte Rubriken statt Bauchgefühl
Jede Challenge ist expliziten Rubrikdimensionen je Kompetenzbereich zugeordnet. Du weißt vor dem Start, was bewertet wird.
Manipulationssichtbare Hash-Kette
Run-Trace-Events sind hash-verknüpft. Änderungen an der Historie brechen die Integritätsprüfung und blockieren öffentliche Nachweise.
Kein Unlimited Plan
Credits begrenzen Retakes und tiefe Evaluation. Das hält Bewertungen ehrlich und kostenkontrolliert statt unbegrenzt viele Low-Quality-Läufe zu erlauben.
Nachweisstufen
Nachweis-Assurance-Level (L0-L3)
AI-RENA trennt die Ergebnisqualität davon, wie sichtbar der Arbeitsweg war und ob der kurze Verständnischeck bestanden wurde.
L0
Aufgezeichnetes Ergebnis
Aufgezeichnetes Ergebnis — der Score stammt aus einer echten Aufgabe mit klaren Kriterien.
L1
Belegt
Belegter Lauf — der Lauf ist mit Ereigniskette und Signatur abgesichert.
L2
Prozess sichtbar
Arbeitsweg sichtbar — zusammengefasste Signale zeigen Einfügen, Bearbeitung und Zeitverlauf.
L3
Interaktion bestätigt
Verständnis bestätigt — ein kurzer, zeitbegrenzter Check prüft, ob die Person die eigene Lösung erklären kann.
Nachweisstufen beschreiben, was ein Nachweis unterstützt — keine automatisierte Einstellungsentscheidung. Copy-Paste und externe KI-Tools sind erlaubt; die Aufzeichnung erklärt sichtbare Kontrolle, nicht Originalität.
FAQ
Fragen zur Prüfung
Wie genau wird ein Lauf bewertet?+
Zuerst prüfen deterministische Gates objektive Anforderungen – Struktur, Marker, Grenzen, Fixture-Regeln. Danach bewertet ein semantischer Judge Rubrikdimensionen gegen deine Einreichung und den Challenge-Kontext. Der finale Score ist trace-basiert belegt und wird mit Rubrikbelegen pro Dimension gespeichert. Um vermeidbare Score-Schwankungen zu reduzieren, fixiert AI-RENA Sampling-Einstellungen dort, wo Anbieter-APIs es unterstützen. Das ersetzt keine Rubrikbewertung und senkt nicht die Modellqualität: deterministische Gates, Live-Judge und Provider-Fallback bleiben aktiv.
Warum kann derselbe Prompt leicht unterschiedliche Scores bekommen?+
Derselbe Prompt kann bei erneuter Ausführung leichte Score-Unterschiede erzeugen, weil Live-KI-Bewertung nicht bytegenau deterministisch ist. AI-RENA reduziert vermeidbare Varianz mit stabilen Scoring-Einstellungen, wo Anbieter-APIs es unterstützen, ohne die Rubrikbewertung durch einen schlechteren Shortcut zu ersetzen.
Was bedeutet "trace-backed" technisch?+
Jeder bewertete Lauf erzeugt eine append-only Event-Kette in run_traces und run_trace_events. Events sind hash-verknüpft, sodass spätere Änderungen die Prüfung brechen. Öffentliche Nachweisseiten zeigen eine bereinigte Projektion – nicht deinen privaten Entwurfstext.
Sind externe KI-Tools erlaubt?+
Ja. AI-RENA ist für KI-gestützte Arbeit gebaut. Externe Tools, Notizen, Vorlagen und Entwürfe sind erlaubt; Nachweisstärke entsteht aus dem finalen Ergebnis plus sichtbarer Steuerung im Lauf – wie du Ausgabe geformt, geprüft und verbessert hast.
Was ist der Unterschied zwischen Light und Full Evaluation?+
Light Evaluation (kostenloser täglicher Lauf) gibt Score und kompaktes Feedback – größte Lücken und einen fokussierten Verbesserungsblick. Full Evaluation schaltet tiefere Rubrikaufschlüsselung, mehr Verbesserungshinweise und reichere Audit-Details für bezahlte Läufe frei.
Kann jemand einen Nachweis fälschen oder erneut ausspielen?+
Nein. Nachweiserstellung erfordert einen geschlossenen Run Trace, passenden Einreichungs-Hash, passenden Attempt-Score und genügend Credits. Nachweise sind pro Attempt idempotent – aus demselben Lauf kann kein zweiter Nachweis mit anderem Score erstellt werden.
Was passiert, wenn der Trace kaputt ist?+
Gebrochene Integrität blockiert Nachweise vollständig. Teilweise Legacy-Traces können dem Eigentümer noch einen privaten Nachweis erlauben, aber kein öffentliches Teilen. Neue Läufe nutzen strikte traceVersion-3-Prüfung für öffentlich vertrauenswürdige Nachweise.
Ist mein Einreichungstext öffentlich?+
Nein. Öffentliche Nachweisseiten zeigen Aufgabenkontext, Score-Band, Rubrikzusammenfassung und einen bereinigten Prüftrace. Voller Einreichungstext und SHA-256-Fingerprints sind nur in deinem privaten Laufprotokoll sichtbar.
Warum gibt es keinen Unlimited Plan?+
Ernsthafte KI-Bewertung hat echte Verarbeitungskosten. Credits halten Retakes und tiefe Evaluation fair, verhindern Missbrauch und richten die Plattformökonomie an Qualitätsnachweisen aus – nicht an unbegrenzten Low-Signal-Läufen.
Wie unterscheidet sich das von Quiz-Plattformen oder LinkedIn Skill Badges?+
AI-RENA prüft praktische KI-Arbeit mit definierten Rubriken, zeichnet einen manipulationssichtbaren Run Trace auf und stellt Nachweise nur aus, wenn Trace, Einreichung und Score zusammenpassen. Es ist ein Leistungsbeleg – kein selbst erklärtes Badge oder Multiple-Choice-Zertifikat.
Bereit, die Methode live zu sehen? Starte mit der heutigen Challenge oder vergleiche bezahlte Proof-Pfade.