Beim letzten Scan wurden keine Risiken erkannt.
Trust Score
Updated vor 2 Wochen
Analysiert
31.03.2026, 15:56
+ 2 previous scans
Kompatibel mit
Skill details
Updated vor 2 Wochen
Analysiert 31.03.2026, 15:56
Beschreibung
This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.
Letzte Scans
31.03.2026, 15:56
Latest analysis
31.03.2026, 15:11
Run 2
27.03.2026, 15:45
Run 1