Aucun risque n'a ete detecte lors du dernier scan.
Trust Score
Mis a jour il y a 2 semaines
Analyse le
31 mars 2026, 15:56
+ 2 previous scans
Compatible avec
Skill details
Mis a jour il y a 2 semaines
Analyse le 31 mars 2026, 15:56
Description
This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.
Scans recents
31 mars 2026, 15:56
Latest analysis
31 mars 2026, 15:11
Run 2
27 mars 2026, 15:45
Run 1