advanced-evaluation

Low signal level, contained permissions, and limited attack surface.

Top Tier

100/100

Empfehlungen

✅ No risks detected. This skill appears safe to use.

Erkannte Risiken0

Beim letzten Scan wurden keine Risiken erkannt.

Voir les risques detectes

Connectez-vous pour consulter l'analyse detaillee des risques.

$npx agentfend install cmn92pdi500cbu1ip2uw3y5jv

Trust Score

Top Tier

100trust

⭐ 27.821🍴 4667

Updated vor 2 Wochen

Analysiert

31.03.2026, 15:56

+ 2 previous scans

Kompatibel mit

OpenAIAGAntigravity

Skill details

Trust score

100/100

GitHub

Connected

Stars

27.821

Forks

4667

Updated vor 2 Wochen

Analysiert 31.03.2026, 15:56

Beschreibung

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

Quelle ansehen

Letzte Scans

31.03.2026, 15:56

Latest analysis

31.03.2026, 15:11

Run 2

27.03.2026, 15:45

Run 1