advanced-evaluation

Signal faible, permissions contenues et surface d'attaque limitee.

Top Tier

100/100

Recommandations

✅ No risks detected. This skill appears safe to use.

Risques Détectés0

Aucun risque n'a ete detecte lors du dernier scan.

Voir les risques detectes

Connectez-vous pour consulter l'analyse detaillee des risques.

$npx agentfend install cmn92pdi500cbu1ip2uw3y5jv

Trust Score

Top Tier

100trust

⭐ 27,8 k🍴 4,7 k

Mis a jour il y a 2 semaines

Analyse le

31 mars 2026, 15:56

+ 2 previous scans

Compatible avec

OpenAIAGAntigravity

Skill details

Trust score

100/100

GitHub

Connected

Stars

27,8 k

Forks

4,7 k

Mis a jour il y a 2 semaines

Analyse le 31 mars 2026, 15:56

Description

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

Voir la source

Scans recents

31 mars 2026, 15:56

Latest analysis

31 mars 2026, 15:11

Run 2

27 mars 2026, 15:45

Run 1