advanced-evaluation

Low signal level, contained permissions, and limited attack surface.

Top Tier

100/100

修复建议

✅ No risks detected. This skill appears safe to use.

检测到的风险0

最近一次扫描未发现风险。

Voir les risques detectes

Connectez-vous pour consulter l'analyse detaillee des risques.

$npx agentfend install cmn92pdi500cbu1ip2uw3y5jv

Trust Score

Top Tier

100trust

⭐ 2.8万🍴 4667

Updated 2周前

分析时间

2026年3月31日 15:56

+ 2 previous scans

兼容

OpenAIAGAntigravity

Skill details

Trust score

100/100

GitHub

Connected

Stars

2.8万

Forks

4667

Updated 2周前

分析时间 2026年3月31日 15:56

说明

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

查看源码