llm-evaluation

Signal faible, permissions contenues et surface d'attaque limitee.

Top Tier

100/100

Recommandations

✅ No risks detected. This skill appears safe to use.

Risques Détectés0

Aucun risque n'a ete detecte lors du dernier scan.

Voir les risques detectes

Connectez-vous pour consulter l'analyse detaillee des risques.

$npx agentfend install cmn930r9702pzu1ipcowj3782

Trust Score

Top Tier

100trust

⭐ 32,4 k🍴 3,5 k

Mis a jour il y a 6 jours

Analyse le

31 mars 2026, 15:58

+ 2 previous scans

Compatible avec

Claude✓

Skill details

Trust score

100/100

GitHub

Connected

Stars

32,4 k

Forks

3,5 k

Mis a jour il y a 6 jours

Analyse le 31 mars 2026, 15:58

Description

Implement comprehensive evaluation strategies for LLM applications using automated metrics, human feedback, and benchmarking. Use when testing LLM performance, measuring AI application quality, or establishing evaluation frameworks.

Voir la source

Scans recents

31 mars 2026, 15:58

Latest analysis

31 mars 2026, 15:13

Run 2

27 mars 2026, 15:54

Run 1