APM

>Agent Skill

@gw-ai-security/evaluation-plan

skilldevelopment

Pflege Evaluationsmetriken und Schwellenwerte; verwenden bei Aenderungen an Metriken, Messmethoden oder Akzeptanzkriterien fuer Evaluation.

apm::install
$apm install @gw-ai-security/evaluation-plan
apm::skill.md
---
name: evaluation-plan
description: Pflege Evaluationsmetriken und Schwellenwerte; verwenden bei Aenderungen an Metriken, Messmethoden oder Akzeptanzkriterien fuer Evaluation.
---

# Skill: evaluation-plan

## Zweck
Halte die Evaluation nachvollziehbar und messbar fuer die Case Study.

## Wann anwenden
- Wenn neue Metriken oder Schwellenwerte definiert werden.
- Wenn Messmethoden angepasst werden muessen.

## Vorgehen (Schritt-fuer-Schritt)
1) Lies `docs/04_evaluation/EVALUATION_PLAN.md`.
2) Aktualisiere Metriken, Messmethoden und Akzeptanzschwellen.
3) Verknuepfe Metriken mit relevanten NFRs, falls vorhanden.

## Lernperspektive
- Warum so? Evaluation macht Fortschritt und Qualitaet messbar.
- Alternativen: ad-hoc Demo-Feedback ohne klare Kriterien.
- Warum nicht hier? Ohne Kriterien ist Lernfortschritt schwer belegbar.

## Repo-Referenzen
- `docs/04_evaluation/EVALUATION_PLAN.md`
- `docs/01_requirements/NFR.en.md`

## Qualitaetscheck
- Metriken sind messbar definiert.
- Schwellenwerte sind konsistent mit NFRs.
- Keine untestbaren Aussagen.
## Phasenbezug
| Phase | Aufgabe | Status |
|-------|---------|--------|
| Phase 4 | Evaluationsplan definieren | erledigt |