#hamelsmu

這個標籤底下共有 7 篇內容。

Build Review Interface 測試 Skill

建置 annotation interfaces 用於 reviewing LLM traces。

awesome-agent-skills hamelsmu testing

Error Analysis 測試 Skill

協助處理 Error Analysis 測試相關工作，並依原始 Skill 說明完成設定與執行。

awesome-agent-skills hamelsmu testing

EVAL Audit 測試 Skill

Audit LLM eval pipelines 與 surface problems。

awesome-agent-skills hamelsmu testing

Evaluate RAG 測試 Skill

Evaluate RAG retrieval 與 generation quality。

awesome-agent-skills hamelsmu testing

Generate Synthetic DATA 測試 Skill

建立 diverse synthetic test inputs 用於 LLM evals。

awesome-agent-skills hamelsmu testing

Validate Evaluator 測試 Skill

協助處理 Validate Evaluator 測試相關工作，並依原始 Skill 說明完成設定與執行。

awesome-agent-skills hamelsmu testing

Write Judge Prompt 測試 Skill

設計 LLM-as-Judge evaluators 用於 subjective criteria。

awesome-agent-skills hamelsmu testing