# Promptfoo คืออะไร? คู่มือ Open-Source LLM Testing & Eval Framework สำหรับ SME ไทย 2026
ในยุคที่ทุกธุรกิจเริ่มผูก Workflow เข้ากับ Large Language Model (LLM) ไม่ว่าจะเป็น Chatbot ตอบลูกค้า, ระบบสรุปเอกสาร, หรือ AI Agent ภายในองค์กร คำถามที่ทีม IT มักเจอคือ "Prompt ของเราดีพอหรือยัง?" และ "ถ้าเปลี่ยน Model จาก GPT-4o ไป Claude 3.5 หรือ Llama 3.3 ผลลัพธ์จะแย่ลงไหม?" การทดสอบด้วยมือ (Manual QA) ไม่สามารถ Scale ได้ เมื่อ Prompt มีหลายสิบหรือร้อยรูปแบบ และ Output เปลี่ยนทุกครั้งที่ Vendor อัปเดต Model
Promptfoo คือ Open-Source CLI + Web UI ที่ออกแบบมาเพื่อแก้ปัญหานี้โดยเฉพาะ ทำให้การทดสอบและประเมิน LLM กลายเป็นกระบวนการที่ทำซ้ำได้ (Reproducible), เปรียบเทียบได้ (Comparable) และผูกเข้ากับ CI/CD ได้เหมือนการ Unit Test ทั่วไป
ในคู่มือนี้คุณจะได้เรียนรู้ว่า Promptfoo ทำอะไรได้บ้าง วิธีติดตั้งและตั้งค่าใน 10 นาที การเขียน Test Case แบบ YAML, การใช้ Assertion เพื่อตรวจคุณภาพ Output อัตโนมัติ และเปรียบเทียบกับ Tool คู่แข่งอย่าง LangSmith และ Phoenix Arize เพื่อให้ SME ไทยเลือกใช้ได้ตรงกับงบประมาณและทีม
Promptfoo คืออะไรและแก้ปัญหาอะไรได้บ้าง
Promptfoo เป็นเครื่องมือ Open-Source ภายใต้ MIT License พัฒนาโดย Ian Webster (อดีต Engineer ที่ Google และ Karma) เน้น 4 จุดหลัก:
ปัญหาที่ SME มักเจอแล้ว Promptfoo แก้ได้:
| ปัญหา | วิธีที่ Promptfoo ช่วย |
|---|---|
| ไม่รู้ว่า Model ใหม่ดีกว่าตัวเก่าจริงไหม | รัน A/B Test บน Test Set เดียวกัน + Cost/Latency Report |
| Prompt แก้นิดเดียวแล้วลูกค้าบ่น | Snapshot Test ตรวจสอบ Regression อัตโนมัติ |
| Hallucination ที่ Production | LLM-as-Judge + RAG Evaluation Metric |
| ไม่มี Budget สำหรับ LangSmith/Galileo | Self-host ฟรี รันใน Laptop หรือ On-Premise ได้ |
คุณสมบัติเด่นที่ทำให้ Promptfoo เหมาะกับ SME ไทย
วิธีติดตั้งและตั้งค่า Promptfoo ใน 10 นาที
ขั้นตอนต่อไปนี้ออกแบบสำหรับทีม Dev ที่มี Node.js 18+ บนเครื่อง:
Step 1: ติดตั้งผ่าน npx (ไม่ต้องลงถาวร)
```bash
npx promptfoo@latest init my-llm-eval
cd my-llm-eval
```
คำสั่งนี้สร้าง Folder พร้อมไฟล์ตัวอย่าง `promptfooconfig.yaml`
Step 2: ตั้งค่า API Key ของ Provider ที่ใช้
```bash
export OPENAI_API_KEY=sk-...
export ANTHROPIC_API_KEY=sk-ant-...
```
Step 3: เขียน Test Case ใน YAML
```yaml
prompts:
providers:
tests:
text: "บริษัท ABC ประกาศผลประกอบการ Q4 ปี 2026 รายได้เพิ่ม 25% YoY..."
assert:
value: "Q4"
value: "ต้องสรุปครบ 3 บรรทัด ไม่เพิ่มข้อมูลที่ไม่อยู่ใน Source"
```
Step 4: รัน Eval
```bash
npx promptfoo@latest eval
npx promptfoo@latest view
```
Web UI จะเปิดที่ `http://localhost:15500` แสดงผลเปรียบเทียบ GPT-4o-mini กับ Claude 3.5 Haiku พร้อม Pass Rate, Cost, Latency
Step 5: ผูกเข้า CI/CD
ใน GitHub Actions เพิ่ม Job ที่รัน `promptfoo eval --output results.json` แล้วใช้ `--share` ในการ Upload ผลขึ้น Cloud View หรือเก็บเป็น Artifact ก็ได้
Promptfoo vs LangSmith vs Phoenix Arize
| ฟีเจอร์ | Promptfoo | LangSmith | Phoenix (Arize) |
|---|---|---|---|
| License | MIT (ฟรี) | Commercial / Free Tier จำกัด | Apache 2.0 (ฟรี) |
| Self-hosting | ✅ Native | จำกัดเฉพาะ Enterprise | ✅ Docker/K8s |
| YAML Config | ✅ First-class | ❌ ใช้ SDK | ⚠️ ส่วนใหญ่เป็น UI |
| Red-Teaming Plugin | ✅ 50+ Attack | ⚠️ ต้องเขียนเอง | ⚠️ Limited |
| ผูกกับ Framework | Provider-agnostic | LangChain-centric | LlamaIndex-centric |
| Cost Tracking | ✅ ในตัว | ✅ | ⚠️ ต้องตั้งค่า |
| เหมาะกับ | SME ทุกขนาด | ทีมที่ใช้ LangChain หนัก | ทีม Data Science / Observability |
ถ้าต้องการ Free + CI/CD-Native + Provider-Agnostic Promptfoo คือคำตอบที่ตรงที่สุด LangSmith เหมาะถ้าทีมยังใช้ LangChain เป็นหลักและพร้อมจ่ายรายเดือน Phoenix เหมาะถ้าต้องการ Observability Layer ระดับ Production แทน Test Framework
Best Practices สำหรับ Production
สรุป + เริ่มใช้งานวันนี้
Promptfoo เปลี่ยนการพัฒนา LLM จากศิลปะกลายเป็นวิศวกรรม ด้วย Workflow ที่ทดสอบได้, ทำซ้ำได้, และโปร่งใส ทีม SME ไทยที่กำลังลงทุนใน AI ไม่ควรพลาดเครื่องมือฟรีตัวนี้ เพราะช่วย:
ถ้าทีมของคุณต้องการคำปรึกษาเรื่องการวาง LLMOps Pipeline, การเลือก Model ที่เหมาะกับธุรกิจ, หรือ Workshop การใช้ Promptfoo สำหรับองค์กร [ติดต่อทีม ADS FIT](https://www.adsfit.co.th/#contact) ได้ทันที — เราช่วยวางระบบ AI ที่ปลอดภัย ทำซ้ำได้ และพร้อม Scale ตามธุรกิจคุณ อ่านบทความที่เกี่ยวข้อง: [AI Guardrails](/blog/ai-guardrails-llm-safety-nemo-llamaguard-guide-sme-thailand-2026) และ [OWASP LLM Top 10 2026](/blog/owasp-llm-top-10-ai-security-sme-thailand-2026) เพื่อเสริมความปลอดภัยของระบบ AI ของคุณ
