Prometheus + Grafana Monitoring Stack คู่มือ SME ไทย 2026

# Prometheus + Grafana 2026: คู่มือ Open-Source Monitoring Stack สำหรับ SME ไทย

ในยุคที่ระบบ IT ของธุรกิจขยายตัวอย่างรวดเร็ว ทั้ง server, container, microservice และ cloud workload การมองไม่เห็นว่าระบบของเราอยู่ในสถานะใดถือเป็นความเสี่ยงสำคัญที่สุดของ SME ไทย เพราะเมื่อระบบล่ม รายได้หาย ลูกค้าโกรธ และทีมก็ยังไม่รู้ด้วยซ้ำว่าปัญหาเริ่มต้นที่ไหน ปัญหาคลาสสิกของ SME ส่วนใหญ่คือ "รู้ตัวก็ตอนระบบล่มไปแล้ว"

Monitoring Stack ที่ดีจึงเปรียบเสมือนระบบเตือนภัยล่วงหน้าที่บอกได้ตั้งแต่ CPU เริ่มร้อน, Disk เริ่มเต็ม, หรือ HTTP latency เพิ่มขึ้นผิดปกติ เพื่อให้ทีมมีเวลาแก้ไขก่อนที่ user จะรู้สึกถึงปัญหา และในโลก Open-Source ปัจจุบัน "Prometheus + Grafana" คือคู่หูที่กลายเป็น de facto standard ของ Cloud Native Monitoring

บทความนี้จะพา PM, DevOps และเจ้าของธุรกิจ SME ไทยไปทำความรู้จัก Prometheus + Node Exporter + Grafana ตั้งแต่หลักการ, วิธี deploy บน VPS เดียว, การออกแบบ Alert ที่ลด false positive, ไปจนถึงการประเมิน TCO เทียบกับ SaaS อย่าง Datadog หรือ New Relic เพื่อให้คุณตัดสินใจได้ว่าควรใช้ Stack นี้กับธุรกิจของคุณหรือไม่

Prometheus คืออะไร และทำไมถึงเป็นมาตรฐาน

Prometheus เป็น Time-Series Database (TSDB) แบบ Pull-based monitoring ที่พัฒนาโดย SoundCloud และเข้าสู่ CNCF เป็นโปรเจ็กต์ลำดับที่ 2 ต่อจาก Kubernetes มันต่างจาก monitoring ยุคเก่าตรงที่ Prometheus จะ "ดึง (scrape)" metric จาก target (เช่น Node Exporter, app endpoint /metrics) เป็นรอบ ๆ แทนที่จะรอ agent ส่งเข้ามา ทำให้ควบคุมโหลดได้ดีและ debug ง่ายกว่า

จุดแข็งหลักคือ:

**PromQL**: Query Language ที่ทรงพลังสำหรับการคำนวณ rate, aggregation, และ percentile

**Service Discovery**: รองรับ Kubernetes, Consul, EC2, GCE ทำให้ scale ได้อัตโนมัติ

**Multi-dimensional data model**: ใช้ label แทน hierarchy ทำให้ slice & dice ง่าย

**Active community**: dashboard และ exporter ฟรีนับพันชิ้นบน grafana.com

|---------|-----------|----------------|-------------|

Node Exporter และ Exporter ecosystem

Node Exporter คือ agent ขนาดเล็กที่รันอยู่บนเครื่อง Linux/Windows เพื่อแปลง metric ของ OS (CPU, memory, disk, network, file descriptor) ให้ออกมาเป็น HTTP endpoint `/metrics` ที่ Prometheus ดึงไปได้ จุดดีคือเบามาก ใช้ RAM ประมาณ 10-20MB ต่อเครื่อง เหมาะมากกับ SME ที่มีงบเซิร์ฟเวอร์จำกัด

Exporter ที่ SME ไทยมักใช้คู่กัน ได้แก่:

**Blackbox Exporter** สำหรับ HTTPS uptime, SSL certificate expiry, และ TCP probe

**MySQL/PostgreSQL Exporter** สำหรับ slow query, connection pool, replication lag

**Nginx/Apache Exporter** สำหรับ request rate, error rate, latency

**cAdvisor** สำหรับ container metric ใน Docker/Kubernetes

**WMI Exporter** (windows_exporter) สำหรับเครื่อง Windows Server

ขั้นตอน Deploy Prometheus + Grafana ใน 30 นาที

แผนนี้เหมาะกับ VPS 2 vCPU / 4GB RAM ขึ้นไป รองรับการ monitor 10-50 servers ได้สบาย

Step 1: เตรียม Docker Compose

สร้างไฟล์ `docker-compose.yml` ที่กำหนด service สาม ตัว ได้แก่ prometheus (พอร์ต 9090), grafana (พอร์ต 3000) และ node-exporter (พอร์ต 9100) โดย mount volume สำหรับ persistent storage และ config file

Step 2: เขียน prometheus.yml

ระบุ `scrape_interval: 15s`, `evaluation_interval: 15s` แล้วเพิ่ม job สำหรับ node_exporter, blackbox, และ application metric ตามที่ต้องการ ใช้ `relabel_configs` เพื่อตั้ง label `env=production`, `team=ops` ให้ filter ใน Grafana ง่าย

Step 3: ตั้งค่า Grafana Data Source

หลัง compose up เปิด Grafana ที่ http://your-server:3000 (admin/admin) → Configuration → Data Sources → Add Prometheus → URL = http://prometheus:9090 → Save & Test

Step 4: Import Dashboard สำเร็จรูป

ใช้ ID จาก grafana.com:

**1860** Node Exporter Full

**7587** Blackbox Exporter

**7362** MySQL Overview

**9628** PostgreSQL Database

**193** Docker Monitoring

Step 5: ตั้งค่า Alertmanager

เชื่อม alert ไปยัง LINE Notify, Slack, Discord, หรือ Email โดยกำหนด `route` แยกตาม severity (critical / warning) เพื่อไม่ให้ทีม alert fatigue

ออกแบบ Alert ที่ลด False Positive

หัวใจของ Monitoring ที่ดีคือ "alert เฉพาะตอนที่ต้อง action จริง" ไม่ใช่แจ้งเตือนทุกการกะพริบ ใช้หลัก SRE 4 Golden Signals:

**Latency**: เวลาตอบสนอง request เช่น `histogram_quantile(0.95, rate(http_request_duration_seconds_bucket[5m])) > 1`

**Traffic**: จำนวน request เช่น `sum(rate(http_requests_total[5m])) by (service)`

**Errors**: อัตรา error เช่น `rate(http_requests_total{status=~"5.."}[5m]) / rate(http_requests_total[5m]) > 0.05`

**Saturation**: การใช้ทรัพยากร เช่น `node_memory_available_bytes / node_memory_total_bytes < 0.1`

ใช้ `for: 5m` ในทุก alert rule เพื่อรอให้ค่าเกิน threshold ต่อเนื่อง 5 นาทีก่อนแจ้งเตือน จะลด noise ได้มากกว่า 70%

เปรียบเทียบ TCO: Self-host vs SaaS

|--------|----------------------------------|----------------|------------------|

| Setup time | 1-2 วัน | 1-2 ชม | 2-3 ชม |

| Lock-in risk | ต่ำ | สูง | สูง |

| ทักษะที่ต้องมี | DevOps พื้นฐาน | น้อย | น้อย |

สำหรับ SME ไทยที่มี 5-30 servers การ self-host ประหยัดได้ปีละ 60,000-200,000 บาท ขึ้นอยู่กับ scale และยังเป็นเจ้าของข้อมูลทั้งหมด

สรุปและขั้นตอนต่อไป

Prometheus + Node Exporter + Grafana คือ Monitoring Stack ที่คุ้มค่าที่สุดสำหรับ SME ไทยในปี 2026 ทั้งในแง่ของต้นทุน, ความยืดหยุ่น, และ ecosystem ที่กว้างขวาง โดยเฉพาะหากธุรกิจของคุณกำลัง scale และไม่อยากผูกตัวเองกับ vendor รายใดรายหนึ่ง

ขั้นตอนต่อไปที่แนะนำ:

1. เริ่มต้นด้วย VPS 1 เครื่อง deploy stack ครบใน 1 ชั่วโมง

2. ติดตั้ง Node Exporter บนทุก server ที่มี

3. Import dashboard 1860 และ tune threshold ให้เหมาะกับธุรกิจคุณ

4. ตั้ง alert 4 Golden Signals + Disk Space + SSL Expiry

5. ขยายไปสู่ Loki (logs) และ Tempo (traces) เพื่อ Observability ครบ 3 pillars

หากธุรกิจของคุณต้องการที่ปรึกษาออกแบบ Monitoring Stack ที่ตรงกับ workload และทีมของคุณ ทีม ADS FIT มีประสบการณ์ deploy ทั้ง self-host และ hybrid cloud ติดต่อเราเพื่อรับ assessment ฟรีได้ที่ adsfit.co.th

สนใจโซลูชันนี้?

ปรึกษาทีม ADS FIT ฟรี เราพร้อมออกแบบระบบที่ฟิตกับธุรกิจของคุณ

ติดต่อเรา →

Prometheus + Grafana 2026: คู่มือ Open-Source Monitoring Stack สำหรับ SME ไทย