Network & Security

Prometheus + Grafana 2026: คู่มือ Open-Source Monitoring Stack สำหรับ SME ไทย

คู่มือ Open-Source Monitoring Stack ด้วย Prometheus + Node Exporter + Grafana สำหรับ SME ไทย ครอบคลุมการ deploy, การออกแบบ Alert, และเปรียบเทียบ TCO กับ SaaS

AF
ADS FIT Team
·8 นาที
Share:
🌐

# Prometheus + Grafana 2026: คู่มือ Open-Source Monitoring Stack สำหรับ SME ไทย

ในยุคที่ระบบ IT ของธุรกิจขยายตัวอย่างรวดเร็ว ทั้ง server, container, microservice และ cloud workload การมองไม่เห็นว่าระบบของเราอยู่ในสถานะใดถือเป็นความเสี่ยงสำคัญที่สุดของ SME ไทย เพราะเมื่อระบบล่ม รายได้หาย ลูกค้าโกรธ และทีมก็ยังไม่รู้ด้วยซ้ำว่าปัญหาเริ่มต้นที่ไหน ปัญหาคลาสสิกของ SME ส่วนใหญ่คือ "รู้ตัวก็ตอนระบบล่มไปแล้ว"

Monitoring Stack ที่ดีจึงเปรียบเสมือนระบบเตือนภัยล่วงหน้าที่บอกได้ตั้งแต่ CPU เริ่มร้อน, Disk เริ่มเต็ม, หรือ HTTP latency เพิ่มขึ้นผิดปกติ เพื่อให้ทีมมีเวลาแก้ไขก่อนที่ user จะรู้สึกถึงปัญหา และในโลก Open-Source ปัจจุบัน "Prometheus + Grafana" คือคู่หูที่กลายเป็น de facto standard ของ Cloud Native Monitoring

บทความนี้จะพา PM, DevOps และเจ้าของธุรกิจ SME ไทยไปทำความรู้จัก Prometheus + Node Exporter + Grafana ตั้งแต่หลักการ, วิธี deploy บน VPS เดียว, การออกแบบ Alert ที่ลด false positive, ไปจนถึงการประเมิน TCO เทียบกับ SaaS อย่าง Datadog หรือ New Relic เพื่อให้คุณตัดสินใจได้ว่าควรใช้ Stack นี้กับธุรกิจของคุณหรือไม่

Prometheus คืออะไร และทำไมถึงเป็นมาตรฐาน

Prometheus เป็น Time-Series Database (TSDB) แบบ Pull-based monitoring ที่พัฒนาโดย SoundCloud และเข้าสู่ CNCF เป็นโปรเจ็กต์ลำดับที่ 2 ต่อจาก Kubernetes มันต่างจาก monitoring ยุคเก่าตรงที่ Prometheus จะ "ดึง (scrape)" metric จาก target (เช่น Node Exporter, app endpoint /metrics) เป็นรอบ ๆ แทนที่จะรอ agent ส่งเข้ามา ทำให้ควบคุมโหลดได้ดีและ debug ง่ายกว่า

จุดแข็งหลักคือ:

  • **PromQL**: Query Language ที่ทรงพลังสำหรับการคำนวณ rate, aggregation, และ percentile
  • **Service Discovery**: รองรับ Kubernetes, Consul, EC2, GCE ทำให้ scale ได้อัตโนมัติ
  • **Multi-dimensional data model**: ใช้ label แทน hierarchy ทำให้ slice & dice ง่าย
  • **Active community**: dashboard และ exporter ฟรีนับพันชิ้นบน grafana.com
  • | ฟีเจอร์ | Prometheus | Zabbix แบบเก่า | InfluxDB v2 |

    |---------|-----------|----------------|-------------|

    | Model | Pull | Push (active agent) | Push |

    | Query | PromQL | Trigger expression | Flux/InfluxQL |

    | Service Discovery | ในตัว | ต้อง config มือ | จำกัด |

    | Cloud Native | ดีเยี่ยม | กลาง | ดี |

    | License | Apache 2.0 | GPL v2 | MIT |

    Node Exporter และ Exporter ecosystem

    Node Exporter คือ agent ขนาดเล็กที่รันอยู่บนเครื่อง Linux/Windows เพื่อแปลง metric ของ OS (CPU, memory, disk, network, file descriptor) ให้ออกมาเป็น HTTP endpoint `/metrics` ที่ Prometheus ดึงไปได้ จุดดีคือเบามาก ใช้ RAM ประมาณ 10-20MB ต่อเครื่อง เหมาะมากกับ SME ที่มีงบเซิร์ฟเวอร์จำกัด

    Exporter ที่ SME ไทยมักใช้คู่กัน ได้แก่:

  • **Blackbox Exporter** สำหรับ HTTPS uptime, SSL certificate expiry, และ TCP probe
  • **MySQL/PostgreSQL Exporter** สำหรับ slow query, connection pool, replication lag
  • **Nginx/Apache Exporter** สำหรับ request rate, error rate, latency
  • **cAdvisor** สำหรับ container metric ใน Docker/Kubernetes
  • **WMI Exporter** (windows_exporter) สำหรับเครื่อง Windows Server
  • ขั้นตอน Deploy Prometheus + Grafana ใน 30 นาที

    แผนนี้เหมาะกับ VPS 2 vCPU / 4GB RAM ขึ้นไป รองรับการ monitor 10-50 servers ได้สบาย

    Step 1: เตรียม Docker Compose

    สร้างไฟล์ `docker-compose.yml` ที่กำหนด service สาม ตัว ได้แก่ prometheus (พอร์ต 9090), grafana (พอร์ต 3000) และ node-exporter (พอร์ต 9100) โดย mount volume สำหรับ persistent storage และ config file

    Step 2: เขียน prometheus.yml

    ระบุ `scrape_interval: 15s`, `evaluation_interval: 15s` แล้วเพิ่ม job สำหรับ node_exporter, blackbox, และ application metric ตามที่ต้องการ ใช้ `relabel_configs` เพื่อตั้ง label `env=production`, `team=ops` ให้ filter ใน Grafana ง่าย

    Step 3: ตั้งค่า Grafana Data Source

    หลัง compose up เปิด Grafana ที่ http://your-server:3000 (admin/admin) → Configuration → Data Sources → Add Prometheus → URL = http://prometheus:9090 → Save & Test

    Step 4: Import Dashboard สำเร็จรูป

    ใช้ ID จาก grafana.com:

  • **1860** Node Exporter Full
  • **7587** Blackbox Exporter
  • **7362** MySQL Overview
  • **9628** PostgreSQL Database
  • **193** Docker Monitoring
  • Step 5: ตั้งค่า Alertmanager

    เชื่อม alert ไปยัง LINE Notify, Slack, Discord, หรือ Email โดยกำหนด `route` แยกตาม severity (critical / warning) เพื่อไม่ให้ทีม alert fatigue

    ออกแบบ Alert ที่ลด False Positive

    หัวใจของ Monitoring ที่ดีคือ "alert เฉพาะตอนที่ต้อง action จริง" ไม่ใช่แจ้งเตือนทุกการกะพริบ ใช้หลัก SRE 4 Golden Signals:

  • **Latency**: เวลาตอบสนอง request เช่น `histogram_quantile(0.95, rate(http_request_duration_seconds_bucket[5m])) > 1`
  • **Traffic**: จำนวน request เช่น `sum(rate(http_requests_total[5m])) by (service)`
  • **Errors**: อัตรา error เช่น `rate(http_requests_total{status=~"5.."}[5m]) / rate(http_requests_total[5m]) > 0.05`
  • **Saturation**: การใช้ทรัพยากร เช่น `node_memory_available_bytes / node_memory_total_bytes < 0.1`
  • ใช้ `for: 5m` ในทุก alert rule เพื่อรอให้ค่าเกิน threshold ต่อเนื่อง 5 นาทีก่อนแจ้งเตือน จะลด noise ได้มากกว่า 70%

    เปรียบเทียบ TCO: Self-host vs SaaS

    | รายการ | Prometheus + Grafana (Self-host) | Datadog (SaaS) | New Relic (SaaS) |

    |--------|----------------------------------|----------------|------------------|

    | ค่า License | ฟรี (Apache 2.0) | ~$15-23/host/เดือน | ~$25/user/เดือน |

    | ค่า Infra (10 hosts) | ~600 บาท/เดือน (VPS 4GB) | ~5,500 บาท/เดือน | ~8,000 บาท/เดือน |

    | Setup time | 1-2 วัน | 1-2 ชม | 2-3 ชม |

    | Data retention | ไม่จำกัด (ที่คุณมี disk) | 15 เดือน (เพิ่มเงิน) | 13 เดือน |

    | Lock-in risk | ต่ำ | สูง | สูง |

    | ทักษะที่ต้องมี | DevOps พื้นฐาน | น้อย | น้อย |

    สำหรับ SME ไทยที่มี 5-30 servers การ self-host ประหยัดได้ปีละ 60,000-200,000 บาท ขึ้นอยู่กับ scale และยังเป็นเจ้าของข้อมูลทั้งหมด

    สรุปและขั้นตอนต่อไป

    Prometheus + Node Exporter + Grafana คือ Monitoring Stack ที่คุ้มค่าที่สุดสำหรับ SME ไทยในปี 2026 ทั้งในแง่ของต้นทุน, ความยืดหยุ่น, และ ecosystem ที่กว้างขวาง โดยเฉพาะหากธุรกิจของคุณกำลัง scale และไม่อยากผูกตัวเองกับ vendor รายใดรายหนึ่ง

    ขั้นตอนต่อไปที่แนะนำ:

    1. เริ่มต้นด้วย VPS 1 เครื่อง deploy stack ครบใน 1 ชั่วโมง

    2. ติดตั้ง Node Exporter บนทุก server ที่มี

    3. Import dashboard 1860 และ tune threshold ให้เหมาะกับธุรกิจคุณ

    4. ตั้ง alert 4 Golden Signals + Disk Space + SSL Expiry

    5. ขยายไปสู่ Loki (logs) และ Tempo (traces) เพื่อ Observability ครบ 3 pillars

    หากธุรกิจของคุณต้องการที่ปรึกษาออกแบบ Monitoring Stack ที่ตรงกับ workload และทีมของคุณ ทีม ADS FIT มีประสบการณ์ deploy ทั้ง self-host และ hybrid cloud ติดต่อเราเพื่อรับ assessment ฟรีได้ที่ adsfit.co.th

    Tags

    #Prometheus#Grafana#Monitoring#Observability#Node Exporter#DevOps

    สนใจโซลูชันนี้?

    ปรึกษาทีม ADS FIT ฟรี เราพร้อมออกแบบระบบที่ฟิตกับธุรกิจของคุณ

    ติดต่อเรา →

    บทความที่เกี่ยวข้อง