Blog Series 2026: 6 บทความเกี่ยวกับ AI Infrastructure ที่ผมเขียน
สารบัญ
- TL;DR
- Blog Series Overview
- แต่ละ Blog สรุปสั้นๆ
- ① DGX Spark First Impression
- ② DGX Spark Optimization Journey
- ③ LiteLLM Timeout Mystery
- ④ MCP Server & Client Design
- ⑤ Agentic AI Developer Journey
- ⑥ Multi-Agent Workflow Diary
- Reading Order - คำแนะนำเพิ่มเติม
- Cross-References ระหว่าง Blog
- เชื่อมโยงกับ Honcho Memory
- ทำไมเขียน Blog Series?
- อะไรที่ยังไม่ได้เขียน blog (ยังเหลืออีกเยอะ)
- Summary
ช่วงนี้ผมเขียนบล็อกไป 6 บทความ — แต่ละบทความเป็นเรื่องราว (journey) แยกกัน แต่ทั้งหมดเชื่อมโยงกันในธีมเดียวกัน: การสร้าง AI infrastructure เอง เริ่มจาก optimize model serving → debug API → ออกแบบโปรโตคอลสำหรับ agent → จนถึง workflow การทำงานร่วมกับ AI agents
ถ้าเพิ่งเข้ามาอ่าน อาจงงว่า "เริ่มบทความไหนดี" — เลยเขียน overview นี้ขึ้นมาเป็น landing page พร้อม reading order
TL;DR
6 บทความใน series นี้เล่า journey การสร้าง AI infrastructure เองตั้งแต่ต้น — จากการรีวิว DGX Spark, tune vLLM recipe, debug LiteLLM timeout, ออกแบบ MCP server/client, วิเคราะห์ skillset ของ AI-era developer จนถึง multi-agent workflow จริง แต่ละบทความอ่านแยกกันได้ แต่ถ้าอ่านตามลำดับจะเข้าใจภาพรวมมากขึ้น
Blog Series Overview
นี่คือ 6 บทความที่ผมเขียนไว้ จัดเรียงตามลำดับที่แนะนำให้อ่าน:
แต่ละ Blog สรุปสั้นๆ
① DGX Spark First Impression
Hook: "spec แรง ≠ ใช้งานได้ทันที"
Content: unboxing MSI EdgeXpert, ลอง DE Mode + Ollama + Open WebUI, ถอด DE ใช้ CLI, เจอ community (spark-arena, sparkrun), Reddit joke "buy 2 units", โปรไฟล์ผู้ซื้อ (ใครควรซื้อ/ไม่ควร)
สำหรับ: คนที่กำลังตัดสินใจซื้อ DGX Spark หรือ hardware แบบนี้
② DGX Spark Optimization Journey
Hook: "vLLM recipe ไหน work, ไหนไม่ work"
Content: 3-layer LLM serving stack, MoE vs dense vs quant formats (FP4/FP8/BF16/NVFP4), MTP vs DFlash, YAML pitfalls (single/double brace), sweet spot 32K ที่ปรากฏขึ้นจากการทดสอบแบบขนาน, 4 benchmark groups + test results, recipe files ที่อยู่ใน DGX
สำหรับ: คนที่ใช้ vLLM + DGX Spark หรือ Blackwell-based hardware
③ LiteLLM Timeout Mystery
Hook: "API timeout กลางดึก → retry ได้ทันที → cache เป็นพระเอก"
Content: Redis cache behavior, DGX direct vs LiteLLM, max_tokens paradox (4000 faster than 2000), context limit 32K, error scenarios
สำหรับ: คนที่ใช้ LiteLLM เป็น gateway แล้วเจอ timeout แบบสุ่ม
④ MCP Server & Client Design
Hook: "MCP = USB-C ของ AI tools"
Content: Transport types (stdio, HTTP+SSE, Streamable HTTP), Tools/Resources/Prompts primitives, pseudo code สำหรับ server + client, token bloat (40-50% ของ context), OAuth 2.1 security, self-hosted models + agents
สำหรับ: developer ที่สร้าง MCP server หรือ integrate กับ agents
⑤ Agentic AI Developer Journey
Hook: "Developer ในยุค AI ไม่ใช่แค่เขียนโค้ด"
Content: 5 new skills (context awareness, model serving, MCP, middleware/routing, security), เหตุผลที่องค์กรลงทุน own infra, 4 challenges, learning roadmap
สำหรับ: developer ที่อยากเชี่ยวชาญเฉพาะทางใน AI infrastructure
⑥ Multi-Agent Workflow Diary
Hook: "เมื่อผมมี AI 2 ตัวช่วยเขียนโค้ด"
Content: นานาโกะ vs Kimi, ticket-driven workflow, 5 lessons learned, real example V3→V4, cost reality ($50/mo), ข้อดี-ข้อเสียแบบตรงไปตรงมา
สำหรับ: developer ที่ใช้ AI agents ทำงานจริง
Reading Order - คำแนะนำเพิ่มเติม
Cross-References ระหว่าง Blog
เชื่อมโยงกับ Honcho Memory
Blog ใหม่: Honcho Memory Layer: ทำไม AI Agent ต้องมีความจำข้าม Session - Honcho คือ memory layer ที่ผมใช้กับ AI agent (นานาโกะ) - reasoning-first (deriver), MCP-native, integrate กับ Hermes Agent
ทำไมเขียน Blog Series?
ผมตัดสินใจเขียน blog series แทนที่จะเขียนบทความเดียวยาวๆ เพราะ:
อะไรที่ยังไม่ได้เขียน blog (ยังเหลืออีกเยอะ)
- Honcho memory system - ใช้อยู่ แต่ยังไม่ได้เขียน
- T14 personal workstation setup - เครื่อง dev หลักของผม แต่ยังไม่ได้เขียน blog
- Cost optimization journey - M2.7 → M2.7-highspeed → M2.7 เรื่องยาว
- Trading bot V4 journey - มี data เยอะ แต่ tone โม้ไปหน่อย เลยไม่เขียน
Note: ไม่ได้เขียน blog ทุกอย่าง - เลือกเขียนเฉพาะที่มี lessons ที่ reusable ถ้าเขียน trading bot แล้วอ่านแล้ว feel like "โม้" ก็ไม่ควรเขียน - blog ที่ดีคือ blog ที่คนอ่านได้ takeaway กลับไปใช้
Summary
ถ้าเพิ่งเข้ามาอ่าน → เริ่มจาก ① First Impression แล้วเลือกตามความสนใจ
ถ้าอยากอ่านทั้งหมดตามลำดับ → 1 → 2 → 3 → 4 → 5 → 6 (~7 ชั่วโมงถ้าอ่านจริงจัง)
ถ้ามีคำถามเกี่ยวกับเรื่องไหน ถามได้เลยครับ!
เนื้อหานี้มีประโยชน์ไหม? ช่วยสนับสนุนค่ากาแฟให้ผู้เขียนสักแก้ว
Buy Me a Coffee