Blog Series 2026: 6 บทความเกี่ยวกับ AI Infrastructure ที่ผมเขียน

June 15, 2026 · 6 min read

Author

สารบัญ

TL;DR
Blog Series Overview
แต่ละ Blog สรุปสั้นๆ
① DGX Spark First Impression
② DGX Spark Optimization Journey
③ LiteLLM Timeout Mystery
④ MCP Server & Client Design
⑤ Agentic AI Developer Journey
⑥ Multi-Agent Workflow Diary
Reading Order - คำแนะนำเพิ่มเติม
Cross-References ระหว่าง Blog
เชื่อมโยงกับ Honcho Memory
ทำไมเขียน Blog Series?
อะไรที่ยังไม่ได้เขียน blog (ยังเหลืออีกเยอะ)
Summary

ช่วงนี้ผมเขียนบล็อกไป 6 บทความ — แต่ละบทความเป็นเรื่องราว (journey) แยกกัน แต่ทั้งหมดเชื่อมโยงกันในธีมเดียวกัน: การสร้าง AI infrastructure เอง เริ่มจาก optimize model serving → debug API → ออกแบบโปรโตคอลสำหรับ agent → จนถึง workflow การทำงานร่วมกับ AI agents

ถ้าเพิ่งเข้ามาอ่าน อาจงงว่า "เริ่มบทความไหนดี" — เลยเขียน overview นี้ขึ้นมาเป็น landing page พร้อม reading order

TL;DR

6 บทความใน series นี้เล่า journey การสร้าง AI infrastructure เองตั้งแต่ต้น — จากการรีวิว DGX Spark, tune vLLM recipe, debug LiteLLM timeout, ออกแบบ MCP server/client, วิเคราะห์ skillset ของ AI-era developer จนถึง multi-agent workflow จริง แต่ละบทความอ่านแยกกันได้ แต่ถ้าอ่านตามลำดับจะเข้าใจภาพรวมมากขึ้น

Blog Series Overview

นี่คือ 6 บทความที่ผมเขียนไว้ จัดเรียงตามลำดับที่แนะนำให้อ่าน:

แต่ละ Blog สรุปสั้นๆ

① DGX Spark First Impression

Hook: "spec แรง ≠ ใช้งานได้ทันที"

Content: unboxing MSI EdgeXpert, ลอง DE Mode + Ollama + Open WebUI, ถอด DE ใช้ CLI, เจอ community (spark-arena, sparkrun), Reddit joke "buy 2 units", โปรไฟล์ผู้ซื้อ (ใครควรซื้อ/ไม่ควร)

สำหรับ: คนที่กำลังตัดสินใจซื้อ DGX Spark หรือ hardware แบบนี้

② DGX Spark Optimization Journey

Hook: "vLLM recipe ไหน work, ไหนไม่ work"

Content: 3-layer LLM serving stack, MoE vs dense vs quant formats (FP4/FP8/BF16/NVFP4), MTP vs DFlash, YAML pitfalls (single/double brace), sweet spot 32K ที่ปรากฏขึ้นจากการทดสอบแบบขนาน, 4 benchmark groups + test results, recipe files ที่อยู่ใน DGX

สำหรับ: คนที่ใช้ vLLM + DGX Spark หรือ Blackwell-based hardware

③ LiteLLM Timeout Mystery

Hook: "API timeout กลางดึก → retry ได้ทันที → cache เป็นพระเอก"

Content: Redis cache behavior, DGX direct vs LiteLLM, max_tokens paradox (4000 faster than 2000), context limit 32K, error scenarios

สำหรับ: คนที่ใช้ LiteLLM เป็น gateway แล้วเจอ timeout แบบสุ่ม

④ MCP Server & Client Design

Hook: "MCP = USB-C ของ AI tools"

Content: Transport types (stdio, HTTP+SSE, Streamable HTTP), Tools/Resources/Prompts primitives, pseudo code สำหรับ server + client, token bloat (40-50% ของ context), OAuth 2.1 security, self-hosted models + agents

สำหรับ: developer ที่สร้าง MCP server หรือ integrate กับ agents

⑤ Agentic AI Developer Journey

Hook: "Developer ในยุค AI ไม่ใช่แค่เขียนโค้ด"

Content: 5 new skills (context awareness, model serving, MCP, middleware/routing, security), เหตุผลที่องค์กรลงทุน own infra, 4 challenges, learning roadmap

สำหรับ: developer ที่อยากเชี่ยวชาญเฉพาะทางใน AI infrastructure

⑥ Multi-Agent Workflow Diary

Hook: "เมื่อผมมี AI 2 ตัวช่วยเขียนโค้ด"

Content: นานาโกะ vs Kimi, ticket-driven workflow, 5 lessons learned, real example V3→V4, cost reality ($50/mo), ข้อดี-ข้อเสียแบบตรงไปตรงมา

สำหรับ: developer ที่ใช้ AI agents ทำงานจริง

Reading Order - คำแนะนำเพิ่มเติม

Cross-References ระหว่าง Blog

เชื่อมโยงกับ Honcho Memory

Blog ใหม่: Honcho Memory Layer: ทำไม AI Agent ต้องมีความจำข้าม Session - Honcho คือ memory layer ที่ผมใช้กับ AI agent (นานาโกะ) - reasoning-first (deriver), MCP-native, integrate กับ Hermes Agent

ทำไมเขียน Blog Series?

ผมตัดสินใจเขียน blog series แทนที่จะเขียนบทความเดียวยาวๆ เพราะ:

อะไรที่ยังไม่ได้เขียน blog (ยังเหลืออีกเยอะ)

Honcho memory system - ใช้อยู่ แต่ยังไม่ได้เขียน
T14 personal workstation setup - เครื่อง dev หลักของผม แต่ยังไม่ได้เขียน blog
Cost optimization journey - M2.7 → M2.7-highspeed → M2.7 เรื่องยาว
Trading bot V4 journey - มี data เยอะ แต่ tone โม้ไปหน่อย เลยไม่เขียน

Note: ไม่ได้เขียน blog ทุกอย่าง - เลือกเขียนเฉพาะที่มี lessons ที่ reusable ถ้าเขียน trading bot แล้วอ่านแล้ว feel like "โม้" ก็ไม่ควรเขียน - blog ที่ดีคือ blog ที่คนอ่านได้ takeaway กลับไปใช้

Summary

ถ้าเพิ่งเข้ามาอ่าน → เริ่มจาก ① First Impression แล้วเลือกตามความสนใจ

ถ้าอยากอ่านทั้งหมดตามลำดับ → 1 → 2 → 3 → 4 → 5 → 6 (~7 ชั่วโมงถ้าอ่านจริงจัง)

ถ้ามีคำถามเกี่ยวกับเรื่องไหน ถามได้เลยครับ!

blog series overview ai-infrastructure llm mcp dgx-spark

แชร์บทความ

Facebook X

☕

เนื้อหานี้มีประโยชน์ไหม? ช่วยสนับสนุนค่ากาแฟให้ผู้เขียนสักแก้ว

Buy Me a Coffee

สารบัญ

TL;DR​

Blog Series Overview​

แต่ละ Blog สรุปสั้นๆ​

① DGX Spark First Impression​

② DGX Spark Optimization Journey​

③ LiteLLM Timeout Mystery​

④ MCP Server & Client Design​

⑤ Agentic AI Developer Journey​

⑥ Multi-Agent Workflow Diary​

Reading Order - คำแนะนำเพิ่มเติม​

Cross-References ระหว่าง Blog​

เชื่อมโยงกับ Honcho Memory​

ทำไมเขียน Blog Series?​

อะไรที่ยังไม่ได้เขียน blog (ยังเหลืออีกเยอะ)​

Summary​