Skip to main content
Featured

เลือกฮาร์ดแวร์ AI On-Premise — มุมมองจากประสบการณ์ DGX Spark

เมื่ออยากรู้จัก AI Server เองในองค์กร ต้องพิจารณาหลายปัจจัยพร้อมกัน — ไม่ใช่แค่ดูสเปก แต่ดู workflow, งบประมาณ, จำนวนผู้ใช้, และการติดตั้ง

Kongvut SangklaKongvut Sangkla
June 20, 2026 · 19 min read

Latest Posts

Qwen3.6-35B-A3B บน DGX Spark: เรื่อง sampling ที่ผมตั้งผิดมาตลอด

เปิด Hugging Face model card ของ Qwen3.6-35B-A3B แล้วพบว่า Qwen team แนะนำ sampling ตาม mode/task ไม่ใช่ตาม use case แบบที่เข้าใจ — โดยเฉพาะ thinking mode สำหรับ general tasks ใช้ temp=1.0 สูงกว่า coding ที่ใช้ temp=0.6

Kongvut SangklaKongvut Sangkla
June 17, 2026 · 12 min read

Virtual Models บน LiteLLM Proxy: 1 โมเดล 8 profiles ใช้ให้เหมาะกับงาน

โมเดลเดียวกัน แต่ sampling ต่างกัน = พฤติกรรมต่างๆ — ผมแยก 8 profiles ผ่าน LiteLLM alias ตาม use case จริงที่ใช้งาน (coding, agent, agent-think, chat, reasoning, long context, mini, trading) พร้อมบทเรียนจากการทดสอบจริง เช่น agent loop และ presence_penalty

Kongvut SangklaKongvut Sangkla
June 16, 2026 · 20 min read