Qwen3.6-35B-A3B: เลือก parameters ตาม use case
· 6 min read
Context
Qwen3.6-35B-A3B รันอยู่บน DGX Spark (port 8001, vLLM v0.23.0, 128K context)
ที่ผ่านมาใช้ temperature 0.6 ตาม --override-generation-config ของ recipe แต่พออ่าน HF model card ละเอียด ๆ เจอว่า Qwen team เองใช้ค่า ต่างกัน ในแต่ละ benchmark category
เลยรวบรวมมาเป็น note สั้น ๆ เพื่อใช้อ้างอิง
