อาลีบาบา เปิดตัวหลักสูตร Qwen LLM ใหม่ซึ่งเป็นความก้าวหน้าทาง AI โอเพนซอร์สล่าสุดของจีน
CNBC CHINA ECONOMY Tech : Dylan Butts @in/dylan-b-7a451a107
จุดสำคัญ
อาลีบาบา กล่าวว่า Qwen3 สัญญาว่าจะปรับปรุงการใช้เหตุผล การปฏิบัติตามคำแนะนำ การใช้เครื่องมือ และงานหลายภาษา แข่งขันกับโมเดลระดับสูงอื่นๆ ในเกณฑ์มาตรฐานอุตสาหกรรมหลายๆ แห่ง
Qwen3 ประกอบด้วย 'โมเดลการใช้เหตุผลแบบไฮบริด'ชุดแรกของ Alibaba โดยบริษัทกล่าวว่าเป็นการผสมผสานความสามารถของโมเดลภาษาขนาดใหญ่แบบดั้งเดิมกับ “การใช้เหตุผลแบบไดนามิกขั้นสูง”
นักวิเคราะห์ปัญญาประดิษฐ์ กล่าวว่า Qwen3 ถือเป็นความท้าทายที่สำคัญสำหรับคู่แข่งของ Alibaba ในจีน รวมถึงผู้นำอุตสาหกรรมในสหรัฐฯ
Qwen3 is Alibaba’s debut into so-called 'hybrid reasoning models,'which it says combines traditional LLM capabilities with 'advanced, dynamic reasoning.”
Sopa Images | Lightrocket | Getty Images
อาลีบาบา เปิดตัวโมเดลภาษาโอเพนซอร์สขนาดใหญ่รุ่นต่อไป Qwen3 เมื่อวันอังคาร และผู้เชี่ยวชาญเรียกมันว่าอีกหนึ่งความก้าวหน้าครั้งสำคัญในพื้นที่ปัญญาประดิษฐ์โอเพนซอร์สที่กำลังเติบโตอย่างรวดเร็วของจีน
ในโพสต์บล็อกยักษ์ใหญ่ด้านเทคโนโลยีของจีนกล่าวว่า Qwen3 สัญญาว่า จะปรับปรุงการใช้เหตุผล การปฏิบัติตามคำสั่ง การใช้เครื่องมือ และงานหลายภาษา แข่งขันกับโมเดลระดับบนอื่นๆ เช่น R1 ของ DeepSeek ในเกณฑ์มาตรฐานอุตสาหกรรมหลายๆ รายการ
ซีรีส์ LLM มีรูปแบบต่างๆ แปดแบบที่ครอบคลุมสถาปัตยกรรมและขนาดที่หลากหลาย ช่วยให้นักพัฒนามีความยืดหยุ่นในการใช้ Qwen ในการสร้างแอปพลิเคชัน AI สำหรับอุปกรณ์ขอบ เช่น โทรศัพท์มือถือ
Qwen3 ถือเป็นการเปิดตัว 'โมเดลการใช้เหตุผลแบบไฮบริด' ของ Alibaba โดยบริษัทกล่าวว่า เป็นการผสมผสานความสามารถ LLM ดั้งเดิมเข้ากับ ‘การใช้เหตุผลแบบไดนามิกขั้นสูง’
ตามที่อาลีบาบา ระบุ โมเดลดังกล่าวสามารถเปลี่ยนผ่านจาก 'โหมดการคิด' สำหรับงานที่ซับซ้อน เช่น การเขียนโค้ด และ'โหมดการไม่คิด' ได้อย่างราบรื่น เพื่อการตอบสนองที่รวดเร็วและมีวัตถุประสงค์ทั่วไป
“ที่น่าสังเกตคือ โมเดล Qwen3-235B-A22B MoE ช่วยลดต้นทุนการใช้งานได้อย่างมากเมื่อเปรียบเทียบกับโมเดลล้ำสมัยอื่นๆ ซึ่งตอกย้ำความมุ่งมั่นของ Alibaba ที่จะสร้าง AI ที่เข้าถึงได้และมีประสิทธิภาพสูง”Alibaba กล่าว
โมเดลใหม่เหล่านี้เปิดให้ผู้ใช้ทั่วไปใช้งานได้ฟรีบนแพลตฟอร์มต่างๆ เช่น Hugging Face และ GitHub รวมถึงอินเทอร์เฟซเว็บของ Alibaba Cloud นอกจากนี้ Qwen3 ยังถูกนำมาใช้เพื่อขับเคลื่อนQuark ซึ่งเป็นผู้ช่วย AI ของ Alibaba อีกด้วย
ความก้าวหน้าของ AI ในประเทศจีน
นักวิเคราะห์ AI บอกกับ CNBC ว่า Qwen3 ถือเป็นความท้าทายที่สำคัญสำหรับคู่แข่งของ Alibaba ในจีน รวมถึงผู้นำอุตสาหกรรมในสหรัฐฯ
ในแถลงการณ์ต่อ CNBC เว่ย ซุน นักวิเคราะห์หลักของปัญญาประดิษฐ์ที่ Counterpoint Research กล่าวว่าซีรีส์ Qwen3 นั้นเป็น ”ความก้าวหน้าครั้งสำคัญ ไม่ใช่แค่เพียงเพราะประสิทธิภาพที่ดีที่สุดในระดับเดียวกัน” แต่ยังรวมถึงคุณสมบัติหลายประการที่ชี้ให้เห็นถึง ”ศักยภาพในการใช้งานของโมเดลต่างๆ” อีกด้วย
คุณสมบัติเหล่านี้ ได้แก่โหมดการคิดแบบไฮบริดของ Qwen3 การรองรับหลายภาษาครอบคลุม 119 ภาษาและสำเนียงท้องถิ่น และความพร้อมใช้งานโอเพนซอร์ส Sun กล่าวเสริม
ซอฟต์แวร์โอเพ่นซอร์ส โดยทั่วไปหมายถึงซอฟต์แวร์ที่เผยแพร่ซอร์สโค้ดบนเว็บฟรีเพื่อปรับเปลี่ยนและเผยแพร่ซ้ำได้ เมื่อต้นปีนี้ โมเดลโอเพ่นซอร์ส R1 ของ DeepSeek เขย่าวงการ AI และกลายเป็นตัวเร่งปฏิกิริยาสำหรับพื้นที่ AI ของจีนและการนำโมเดลโอเพ่นซอร์สมาใช้อย่าง รวดเร็ว
“การเปิดตัวซีรีส์ Qwen 3 ของ Alibaba ตอกย้ำถึงศักยภาพที่แข็งแกร่งของห้องปฏิบัติการของจีนในการพัฒนาโมเดลโอเพนซอร์สที่มีการแข่งขันสูง สร้างสรรค์ และสร้างสรรค์ แม้จะมีแรงกดดันที่เพิ่มขึ้นจากการควบคุมการส่งออกของสหรัฐฯ ที่เข้มงวดยิ่งขึ้นก็ตาม” Ray Wang นักวิเคราะห์จากวอชิงตัน ซึ่งเน้นด้านเศรษฐกิจและการแข่งขันด้านเทคโนโลยีระหว่างสหรัฐฯ และจีน กล่าว
ตามรายงานของ Alibaba Qwen ได้กลายเป็นหนึ่งใน ซีรีย์โมเดล AI โอเพ่นซอร์สที่ได้รับการใช้อย่างแพร่หลายที่สุดในโลกโดยมียอดดาวน์โหลดมากกว่า 300 ล้านครั้งทั่วโลก และมีโมเดลอนุพันธ์มากกว่า 100,000 ตัวบน Hugging Face
Wang กล่าวว่า การรับเลี้ยงบุตรบุญธรรมในครั้งนี้สามารถดำเนินต่อไปได้ด้วย Qwen3 โดยเสริมว่า ประสิทธิภาพที่อ้างไว้อาจทำให้ Qwen3 กลายเป็นโมเดลโอเพ่นซอร์สที่ดีที่สุดในโลก แม้ว่าจะยังตามหลังโมเดลที่ล้ำสมัยที่สุดของโลกอย่าง o3 และ o4-mini ของ OpenAI ก็ตาม
คู่แข่งชาวจีน เช่น Baidu ต่างรีบเร่งเปิดตัวโมเดล AI ใหม่หลังจากที่ DeepSeek เกิดขึ้น รวมทั้งวางแผนที่จะเปลี่ยนไปใช้โมเดลธุรกิจโอเพนซอร์สมากขึ้น
ขณะเดียวกัน สำนักข่าว Reuters รายงานเมื่อเดือนกุมภาพันธ์ว่า DeepSeek กำลังเร่งเปิดตัวโปรแกรมที่สืบต่อจาก R1 โดยอ้างอิงจากแหล่งข่าวที่ไม่เปิดเผยชื่อ
“ในบริบทที่กว้างขึ้นของการแข่งขันด้าน AI ระหว่างสหรัฐฯ และจีน ช่องว่างระหว่างห้องปฏิบัติการของสหรัฐฯ และจีนแคบลง อาจจะเป็นเวลาเพียงไม่กี่เดือน และบางคนอาจโต้แย้งว่าอาจเป็นเพียงไม่กี่สัปดาห์” หวังกล่าว
“ด้วยการเปิดตัว Qwen 3 ล่าสุดและการเปิดตัว R2 ของ DeepSeek ในเร็วๆ นี้ ช่องว่างดังกล่าวไม่น่าจะกว้างขึ้น และอาจหดตัวลงต่อไปด้วยซ้ำ”