هوش مصنوعی «ترکیبی» چینی؛ علیبابا از Qwen3 رونمایی کرد
شرکت چینی علیبابا از سری جدید مدلهای هوش مصنوعی خود با نام Qwen3 رونمایی کرد. به ادعای این غول فناوری، مدلهای جدید در برخی آزمونها عملکردی برابر یا حتی بهتر از نمونههای پیشرفتهی گوگل و OpenAI دارند. مدلهای یادشده از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر بهره میبرند و بسیاری از آنها بهصورت متنباز در پلتفرمهایی مانند گیتهاب و Hugging Face در دسترس قرار گرفتهاند یا بهزودی منتشر خواهند شد.
Qwen3 مدلهایی «ترکیبی» هستند و این یعنی میتوانند بسته به نوع وظیفه و با صرف زمان بیشتر، مسائل پیچیده را حل کنند یا بهسرعت به درخواستهای ساده پاسخ دهند. رویکرد مذکور شبیه به تواناییهای مدلهای OpenAI مانند o3 عمل میکند و امکان تنظیم بودجهی پردازشی برای هر وظیفه را فراهم میسازد.
برخی نسخههای Qwen3 از معماری Mixture of Experts (MoE) استفاده میکنند. این ساختار وظایف را بین مدلهای کوچکتر و تخصصی تقسیم میکند و از نظر محاسباتی کارآمدتر است. طراحی مورد اشاره به Qwen3 کمک میکند در پاسخگویی دقیق و سریع به پرسشها، رقابتی ظاهر شود.
بهگفتهی تیم Qwen، مدلهای Qwen3 با پشتیبانی از ۱۱۹ زبان و آموزش بر پایهی مجموعه دادههایی شامل ۳۶ تریلیون توکن، گسترهی متنوعی از منابع شامل کتابهای درسی، کدهای برنامهنویسی، دادههای هوش مصنوعی و جفتهای پرسش و پاسخ را در بر میگیرند. این گستردگی به بهبود قابل توجه نسبت به نسخهی قبلی یعنی Qwen2 منجر شده است.
مقالههای مرتبط:
بزرگترین مدل Qwen3 یعنی Qwen-3-235B-A22B موفق شد در آزمونهایی مانند Codeforces ،AIME و BFCL از مدلهای o3-mini و Gemini 2.5 Pro پیشی بگیرد و البته مدل مذکور هنوز بهصورت عمومی منتشر نشده است؛ اما نسخهی Qwen3-32B که در دسترس عموم قرار دارد، عملکردی در حد مدلهای سطح بالای چینی و حتی بهتر از OpenAI o1 از خود نشان داد.
قابلیتهایی مثل فراخوانی ابزارها، پیروی دقیق از دستورالعملها و انطباق با قالب دادهها، از دیگر ویژگیهای شاخص Qwen3 محسوب میشوند. این مدلها علاوهبر دانلود، از طریق ارائهدهندگان ابری مثل Fireworks AI نیز قابل استفادهاند. کارشناسان باور دارند پیشرفتهای یادشده، نشانهای از قدرت گرفتن مدلهای متنباز در رقابت با غولهای فناوری غربی است.