هوش مصنوعی «ترکیبی» چینی؛ علی‌بابا از Qwen3 رونمایی کرد

تیم تحریریه ایگرام 9 اردیبهشت 1404آخرین به روز رسانی: 9 اردیبهشت 1404

0 0 خواندن این مطلب 1 دقیقه زمان میبرد

هوش مصنوعی «ترکیبی» چینی؛ علی‌بابا از Qwen3 رونمایی کرد

شرکت چینی علی‌بابا از سری جدید مدل‌های هوش مصنوعی خود با نام Qwen3 رونمایی کرد. به ادعای این غول فناوری، مدل‌های جدید در برخی آزمون‌ها عملکردی برابر یا حتی بهتر از نمونه‌های پیشرفته‌ی گوگل و OpenAI دارند. مدل‌های یادشده از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر بهره می‌برند و بسیاری از آن‌ها به‌صورت متن‌باز در پلتفرم‌هایی مانند گیت‌هاب و Hugging Face در دسترس قرار گرفته‌اند یا به‌زودی منتشر خواهند شد.

Qwen3 مدل‌هایی «ترکیبی» هستند و این یعنی می‌توانند بسته به نوع وظیفه و با صرف زمان بیشتر، مسائل پیچیده را حل کنند یا به‌سرعت به درخواست‌های ساده پاسخ دهند. رویکرد مذکور شبیه به توانایی‌های مدل‌های OpenAI مانند o3 عمل می‌کند و امکان تنظیم بودجه‌ی پردازشی برای هر وظیفه را فراهم می‌سازد.

برخی نسخه‌های Qwen3 از معماری Mixture of Experts (MoE) استفاده می‌کنند. این ساختار وظایف را بین مدل‌های کوچک‌تر و تخصصی تقسیم می‌کند و از نظر محاسباتی کارآمدتر است. طراحی مورد اشاره به Qwen3 کمک می‌کند در پاسخگویی دقیق و سریع به پرسش‌ها، رقابتی ظاهر شود.

به‌گفته‌ی تیم Qwen، مدل‌های Qwen3 با پشتیبانی از ۱۱۹ زبان و آموزش بر پایه‌ی مجموعه داده‌هایی شامل ۳۶ تریلیون توکن، گستره‌ی متنوعی از منابع شامل کتاب‌های درسی، کدهای برنامه‌نویسی، داده‌های هوش مصنوعی و جفت‌های پرسش و پاسخ را در بر می‌گیرند. این گستردگی به بهبود قابل‌ توجه نسبت به نسخه‌ی قبلی یعنی Qwen2 منجر شده است.

مقاله‌های مرتبط:

بزرگ‌ترین مدل Qwen3 یعنی Qwen-3-235B-A22B موفق شد در آزمون‌هایی مانند Codeforces ،AIME و BFCL از مدل‌های o3-mini و Gemini 2.5 Pro پیشی بگیرد و البته مدل مذکور هنوز به‌صورت عمومی منتشر نشده است؛ اما نسخه‌ی Qwen3-32B که در دسترس عموم قرار دارد، عملکردی در حد مدل‌های سطح بالای چینی و حتی بهتر از OpenAI o1 از خود نشان داد.

قابلیت‌هایی مثل فراخوانی ابزارها، پیروی دقیق از دستورالعمل‌ها و انطباق با قالب داده‌ها، از دیگر ویژگی‌های شاخص Qwen3 محسوب می‌شوند. این مدل‌ها علاوه‌بر دانلود، از طریق ارائه‌دهندگان ابری مثل Fireworks AI نیز قابل استفاده‌اند. کارشناسان باور دارند پیشرفت‌های یادشده، نشانه‌ای از قدرت گرفتن مدل‌های متن‌باز در رقابت با غول‌های فناوری غربی است.