MiniMax مدلهای جدیدی را ارائه داده که می تواند با بهترینهای این صنعت رقابت کند
شرکتهای چینی به توسعه مدلهای هوش مصنوعی ادامه میدهند که قابلیتهای آنها با سیستمهای مشابهی که توسط OpenAI و دیگر شرکتهای هوش مصنوعی مستقر در آمریکا طراحی شدهاند، رقابت میکند. به تازگی، استارتآپ MiniMax که با حمایت علیبابا و تنسنت شکل گرفته و 850 میلیون دلار سرمایهگذاری جذب کرده، سه مدل جدید به نامهای MiniMax-Text-01، MiniMax-VL-01 و T2A-01-HD را معرفی کرده است. مدل MiniMax-Text-01 به طور خاص برای پردازش متون طراحی شده، در حالی که MiniMax-VL-01 توانایی درک همزمان متن و تصاویر را دارد. از سوی دیگر، T2A-01-HD به تولید صدا، به ویژه گفتار، اختصاص دارد.
MiniMax ادعا میکند که مدل MiniMax-Text-01 که شامل 456 میلیارد پارامتر است، در مقایسه با مدلهایی نظیر Gemini 2.0 Flash که به تازگی از سوی گوگل معرفی شده، در زمینههای مختلفی مانند MMLU و SimpleQA عملکرد بهتری از خود نشان میدهد. این معیارها به ارزیابی توانایی مدل در پاسخدهی به مسائل ریاضی و سوالات واقعی کمک میکنند. به طور کلی، مدلهایی که دارای پارامترهای بیشتری هستند، معمولاً در حل مسائل توانمندتر از مدلهای با پارامترهای کمتر عمل میکنند.
در مورد MiniMax-VL-01، این شرکت اعلام کرده است که در ارزیابیهایی که نیاز به درک چندوجهی دارند، مانند ChartQA، این مدل توانسته است در پاسخ به سوالاتی مرتبط با نمودارها و دادهها، به خوبی عمل کند. با این حال، MiniMax-VL-01 در برخی از این آزمونها از مدل Gemini 2.0 Flash پایینتر بوده و همچنین مدل GPT-4o از OpenAI و یک مدل باز به نام InternVL2.5 نیز در مواردی موفق به شکست آن شدهاند. به نظر میرسد رقابت در حوزه هوش مصنوعی به شدت افزایش یافته و شرکتهای چینی در تلاشند تا در این عرصه به پیشرفتهای قابل ملاحظهای دست یابند.
نکته قابل توجه درباره مدل MiniMax-Text-01 این است که مدل جدید دارای یک پنجره زمینه بسیار وسیع است. پنجره زمینه به ورودیهایی اشاره دارد که مدل قبل از تولید خروجی مورد بررسی قرار میدهد. با ظرفیت 4 میلیون توکن، MiniMax-Text-01 قادر است تقریباً 3 میلیون کلمه را در یک بار پردازش کند. در مقایسه، این پنجره زمینه تقریباً 31 برابر بزرگتر از اندازه پنجره زمینه مدلهای GPT-4o و Llama 3.1 است.
مدل جدید MiniMax که به تازگی عرضه شده، T2A-01-HD نام دارد و به طور خاص برای تولید گفتار طراحی شده است. این مدل میتواند صدای مصنوعی با تن، ریتم و لحن قابل تنظیم در حدود 17 زبان مختلف، از جمله انگلیسی و چینی، تولید کند و توانایی شبیهسازی یک صدا را تنها با 10 ثانیه ضبط صوت دارد. هرچند MiniMax نتایج مقایسهای T2A-01-HD را با دیگر مدلهای تولید صوت منتشر نکرده است، اما به نظر میرسد کیفیت صدای خروجی آن با مدلهای صوتی شرکت متا و استارتاپهایی نظیر PlayAI قابل مقایسه باشد.
لازم به ذکر است که T2A-01-HD به صورت انحصاری از طریق API MiniMax و Hailuo AI در دسترس قرار دارد، در حالی که دیگر مدلهای جدید MiniMax از طریق GitHub و پلتفرم Hugging Face قابل دانلود هستند. مدلهای MiniMax-Text-01 و MiniMax-VL-01 به رغم اینکه به صورت “باز” در دسترس قرار گرفتهاند، به هیچ عنوان به معنای واقعی منبع باز نیستند. این مدلها به طور کامل شامل اطلاعاتی نظیر دادههای آموزشی نیستند که برای بازسازی دقیق آنها از ابتدا لازم است.
به علاوه، استفاده از این مدلها تحت مجوز خاصی قرار دارد که به توسعهدهندگان اجازه نمیدهد از آنها برای بهبود مدلهای رقیب بهرهبرداری کنند. همچنین، پلتفرمهایی که بیش از 100 میلیون کاربر فعال ماهانه دارند، ملزم به دریافت مجوز ویژه از MiniMax هستند. MiniMax در سال 2021 به دست گروهی از کارمندان سابق SenseTime، یکی از بزرگترین شرکتهای هوش مصنوعی در چین، تأسیس شد.
این شرکت پروژههای متنوعی را دنبال کرده است، از جمله توسعه اپلیکیشنهایی همچون Talkie، یک پلتفرم نقشآفرینی مبتنی بر هوش مصنوعی، و مدلهایی برای تبدیل متن به ویدئو که در پروژه Hailuo ارائه شده است. به تازگی، برخی از محصولات MiniMax جنجالهایی را به وجود آوردهاند. به عنوان مثال، Talkie به دلیل مشکلات فنی نامشخصی از اپ استور اپل حذف شد و شامل آواتارهای هوش مصنوعی شخصیتهای معروفی چون دونالد ترامپ و تیلور سویفت است، در حالی که به نظر میرسد هیچیک از آنها به استفاده از این آواتارها رضایت ندادهاند.
علاوه بر این، گزارشها حاکی از آن است که ژنراتورهای ویدیویی MiniMax قادر به بازتولید لوگوهای کانالهای تلویزیونی بریتانیا هستند، که نشان میدهد این مدلها ممکن است بر اساس محتوای این کانالها آموزش دیده باشند. همچنین، iQiyi، یکی از سرویسهای پخش ویدیوی چین، ادعا کرده که MiniMax به طور غیرقانونی از محتوای دارای حق چاپ این پلتفرم در فرآیند آموزش خود بهرهبرداری کرده است. مدلهای جدید MiniMax به تازگی وارد بازار شدهاند، در حالی که دولت بایدن در حال وضع قوانین سختگیرانهتری برای کنترل صادرات و فناوریهای هوش مصنوعی است. این در شرایطی است که شرکتهای چینی پیشتر نیز از خرید تراشههای پیشرفته هوش مصنوعی منع شده بودند و به نظر میرسد قوانین جدید محدودیتهای بیشتری را برای آنها به همراه خواهد داشت.