هوش مصنوعی

MiniMax مدل‌های جدیدی را ارائه داده که می تواند با بهترین‌های این صنعت رقابت کند

شرکت‌های چینی به توسعه مدل‌های هوش مصنوعی ادامه می‌دهند که قابلیت‌های آنها با سیستم‌های مشابهی که توسط OpenAI و دیگر شرکت‌های هوش مصنوعی مستقر در آمریکا طراحی شده‌اند، رقابت می‌کند. به تازگی، استارت‌آپ MiniMax که با حمایت علی‌بابا و تنسنت شکل گرفته و 850 میلیون دلار سرمایه‌گذاری جذب کرده، سه مدل جدید به نام‌های MiniMax-Text-01، MiniMax-VL-01 و T2A-01-HD را معرفی کرده است. مدل MiniMax-Text-01 به طور خاص برای پردازش متون طراحی شده، در حالی که MiniMax-VL-01 توانایی درک همزمان متن و تصاویر را دارد. از سوی دیگر، T2A-01-HD به تولید صدا، به ویژه گفتار، اختصاص دارد.

MiniMax ادعا می‌کند که مدل MiniMax-Text-01 که شامل 456 میلیارد پارامتر است، در مقایسه با مدل‌هایی نظیر Gemini 2.0 Flash که به تازگی از سوی گوگل معرفی شده، در زمینه‌های مختلفی مانند MMLU و SimpleQA عملکرد بهتری از خود نشان می‌دهد. این معیارها به ارزیابی توانایی مدل در پاسخ‌دهی به مسائل ریاضی و سوالات واقعی کمک می‌کنند. به طور کلی، مدل‌هایی که دارای پارامترهای بیشتری هستند، معمولاً در حل مسائل توانمندتر از مدل‌های با پارامترهای کمتر عمل می‌کنند.

در مورد MiniMax-VL-01، این شرکت اعلام کرده است که در ارزیابی‌هایی که نیاز به درک چندوجهی دارند، مانند ChartQA، این مدل توانسته است در پاسخ به سوالاتی مرتبط با نمودارها و داده‌ها، به خوبی عمل کند. با این حال، MiniMax-VL-01 در برخی از این آزمون‌ها از مدل Gemini 2.0 Flash پایین‌تر بوده و همچنین مدل GPT-4o از OpenAI و یک مدل باز به نام InternVL2.5 نیز در مواردی موفق به شکست آن شده‌اند. به نظر می‌رسد رقابت در حوزه هوش مصنوعی به شدت افزایش یافته و شرکت‌های چینی در تلاشند تا در این عرصه به پیشرفت‌های قابل ملاحظه‌ای دست یابند.

نکته قابل توجه درباره مدل MiniMax-Text-01 این است که مدل جدید دارای یک پنجره زمینه بسیار وسیع است. پنجره زمینه به ورودی‌هایی اشاره دارد که مدل قبل از تولید خروجی مورد بررسی قرار می‌دهد. با ظرفیت 4 میلیون توکن، MiniMax-Text-01 قادر است تقریباً 3 میلیون کلمه را در یک بار پردازش کند. در مقایسه، این پنجره زمینه تقریباً 31 برابر بزرگ‌تر از اندازه پنجره زمینه مدل‌های GPT-4o و Llama 3.1 است.

مدل جدید MiniMax که به تازگی عرضه شده، T2A-01-HD نام دارد و به طور خاص برای تولید گفتار طراحی شده است. این مدل می‌تواند صدای مصنوعی با تن، ریتم و لحن قابل تنظیم در حدود 17 زبان مختلف، از جمله انگلیسی و چینی، تولید کند و توانایی شبیه‌سازی یک صدا را تنها با 10 ثانیه ضبط صوت دارد. هرچند MiniMax نتایج مقایسه‌ای T2A-01-HD را با دیگر مدل‌های تولید صوت منتشر نکرده است، اما به نظر می‌رسد کیفیت صدای خروجی آن با مدل‌های صوتی شرکت متا و استارتاپ‌هایی نظیر PlayAI قابل مقایسه باشد.

لازم به ذکر است که T2A-01-HD به صورت انحصاری از طریق API MiniMax و Hailuo AI در دسترس قرار دارد، در حالی که دیگر مدل‌های جدید MiniMax از طریق GitHub و پلتفرم Hugging Face قابل دانلود هستند. مدل‌های MiniMax-Text-01 و MiniMax-VL-01 به رغم اینکه به صورت “باز” در دسترس قرار گرفته‌اند، به هیچ عنوان به معنای واقعی منبع باز نیستند. این مدل‌ها به طور کامل شامل اطلاعاتی نظیر داده‌های آموزشی نیستند که برای بازسازی دقیق آن‌ها از ابتدا لازم است.

به علاوه، استفاده از این مدل‌ها تحت مجوز خاصی قرار دارد که به توسعه‌دهندگان اجازه نمی‌دهد از آنها برای بهبود مدل‌های رقیب بهره‌برداری کنند. همچنین، پلتفرم‌هایی که بیش از 100 میلیون کاربر فعال ماهانه دارند، ملزم به دریافت مجوز ویژه از MiniMax هستند. MiniMax در سال 2021 به دست گروهی از کارمندان سابق SenseTime، یکی از بزرگ‌ترین شرکت‌های هوش مصنوعی در چین، تأسیس شد.

این شرکت پروژه‌های متنوعی را دنبال کرده است، از جمله توسعه اپلیکیشن‌هایی همچون Talkie، یک پلتفرم نقش‌آفرینی مبتنی بر هوش مصنوعی، و مدل‌هایی برای تبدیل متن به ویدئو که در پروژه Hailuo ارائه شده است. به تازگی، برخی از محصولات MiniMax جنجال‌هایی را به وجود آورده‌اند. به عنوان مثال، Talkie به دلیل مشکلات فنی نامشخصی از اپ استور اپل حذف شد و شامل آواتارهای هوش مصنوعی شخصیت‌های معروفی چون دونالد ترامپ و تیلور سویفت است، در حالی که به نظر می‌رسد هیچ‌یک از آنها به استفاده از این آواتارها رضایت نداده‌اند.

علاوه بر این، گزارش‌ها حاکی از آن است که ژنراتورهای ویدیویی MiniMax قادر به بازتولید لوگوهای کانال‌های تلویزیونی بریتانیا هستند، که نشان می‌دهد این مدل‌ها ممکن است بر اساس محتوای این کانال‌ها آموزش دیده باشند. همچنین، iQiyi، یکی از سرویس‌های پخش ویدیوی چین، ادعا کرده که MiniMax به طور غیرقانونی از محتوای دارای حق چاپ این پلتفرم در فرآیند آموزش خود بهره‌برداری کرده است. مدل‌های جدید MiniMax به تازگی وارد بازار شده‌اند، در حالی که دولت بایدن در حال وضع قوانین سخت‌گیرانه‌تری برای کنترل صادرات و فناوری‌های هوش مصنوعی است. این در شرایطی است که شرکت‌های چینی پیش‌تر نیز از خرید تراشه‌های پیشرفته هوش مصنوعی منع شده بودند و به نظر می‌رسد قوانین جدید محدودیت‌های بیشتری را برای آنها به همراه خواهد داشت.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا