گوگل در جواب GPT-4 مدل Gemini را معرفی کرد
جایگاه OpenAI در بالای انبوه هوش مصنوعی مولد ممکن است به پایان برسد زیرا گوگل رسماً در روز چهارشنبه توانمندترین مدل زبان بزرگ خود را با نام Gemini 1.0 معرفی کرد. ساندار پیچای، مدیرعامل این شرکت در یک پست وبلاگ گوگل نوشت: این اولین مدل از نسل جدید مدلهای هوش مصنوعی است که از نحوه درک و تعامل مردم با جهان الهام گرفته شده است.
پیچای ادامه داد: “از زمان برنامهنویسی هوش مصنوعی برای بازیهای رایانهای در نوجوانی و در طول سالهایی که به عنوان محقق علوم اعصاب تلاش کردم تا عملکرد مغز را درک کنم، همیشه بر این باور بودهام که اگر بتوانیم ماشینهای هوشمندتر بسازیم، میتوانیم آنها را به گونهای باورنکردنی به نفع بشریت مهار کنیم.”
نتیجه همکاری گسترده بین بخشهای DeepMind و تحقیقات گوگل، Gemini دارای تمامی زنگها و سوتهایی است که ژنراتورهای پیشرفته ارائه میدهند. پیچای بیان کرد که “قابلیت های آن تقریباً در هر حوزه ای پیشرفته است”. این سیستم از ابتدا به عنوان یک هوش مصنوعی چندوجهی یکپارچه توسعه یافته است.
بسیاری از مدلهای پایه میتوانند اساساً شامل گروههایی از مدلهای کوچکتر باشند که همگی در یک پوشش سنگی چیده شدهاند، با هر مدل جداگانه برای انجام عملکرد خاص خود به عنوان بخشی از کل بزرگتر. همه اینها برای عملکردهای کم عمق مانند توصیف تصاویر خوب است، اما برای کارهای استدلالی پیچیده چندان خوب نیست.
Gemini همچنین می تواند کدنویسی کند. گزارش شده که در زبان های برنامه نویسی محبوب از جمله Python، Java، C++ و Go مهارت دارد. گوگل حتی از یک نسخه تخصصی Gemini برای ایجاد AlphaCode 2 استفاده کرده، که جانشینی برای برنده رقابت های GenerativeAI در سال گذشته است. به گفته این شرکت، AlphaCode 2 دو برابر سوالات چالشی قبلی خود را حل کرده است که عملکرد آن را بالاتر از 85 درصد از شرکت کنندگان مسابقه قبلی قرار می دهد.
در حالی که گوگل تعداد پارامترهایی را که Gemini میتواند استفاده کند به اشتراک نگذاشته، این شرکت انعطافپذیری عملیاتی و توانایی این مدل را برای کار در فرم فاکتورهای از مراکز داده بزرگ تا دستگاههای تلفن همراه داخلی به نمایش گذاشت. برای به انجام رساندن این شاهکار تحول آفرین، Gemini در سه اندازه در دسترس است: Nano، Pro و Ultra.
جای تعجب نیست که نانو کوچکترین در میان این سه گزینه است و عمدتاً برای کارهای روی دستگاه طراحی شده است. Pro گام بعدی است، یک پیشنهاد همه کاره تر از Nano، و به زودی در بسیاری از محصولات موجود گوگل، از جمله Bard، ادغام خواهد شد. از روز چهارشنبه، Bard شروع به استفاده از یک نسخه خاص از Pro می کند که گوگل قول داده “استدلال، برنامه ریزی، درک و بیشتر پیشرفته تر” را ارائه دهد.
چت بات بهبودیافته Bard در همان 170 کشور و منطقه ای که Bard معمولی در حال حاضر موجود است در دسترس خواهد بود و طبق گزارش ها، این شرکت قصد دارد تا سال 2024 در دسترس بودن نسخه جدید را گسترش دهد. سال آینده، با ورود Gemini Ultra، گوگل همچنین Bard Advanced را معرفی خواهد کرد، هوش مصنوعی حتی قوی تر با ویژگی های اضافه شده است. Gemini Ultra حداقل تا سال 2024 در دسترس نخواهد بود، زیرا طبق گزارشها قبل از انتشار برای “مشتریان، توسعهدهندگان، شرکا و کارشناسان ایمنی و مسئولیت” برای آزمایش و بازخورد، به آزمایشهای تیم قرمز اضافی نیاز دارد.