مایکروسافت از مدل چندوجهی Phi-3-vision با زبان کوچک معرفی کرد
در ماه آوریل، مایکروسافت برای اولین بار خانواده جدید Phi-3 مدل های زبان کوچک (SML) هوش مصنوعی خود را معرفی کرد. آنها به گونه ای طراحی شده اند که بر روی دستگاه ها به جای سرورهای ابری اجرا شوند. امروز، به عنوان بخشی از بیلد 2024، مایکروسافت یک مدل دیگر Phi-3 را معرفی کرد که موضوعی متفاوت دارد.
مدل جدید Phi-3-vision نامیده میشود و همانطور که از نامش پیداست، این SML نه تنها میتواند پیامهای متنی را مدیریت کند، بلکه میتواند تصاویر و پیامهای متنی را نیز برای ایجاد پاسخ به سؤالات بپذیرد. مایکروسافت میگوید افرادی که از این مدل استفاده میکنند میتوانند پاسخ سؤالات مربوط به نموداری را که ارسال کردهاند یا هر سوالی در مورد تصاویری که مدل Phi-3-vision دریافت میکند بپرسند.
Phi-3-vision شامل 4.2 میلیارد پارامتر است که بزرگتر از حالت Phi-3 Mini با 3.8 میلیارد پارامتر می باشد، اما بسیار کوچکتر از مدل Phi-3 Small با پارامتر 7 میلیارد و حالت Phi-3 متوسط با پارامتر 14 میلیارد است. مایکروسافت میگوید که Phi-3-vision میتواند به سؤالات مربوط به “کارهای استدلال بصری کلی و همچنین استدلال نمودار، چارت و جدول”پاسخ دهد.
مدل جدید Phi-3-vision در حال حاضر به عنوان یک نسخه پیش نمایش در دسترس است، اما هیچ صحبتی در مورد زمان عرضه عمومی آن وجود ندارد. با این حال، Phi-3 Mini، Phi-3 Small و Phi-3 Medium اکنون به طور کلی برای دسترسی از طریق مدل Azure AI مایکروسافت به عنوان یک سرویس در دسترس هستند.