نرم افزار و اینترنت

مایکروسافت از مدل چندوجهی Phi-3-vision با زبان کوچک معرفی کرد

در ماه آوریل، مایکروسافت برای اولین بار خانواده جدید Phi-3 مدل های زبان کوچک (SML) هوش مصنوعی خود را معرفی کرد. آنها به گونه ای طراحی شده اند که بر روی دستگاه ها به جای سرورهای ابری اجرا شوند. امروز، به عنوان بخشی از بیلد 2024، مایکروسافت یک مدل دیگر Phi-3 را معرفی کرد که موضوعی متفاوت دارد.

مدل جدید Phi-3-vision نامیده می‌شود و همانطور که از نامش پیداست، این SML نه تنها می‌تواند پیام‌های متنی را مدیریت کند، بلکه می‌تواند تصاویر و پیام‌های متنی را نیز برای ایجاد پاسخ به سؤالات بپذیرد. مایکروسافت می‌گوید افرادی که از این مدل استفاده می‌کنند می‌توانند پاسخ سؤالات مربوط به نموداری را که ارسال کرده‌اند یا هر سوالی در مورد تصاویری که مدل Phi-3-vision دریافت می‌کند بپرسند.

Phi-3-vision شامل 4.2 میلیارد پارامتر است که بزرگتر از حالت Phi-3 Mini با 3.8 میلیارد پارامتر می باشد، اما بسیار کوچکتر از مدل Phi-3 Small با پارامتر 7 میلیارد و حالت Phi-3 متوسط با پارامتر 14 میلیارد است. مایکروسافت می‌گوید که Phi-3-vision می‌تواند به سؤالات مربوط به “کارهای استدلال بصری کلی و همچنین استدلال نمودار، چارت و جدول”پاسخ دهد.

مدل جدید Phi-3-vision در حال حاضر به عنوان یک نسخه پیش نمایش در دسترس است، اما هیچ صحبتی در مورد زمان عرضه عمومی آن وجود ندارد. با این حال، Phi-3 Mini، Phi-3 Small و Phi-3 Medium اکنون به طور کلی برای دسترسی از طریق مدل Azure AI مایکروسافت به عنوان یک سرویس در دسترس هستند.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا