
بایدو از مدلهای جدید ERNIE 4.5 و ERNIE X1 رونمایی کرد
از زمان معرفی مدل R1 دیپسیک در ژانویه، انتظارات برای مدلهای جدید بنیادین به طور قابل توجهی افزایش یافته است. شرکت بزرگ فناوری چینی، بایدو، از ارائه دو مدل جدید بنیادین به نامهای ERNIE 4.5 و ERNIE X1 خبر داده است. مدل ERNIE 4.5 یک مدل بنیادین چندرسانهای است که توانایی درک متن، تصویر، صدا و ویدیو را دارد. این مدل شامل بهبودهایی در مهارتهای زبانی، درک، تولید، استدلال و حافظه است.
به گفته بایدو، ERNIE 4.5 در مقایسه با مدل GPT-4.5 اوپنای آی در معیارهای استاندارد مختلف برتری دارد. یکی از ویژگیهای قابل توجه ERNIE 4.5 هزینه آن است که تنها 1% هزینه GPT-4.5 میباشد. بایدو با استفاده از فناوریهای کلیدی مانند FlashMask Dynamic Attention Masking، Heterogeneous Multimodal Mixture-of-Experts، Spatiotemporal Representation Compression، Knowledge-Centric Training Data Construction و Self-feedback Enhanced Post-Training به عملکرد و کارایی هزینهای ERNIE 4.5 دست یافته است.
بایدو با استفاده از فناوریهای کلیدی مانند FlashMask Dynamic Attention Masking، Heterogeneous Multimodal Mixture-of-Experts، فشردهسازی نمایشهای فضایی-زمانی، ساخت دادههای آموزشی مبتنی بر دانش و تقویت خودبازخورد پس از آموزش، به عملکرد و کارایی هزینهای ERNIE 4.5 دست یافت. ERNIE X1 نخستین مدل تفکر عمیق چندرسانهای بایدو است که در زمینههای پرسش و پاسخ دانش چینی، گفتگو، استدلال منطقی، محاسبات پیچیده و دیگر موارد عملکرد بهتری دارد.
این مدل همچنین از ابزارهایی مانند جستجوی پیشرفته، پرسش و پاسخ در مورد اسناد خاص، درک تصویر، تولید تصویر با هوش مصنوعی، تفسیر کد، خواندن وبسایت، نقشهبرداری TreeMind، جستجوی علمی بایدو، جستجوی اطلاعات تجاری و جستجوی اطلاعات فرانچایز پشتیبانی میکند. مدل X1 با استفاده از فناوریهای کلیدی مانند روش یادگیری تقویتی تدریجی، رویکرد آموزش انتها به انتها که زنجیرههای فکر و عمل را یکپارچه میکند و سیستم پاداش چندوجهی یکپارچه، تقویت شده است.
به گفته بایدو، ERNIE X1 عملکردی برابر با DeepSeek R1 را با تنها نیمی از هزینه ارائه میدهد. مشتریان میتوانند به مدلهای جدید ERNIE 4.5 و ERNIE X1 از طریق وبسایت ERNIE Bot دسترسی پیدا کنند. بایدو در نظر دارد این مدلهای جدید را در ماههای آینده به موتور جستجوی Baidu، اپلیکیشن Wenxiaoyan و سایر خدمات خود اضافه کند. برای توسعهدهندگان، مدل جدید ERNIE 4.5 هماکنون از طریق APIها در پلتفرم MaaS ابری Baidu به نام Qianfan در دسترس است و مدل ERNIE X1 به زودی قابل استفاده خواهد بود.
قیمتگذاری برای ERNIE 4.5 از RMB 0.004 به ازای هر هزار توکن ورودی و RMB 0.016 به ازای هر هزار توکن خروجی آغاز میشود. برای ERNIE X1، قیمتهای ورودی از RMB 0.002 به ازای هر هزار توکن شروع میشود، در حالی که قیمتهای خروجی به RMB 0.008 به ازای هر هزار توکن کاهش مییابد. به زبان دلار آمریکا، قیمتهای ورودی و خروجی از 0.55 دلار به ازای هر 1 میلیون توکن و 2.2 دلار به ازای هر 1 میلیون توکن آغاز میشود.