فایرفاکس از هوش مصنوعی برای بهبود دسترسی به مرور استفاده خواهد کرد
به نظر می رسد که هر نرم افزار مدرن اکنون با هوش مصنوعی عرضه می شود تا ویژگی هایی با کیفیت، کاربردی و امنیت مشکوک را به مشتریان خود ارائه دهد. موزیلا و مرورگر فایرفاکس آن از این استفاده گسترده از هوش مصنوعی مصون نیستند و این شرکت می خواهد هوش مصنوعی را برای دسترسی بهتر پیاده سازی کند.
Tarek ZIade در پست اخیر خود در Mozilla Hacks توضیح داد که چگونه فایرفاکس از هوش مصنوعی برای بهبود دسترسی استفاده می کند، یعنی با ارائه شرح تصاویر تولید شده توسط هوش مصنوعی برای افرادی که به فناوری های کمکی مانند صفحه خوان ها متکی هستند. زیرنویس تصویر یا “alt text” زمینه لازم را برای خوانندگان فراهم میکند، اما متأسفانه، بسیاری از نویسندگان متن جایگزین را نادیده میگیرند و در نتیجه تقریباً نیمی از تمام تصاویر توضیحات مناسب را از دست میدهند.
با جدیدترین پیشرفتهای هوش مصنوعی، اکنون میتوان یک مدل یادگیری ماشینی محلی را برای تولید خودکار زیرنویسها بدون ارسال اطلاعات بالقوه حساس به سرورها اجرا کرد. فایرفاکس 130 در کانال Nightly با ویژگی جدیدی برای ویرایشگر PDF عرضه می شود که متن جایگزین را با استفاده از مدل های کوچک مبتنی بر ترانسفورماتور-مدل های یادگیری ماشینی منبع باز تولید می کند.
موزیلا ادعا می کند که آنها در توصیف تصاویر بدون مالیات منابع سنگین خوب هستند. بنابراین، کاربران فایرفاکس باید توضیحات تصویر (ابتدا در فایل های PDF) را حتی در دستگاه های کم قدرت دریافت کنند. با توجه به پست وبلاگ، مدل های کوچک می توانند متن جایگزین با بیش از 200 میلیون پارامتر ایجاد کنند در حالی که کمتر از 200 مگابایت فضای دیسک را اشغال می کنند و در عرض چند ثانیه خروجی ارائه می کنند.
آنها در مقایسه با ماستودون های مدرن LLM، مانند آخرین GPT-4o، جزئیات و دقت کمتری دارند، اما توسعه دهندگان نمی خواهند کاربران را با اطلاعات بیش از حد غرق کنند. استفاده از مدل محلی مزایای متعددی دارد. علاوه بر حفظ حریم خصوصی بهبود یافته (تصاویر برای پردازش به جایی نمی رسند)، کاربران بهره وری منابع بهتر، شفافیت بیشتر، انتشار کمتر CO2 (آموزش مدل های بزرگ انتشار کربن زیادی ایجاد می کند) و به روز رسانی های مکرر با پیشرفت های منظم دریافت می کنند.