
معرفی Nova Act: ایجنت هوش مصنوعی آمازون که میتواند مرورگر وب را کنترل کند
آمازون از Nova Act، یک عامل هوش مصنوعی عمومی رونمایی کرد که میتواند کنترل مرورگر وب را به دست بگیرد و بهطور مستقل برخی اقدامات ساده را انجام دهد. همراه با این مدل هوش مصنوعی، آمازون مجموعهابزار Nova Act SDK را نیز معرفی کرده که به توسعهدهندگان امکان ساخت نمونههای اولیه عوامل هوش مصنوعی را میدهد.
Nova Act که توسط آزمایشگاه AGI آمازون مستقر در سان فرانسیسکو توسعه یافته، همچنین ویژگیهای کلیدی نسخه جدید الکسا پلاس، نسخهای تقویتشده با هوش مصنوعی مولد از دستیار صوتی محبوب آمازون را تامین خواهد کرد. نسخهی فعلی Nova Act که امروز عرضه شده، هنوز در مرحله پیشنمایش تحقیقاتی قرار دارد و ممکن است به اندازه نسخه نهایی صیقل داده نشده باشد.
توسعهدهندگان میتوانند از ابزار Nova Act در وبسایت جدیدی با آدرس nova.amazon.com استفاده کنند. این وبسایت همچنین محلی برای نمایش مدلهای بنیادین مختلف Nova است. Nova Act تلاش ایمازون برای رقابت با محصولات مشابه مانند Operator از OpenAI و Computer Use از Anthropic در حوزه فناوری ایجنت هوش مصنوعی عمومی است. بسیاری از شرکتهای فناوری پیشرو بر این باورند که ایجنت های هوش مصنوعی که میتوانند وب را به جای کاربران پیمایش کنند، میتوانند چتباتهای هوش مصنوعی امروزی را بسیار کارآمدتر کنند.
آمازون شاید اولین شرکتی نباشد که چنین فناوری را توسعه میدهد، اما از طریق Alexa+ ممکن است به گستردهترین دامنه کاربران دست یابد. به گفته آمازون، توسعهدهندگانی که از Nova Act SDK استفاده میکنند، باید بتوانند اقدامات سادهای مانند سفارش سالاد یا رزرو شام را به طور خودکار انجام دهند. با استفاده از این مجموعهابزار، توسعهدهندگان میتوانند ابزارهایی برای عوامل هوش مصنوعی بسازند که بتوانند صفحات وب را پیمایش کنند، فرمها را پر کنند یا تاریخها را در یک تقویم انتخاب کنند.
آمازون ادعا میکند که Nova Act در برخی آزمایشهای داخلی شرکت، نسبت به عوامل هوش مصنوعی OpenAI و Anthropic عملکرد بهتری داشته است. به عنوان مثال، در آزمون ScreenSpot Web Text که نحوه تعامل عامل هوش مصنوعی با متن در صفحه را ارزیابی میکند، Nova Act امتیاز 94 درصد کسب کرده و از CUA از OpenAI (با امتیاز 88 درصد) و Claude 3.7 Sonnet از Anthropic (با امتیاز 90 درصد) پیشی گرفته است.
با این حال، ایمازون Nova Act را با استفاده از ارزیابیهای رایجتر، مانند WebVoyager، مورد آزمایش قرار نداده است. Nova Act اولین محصول عمومی است که از آزمایشگاه AGI ایمازون، که پیشتر اشاره شد، بیرون آمده است. این ابتکار توسط پژوهشگران سابق OpenAI، دیوید لوآن و پیتر آبیل، که هر دو پیشتر استارتآپهای خود را تأسیس کرده بودند (لوآن Adept را آغاز کرد و آبیل Covariant را بنیانگذاری کرد)، هدایت میشود. ایمازون سال گذشته آنها را استخدام کرد تا تلاشهایش در زمینه عوامل هوش مصنوعی را هدایت کنند.
اگرچه ممکن است عجیب به نظر برسد که یک آزمایشگاه AGI در حال ساخت ایجنت هایی است که توانایی سفارش سالاد دارند، لوآن در گفتگو با TechCrunch، اشاره کرد که او ایجنت های را به عنوان یک گام کلیدی در مسیر ایجاد سیستمهای هوش مصنوعی فوقهوشمند میبیند. لوآن AGI را به عنوان “سیستم هوش مصنوعی که میتواند به شما در انجام هر کاری که یک انسان روی کامپیوتر انجام میدهد کمک کند” تعریف میکند.
به گفته لوآن، تیم او Nova Act SDK را طوری طراحی کرده که وظایف کوتاه و ساده را به طور قابل اعتماد خودکار کند و ابزارهایی برای توسعهدهندگان فراهم کند تا دقیقا مشخص کنند چه زمانی میخواهند انسان در جریان کاری عامل مداخله کند. او امیدوار است این مجموعهابزار به توسعهدهندگان امکان دهد برنامههای عامل قابل اعتمادتری ایجاد کنند، هرچند که نه لزوما به طور کاملا خودمختار.
آمازون اولین عامل هوش مصنوعی عمومی خود را در یک فضای پرجمعیت منتشر میکند، اما این فناوری حیاتی است که شرکت سرمایهگذاری زیادی روی آن کرده است. آزمایشهای اولیه Nova Act میتواند تصویری از برخی قابلیتهای نسخهی طولانی مدت به تعویق افتادهی Alexa+ ارائه دهد، لحظهای تعیینکننده برای تلاشهای هوش مصنوعی آمازون.