هوش مصنوعی

معرفی Nova Act: ایجنت هوش مصنوعی آمازون که می‌تواند مرورگر وب را کنترل کند

آمازون از Nova Act، یک عامل هوش مصنوعی عمومی رونمایی کرد که می‌تواند کنترل مرورگر وب را به دست بگیرد و به‌طور مستقل برخی اقدامات ساده را انجام دهد. همراه با این مدل هوش مصنوعی، آمازون مجموعه‌ابزار Nova Act SDK را نیز معرفی کرده که به توسعه‌دهندگان امکان ساخت نمونه‌های اولیه عوامل هوش مصنوعی را می‌دهد.

Nova Act که توسط آزمایشگاه AGI آمازون مستقر در سان فرانسیسکو توسعه یافته، همچنین ویژگی‌های کلیدی نسخه جدید الکسا پلاس، نسخه‌ای تقویت‌شده با هوش مصنوعی مولد از دستیار صوتی محبوب آمازون را تامین خواهد کرد. نسخه‌ی فعلی Nova Act که امروز عرضه شده، هنوز در مرحله پیش‌نمایش تحقیقاتی قرار دارد و ممکن است به اندازه نسخه نهایی صیقل داده نشده باشد.

توسعه‌دهندگان می‌توانند از ابزار Nova Act در وب‌سایت جدیدی با آدرس nova.amazon.com استفاده کنند. این وب‌سایت همچنین محلی برای نمایش مدل‌های بنیادین مختلف Nova است. Nova Act تلاش ایمازون برای رقابت با محصولات مشابه مانند Operator از OpenAI و Computer Use از Anthropic در حوزه فناوری ایجنت هوش مصنوعی عمومی است. بسیاری از شرکت‌های فناوری پیشرو بر این باورند که ایجنت های هوش مصنوعی که می‌توانند وب را به جای کاربران پیمایش کنند، می‌توانند چت‌بات‌های هوش مصنوعی امروزی را بسیار کارآمدتر کنند.

آمازون شاید اولین شرکتی نباشد که چنین فناوری را توسعه می‌دهد، اما از طریق Alexa+ ممکن است به گسترده‌ترین دامنه کاربران دست یابد. به گفته آمازون، توسعه‌دهندگانی که از Nova Act SDK استفاده می‌کنند، باید بتوانند اقدامات ساده‌ای مانند سفارش سالاد یا رزرو شام را به طور خودکار انجام دهند. با استفاده از این مجموعه‌ابزار، توسعه‌دهندگان می‌توانند ابزارهایی برای عوامل هوش مصنوعی بسازند که بتوانند صفحات وب را پیمایش کنند، فرم‌ها را پر کنند یا تاریخ‌ها را در یک تقویم انتخاب کنند.

آمازون ادعا می‌کند که Nova Act در برخی آزمایش‌های داخلی شرکت، نسبت به عوامل هوش مصنوعی OpenAI و Anthropic عملکرد بهتری داشته است. به عنوان مثال، در آزمون ScreenSpot Web Text که نحوه تعامل عامل هوش مصنوعی با متن در صفحه را ارزیابی می‌کند، Nova Act امتیاز 94 درصد کسب کرده و از CUA از OpenAI (با امتیاز 88 درصد) و Claude 3.7 Sonnet از Anthropic (با امتیاز 90 درصد) پیشی گرفته است.

با این حال، ایمازون Nova Act را با استفاده از ارزیابی‌های رایج‌تر، مانند WebVoyager، مورد آزمایش قرار نداده است. Nova Act اولین محصول عمومی است که از آزمایشگاه AGI ایمازون، که پیش‌تر اشاره شد، بیرون آمده است. این ابتکار توسط پژوهشگران سابق OpenAI، دیوید لوآن و پیتر آبیل، که هر دو پیش‌تر استارت‌آپ‌های خود را تأسیس کرده بودند (لوآن Adept را آغاز کرد و آبیل Covariant را بنیان‌گذاری کرد)، هدایت می‌شود. ایمازون سال گذشته آن‌ها را استخدام کرد تا تلاش‌هایش در زمینه عوامل هوش مصنوعی را هدایت کنند.

اگرچه ممکن است عجیب به نظر برسد که یک آزمایشگاه AGI در حال ساخت ایجنت هایی است که توانایی سفارش سالاد دارند، لوآن در گفتگو با TechCrunch، اشاره کرد که او ایجنت های را به عنوان یک گام کلیدی در مسیر ایجاد سیستم‌های هوش مصنوعی فوق‌هوشمند می‌بیند. لوآن AGI را به عنوان “سیستم هوش مصنوعی‌ که می‌تواند به شما در انجام هر کاری که یک انسان روی کامپیوتر انجام می‌دهد کمک کند” تعریف می‌کند.

به گفته لوآن، تیم او Nova Act SDK را طوری طراحی کرده که وظایف کوتاه و ساده را به طور قابل اعتماد خودکار کند و ابزارهایی برای توسعه‌دهندگان فراهم کند تا دقیقا مشخص کنند چه زمانی می‌خواهند انسان در جریان کاری عامل مداخله کند. او امیدوار است این مجموعه‌ابزار به توسعه‌دهندگان امکان دهد برنامه‌های عامل قابل اعتماد‌تری ایجاد کنند، هرچند که نه لزوما به طور کاملا خودمختار.

آمازون اولین عامل هوش مصنوعی عمومی خود را در یک فضای پرجمعیت منتشر می‌کند، اما این فناوری حیاتی است که شرکت سرمایه‌گذاری زیادی روی آن کرده است. آزمایش‌های اولیه Nova Act می‌تواند تصویری از برخی قابلیت‌های نسخه‌ی طولانی مدت به تعویق افتاده‌ی Alexa+ ارائه دهد، لحظه‌ای تعیین‌کننده برای تلاش‌های هوش مصنوعی آمازون.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا