مایکروسافت از انتشار Text to Speech Avatar در سرویس آژور خبر داد

شهریور ۲, ۱۴۰۳

0 زمان مطالعه یک دقیقه

سرویس Azure AI Speech به توسعه‌دهندگان امکان می‌دهد تا برنامه‌های کاربردی هوش مصنوعی چندزبانه و تولیدی با قابلیت‌های صوتی و پشتیبانی از صداهای طبیعی را توسعه دهند. قابلیت جدید Text to Speech Avatar در سرویس Azure AI Speech، امکان تبدیل متن ساده به ویدیویی با حضور یک انسان واقعی که با صدای طبیعی صحبت کرده را فراهم می‌کند.

توسعه‌دهندگان می‌توانند از آواتارهای پیش‌ساخته موجود در این سرویس استفاده کنند یا آواتارهای سفارشی خود را بسازند. امروز، مایکروسافت از دسترسی عمومی به قابلیت Text to Speech Avatar خبر داد. این ویژگی جدید به توسعه‌دهندگان امکان می‌دهد تا محتوای سفارشی و جذابی برای کاربرانشان خلق کنند. ویدئوی تولیدی این سرویس با کیفیت 1920×1080 و نرخ 25 فریم در ثانیه خواهد بود. آواتار متن به گفتار Azure دارای قابلیت‌های زیر است:

متن را به ویدیوی دیجیتالی تبدیل می‌کند که در آن یک انسان فوتورئالیستی با استفاده از تکنولوژی تبدیل متن به گفتار هوش مصنوعی Azure با صدایی طبیعی صحبت می‌کند.
مجموعه ای از آواتارهای از پیش ساخته شده را ارائه می دهد.
صدای آواتار توسط متن به گفتار هوش مصنوعی Azure تولید می شود.
ویدیوی آواتار، متن را به گفتار تبدیل می‌کند و این کار را به صورت ناهمزمان با استفاده از API سنتز دسته‌ای یا آنی انجام می‌دهد.
ابزاری برای ایجاد محتوا در Speech Studio برای ایجاد محتوای ویدیویی بدون کدنویسی ارائه می دهد.
گفتگوهای آواتار بلادرنگ را از طریق ابزار چت زنده در Speech Studio فعال می کند.

تعیین قیمت برای سرویس آواتار تبدیل متن به گفتار می‌تواند کمی پیچیده باشد. همانطور که انتظار می‌رود، هزینه‌ها بر اساس طول ویدیوی خروجی محاسبه شده و به ازای هر ثانیه صورت‌حساب می‌شوند. علاوه بر این، سرویس‌های تبدیل متن به گفتار، گفتار به متن، Azure OpenAI و سایر سرویس‌های Azure که در راه‌حل سرویس آواتار تبدیل متن به گفتار به کار می‌روند، به صورت جداگانه صورت‌حساب می‌شوند. این سرویس در حال حاضر در مناطق Azure نظیر جنوب شرقی آسیا، شمال اروپا، غرب اروپا، سوئد، آمریکت قابل دسترس است.

شهریور ۲, ۱۴۰۳

0 زمان مطالعه یک دقیقه

نمایش بیشتر

مایکروسافت از انتشار Text to Speech Avatar در سرویس آژور خبر داد

دیدگاهتان را بنویسید لغو پاسخ

در کانال‌های واتس‌اپ با ویژگی جدید رونویسی صوتی و قابلیت‌های بیشتر به‌روز باشید

مدیاتک از نسخه پلاس تراشه دایمنسیتی 9400 رونمایی کرد

ویوو V50e معرفی شد

اوپو Find X8 Ultra با دوربین‌های پریسکوپی دوگانه بهبود یافته معرفی شد

انتشار دومین نسخه بتای اندروید 16 برای OnePlus 13

OpenAI طرحی برای ایجاد معیارهای سفارشی هوش مصنوعی در صنعت راه اندازی کرد

در کانال‌های واتس‌اپ با ویژگی جدید رونویسی صوتی و قابلیت‌های بیشتر به‌روز باشید

مدیاتک از نسخه پلاس تراشه دایمنسیتی 9400 رونمایی کرد

نوکیا T20 آپدیت اندروید 13 را دریافت کرد

SK hynix از حافظه GDDR7 رونمایی کرد

نوشته های مشابه

در کانال‌های واتس‌اپ با ویژگی جدید رونویسی صوتی و قابلیت‌های بیشتر به‌روز باشید

کاربران می توانند به زودی ریلز اینستاگرام را پشت یک کد مخفی قفل کنند

ادغام سامسونگ Health با پلتفرم SmartThings و پشتیبانی از دستگاه‌های جدید

اینستاگرام احتمالا یک اپلیکیشن رسمی برای آیپد منتشر می کند

دیدگاهتان را بنویسید لغو پاسخ

در کانال‌های واتس‌اپ با ویژگی جدید رونویسی صوتی و قابلیت‌های بیشتر به‌روز باشید

مدیاتک از نسخه پلاس تراشه دایمنسیتی 9400 رونمایی کرد

نوکیا T20 آپدیت اندروید 13 را دریافت کرد

SK hynix از حافظه GDDR7 رونمایی کرد