مایکروسافت از انتشار Text to Speech Avatar در سرویس آژور خبر داد
سرویس Azure AI Speech به توسعهدهندگان امکان میدهد تا برنامههای کاربردی هوش مصنوعی چندزبانه و تولیدی با قابلیتهای صوتی و پشتیبانی از صداهای طبیعی را توسعه دهند. قابلیت جدید Text to Speech Avatar در سرویس Azure AI Speech، امکان تبدیل متن ساده به ویدیویی با حضور یک انسان واقعی که با صدای طبیعی صحبت کرده را فراهم میکند.
توسعهدهندگان میتوانند از آواتارهای پیشساخته موجود در این سرویس استفاده کنند یا آواتارهای سفارشی خود را بسازند. امروز، مایکروسافت از دسترسی عمومی به قابلیت Text to Speech Avatar خبر داد. این ویژگی جدید به توسعهدهندگان امکان میدهد تا محتوای سفارشی و جذابی برای کاربرانشان خلق کنند. ویدئوی تولیدی این سرویس با کیفیت 1920×1080 و نرخ 25 فریم در ثانیه خواهد بود. آواتار متن به گفتار Azure دارای قابلیتهای زیر است:
- متن را به ویدیوی دیجیتالی تبدیل میکند که در آن یک انسان فوتورئالیستی با استفاده از تکنولوژی تبدیل متن به گفتار هوش مصنوعی Azure با صدایی طبیعی صحبت میکند.
- مجموعه ای از آواتارهای از پیش ساخته شده را ارائه می دهد.
- صدای آواتار توسط متن به گفتار هوش مصنوعی Azure تولید می شود.
- ویدیوی آواتار، متن را به گفتار تبدیل میکند و این کار را به صورت ناهمزمان با استفاده از API سنتز دستهای یا آنی انجام میدهد.
- ابزاری برای ایجاد محتوا در Speech Studio برای ایجاد محتوای ویدیویی بدون کدنویسی ارائه می دهد.
- گفتگوهای آواتار بلادرنگ را از طریق ابزار چت زنده در Speech Studio فعال می کند.
تعیین قیمت برای سرویس آواتار تبدیل متن به گفتار میتواند کمی پیچیده باشد. همانطور که انتظار میرود، هزینهها بر اساس طول ویدیوی خروجی محاسبه شده و به ازای هر ثانیه صورتحساب میشوند. علاوه بر این، سرویسهای تبدیل متن به گفتار، گفتار به متن، Azure OpenAI و سایر سرویسهای Azure که در راهحل سرویس آواتار تبدیل متن به گفتار به کار میروند، به صورت جداگانه صورتحساب میشوند. این سرویس در حال حاضر در مناطق Azure نظیر جنوب شرقی آسیا، شمال اروپا، غرب اروپا، سوئد، آمریکت قابل دسترس است.