آمازون در حال توسعه بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار است

طبق ادعای محققان آمازون، برای آموزش بزرگ‌ترین نسخه این مدل از ۱۰۰ هزار ساعت سخنرانی در بخش عمومی استفاده شده است.

محققان آمازون ادعا کرده‌اند که بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار را آموزش داده‌اند. این مدل جدید که BASE TTS نام دارد، با ۱۰۰ هزار ساعت اطلاعات صوتی آموزش داده شده است و با قابلیت‌های بی‌سابقه خود، می‌تواند در بخش مدل‌های تبدیل متن به صدا انقلابی ظاهر شود.

محصولات بخش فروشگاه

پیچ ام دی اف مدل ۴×۵۰ بسته ۵۰۰ عددی
۱۷۳,۰۰۰ ﷼ انتخاب گزینه‌ها این محصول دارای انواع مختلفی می باشد. گزینه ها ممکن است در صفحه محصول انتخاب شوند
دستگاه ضد عفونی کننده دست کد SA002
خرید محصول
کوله پشتی ورزشی پوما مدل ۰۷۷۱۶۲-۰۶
خرید محصول
نیم تنه ورزشی زنانه ماییلدا مدل بدون فنر کد ۴۰۶۲-۶۰۱۵ رنگ مشکی
۱,۴۱۹,۰۰۰ ﷼ خرید محصول
اتوماتیک راهنما موتور سیکلت رعد نو کد ۰۰۳
اطلاعات بیشتر
ساعت مچی عقربه‌ای مردانه سیکو مدل SRPF24K1S
خرید محصول
کوله پشتی سفری نشنال جئوگرافیک مدل N 14222
۵,۵۰۰,۰۰۰ ﷼ انتخاب گزینه‌ها این محصول دارای انواع مختلفی می باشد. گزینه ها ممکن است در صفحه محصول انتخاب شوند
مچ بند هوشمند مدل Mi band6
اطلاعات بیشتر

مدل جدید آمازون Big Adaptive Streamable TTS با قابلیت‌های نوظهور نام دارد که به‌صورت مخفف و با عنوان BASE TTS شناخته می‌شود. برای آموزش بزرگ‌ترین نسخه این مدل از ۱۰۰ هزار ساعت سخنرانی در بخش عمومی استفاده شده که ۹۰ درصد آن به زبان انگلیسی و بخش دیگر به زبان‌های آلمانی، هلند و اسپانیایی است.

این نسخه (BASE-large) با پشتیبانی از ۹۸۰ میلیون پارامتر، ظاهرا بزرگ‌ترین مدل در نوع خود محسوب می‌شود. همچنین این مدل اساساً یک تقلید کننده صدا نیست، بلکه با وجود ویژگی‌های نوظهور خود می‌تواند حتی در صورت مواجه‌شدن با جملات پیچیده، در زمینه ارائه گفتار با صدای طبیعی، بهترین عملکرد را داشته باشد. آمازون همچنین مدل‌های ۴۰۰ و ۱۵۰ پارامتری مدل خود را براساس ۱۰ هزار و ۱۰۰۰ ساعت صدا آموزش داده است.

نمونه تولید‌شده توسط مدل هوش مصنوعی تبدیل متن به گفتار آمازون
در وب‌سایتی که برای این مدل ساخته شده است، چندین نمونه صدا وجود دارد که توسط این هوش مصنوعی براساس برخی متون دشوار ایجاد شده است.

باید به این نکته توجه داشت که این مدل هنوز در مرحله فرایند تجربی خود قرار دارد و برای اهداف تجاری یا موارد مشابه نمی‌توان از آن استفاده کرد. در تحقیقات بعدی احتمالاً توضیحات بیشتری درباره توانایی‌های نوظهوری و همچنین نحوه آموزش و استقرار مدل اعلام خواهد شد.

هرچند منابع و داده‌های مورداستفاده در BASE TTS به دلایل امنیتی فاش نشده است، اما عملکرد چشمگیر این مدل نشانه‌های روشنی از پیشرفت بخش هوش مصنوعی است.

آمازون در حال توسعه بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار است

پیچ ام دی اف مدل ۴×۵۰ بسته ۵۰۰ عددی

دستگاه ضد عفونی کننده دست کد SA002

کوله پشتی ورزشی پوما مدل ۰۷۷۱۶۲-۰۶

نیم تنه ورزشی زنانه ماییلدا مدل بدون فنر کد ۴۰۶۲-۶۰۱۵ رنگ مشکی

اتوماتیک راهنما موتور سیکلت رعد نو کد ۰۰۳

ساعت مچی عقربه‌ای مردانه سیکو مدل SRPF24K1S

کوله پشتی سفری نشنال جئوگرافیک مدل N 14222

مچ بند هوشمند مدل Mi band6

دیدگاهتان را بنویسید لغو پاسخ

این کارت حافظه کوچک ۴ ترابایت ظرفیت ذخیره‌سازی دارد

بازی/ Age of 2048؛ بزرگ‌ترین تمدن جهان را بسازید

برای شرکت‌های هوش مصنوعی اینترنت «بیش‌از‌حد کوچک» است

بازی/ Hide.io؛ از چشم بقیه پنهان شوید

با ماسک هوشمند سامسونگ دیگر نگران آلودگی هوا نباشید

بازی/ Agent Dash؛ سکه‌ها را جمع کنید

تراشه اسنپدراگون X Elite پرچم‌داران اینتل و AMD را شکست داد

بازی/ Looney Tunes؛ شهری بزرگ بسازید

سرعت دانلود این گوشی چینی، مغز شما را منفجر می‌کند

بازی/ Pastel Friends؛ آواتارها را به سلیقه خود طراحی کنید

این کارت حافظه کوچک ۴ ترابایت ظرفیت ذخیره‌سازی دارد

بازی/ Age of 2048؛ بزرگ‌ترین تمدن جهان را بسازید

برای شرکت‌های هوش مصنوعی اینترنت «بیش‌از‌حد کوچک» است

سوالات و پشتیبانی