طبق ادعای محققان آمازون، برای آموزش بزرگترین نسخه این مدل از ۱۰۰ هزار ساعت سخنرانی در بخش عمومی استفاده شده است.
محققان آمازون ادعا کردهاند که بزرگترین مدل هوش مصنوعی تبدیل متن به گفتار را آموزش دادهاند. این مدل جدید که BASE TTS نام دارد، با ۱۰۰ هزار ساعت اطلاعات صوتی آموزش داده شده است و با قابلیتهای بیسابقه خود، میتواند در بخش مدلهای تبدیل متن به صدا انقلابی ظاهر شود.
-
لپ تاپ ۱۵ اینچی لنوو مدل Ideapad S145 – C
خرید محصول -
محصول
اطلاعات بیشتر -
هودی مردانه ترک ویر مدل ۰۳۱ Camo Desert
۲۹۹,۰۰۰,۰۰۲,۹۹۰,۰۰۰,۰۴۹,۵۶۷,۷۳۹,۶۰۲,۳۵۱,۶۰۶,۲۴۷,۵۷۱,۸۱۲,۰۳۵,۴۸۷,۳۰۲,۶۳۲,۸۲۵,۵۴۴,۹۹۹,۷۷۹,۳۵۷,۴۱۹,۰۴۸,۷۴۶,۸۵۹,۴۱۱,۰۳۹,۷۷۱,۳۷۶,۵۵۳,۴۲۲,۳۴۲,۹۹۰,۳۰۲,۶۶۷,۱۳۷,۵۰۶,۵۸۶,۲۹۹,۷۷۱,۰۵۸,۳۱۳,۴۵۷,۹۵۲,۷۹۶,۰۴۷,۲۸۳,۹۷۶,۹۷۳,۷۰۰,۲۶۰,۸۷۲,۰۰۲,۹۰۱,۱۳۲,۰۳۴,۰۴۹,۸۷۸,۲۸۷,۸۱۶,۵۰۷,۱۶۳,۹۷۹,۵۸۴,۴۲۷,۱۶۷,۱۹۷,۱۱۹,۷۸۸,۶۹۸,۹۰۷,۱۲۷,۱۰۷,۶۶۸,۴۸۷,۹۶۲,۶۲۴ ﷼ خرید محصول -
ماگ سفری مدل سیمپل استایل گنجایش ۰.۵ لیتر
خرید محصول -
ساعت هوشمند اسمارت بیسون مدل SB-01
خرید محصول -
شامپو بدن جانسون مدل انار حجم ۷۵۰ میلی لیتر
خرید محصول -
لپ تاپ ۱۵ اینچی دل مدل LATITUDE 15 E5550 – C
خرید محصول -
اسکیت کفشی سبا مدل E3.80 Premium42
خرید محصول
مدل جدید آمازون Big Adaptive Streamable TTS با قابلیتهای نوظهور نام دارد که بهصورت مخفف و با عنوان BASE TTS شناخته میشود. برای آموزش بزرگترین نسخه این مدل از ۱۰۰ هزار ساعت سخنرانی در بخش عمومی استفاده شده که ۹۰ درصد آن به زبان انگلیسی و بخش دیگر به زبانهای آلمانی، هلند و اسپانیایی است.
این نسخه (BASE-large) با پشتیبانی از ۹۸۰ میلیون پارامتر، ظاهرا بزرگترین مدل در نوع خود محسوب میشود. همچنین این مدل اساساً یک تقلید کننده صدا نیست، بلکه با وجود ویژگیهای نوظهور خود میتواند حتی در صورت مواجهشدن با جملات پیچیده، در زمینه ارائه گفتار با صدای طبیعی، بهترین عملکرد را داشته باشد. آمازون همچنین مدلهای ۴۰۰ و ۱۵۰ پارامتری مدل خود را براساس ۱۰ هزار و ۱۰۰۰ ساعت صدا آموزش داده است.
نمونه تولیدشده توسط مدل هوش مصنوعی تبدیل متن به گفتار آمازون
در وبسایتی که برای این مدل ساخته شده است، چندین نمونه صدا وجود دارد که توسط این هوش مصنوعی براساس برخی متون دشوار ایجاد شده است.
باید به این نکته توجه داشت که این مدل هنوز در مرحله فرایند تجربی خود قرار دارد و برای اهداف تجاری یا موارد مشابه نمیتوان از آن استفاده کرد. در تحقیقات بعدی احتمالاً توضیحات بیشتری درباره تواناییهای نوظهوری و همچنین نحوه آموزش و استقرار مدل اعلام خواهد شد.
هرچند منابع و دادههای مورداستفاده در BASE TTS به دلایل امنیتی فاش نشده است، اما عملکرد چشمگیر این مدل نشانههای روشنی از پیشرفت بخش هوش مصنوعی است.