
Borna – گروه علوم و فناوری: یک استارتاپ آمریکایی یک فناوری هوش مصنوعی جدید را فاش کرده است که می تواند فقط در دو ثانیه صدای هر دقت بالایی را شبیه سازی کند.
یک استارتاپ آمریکایی به نام Zyphra از نامه جدیدی به مدل TTS رونمایی کرد که می تواند فقط در پنج ثانیه صدای مردم را شبیه سازی کند.
این استارتاپ که در سال ششم توسط دنی مارتینلی و کرت توتات تأسیس شد ، در ابتدا شروع به کار با هدف توسعه یک سیستم عامل چند طبقه به نام Maiaos کرد. تلاش های این شرکت منجر به معرفی مدل های کوچک زبان زامبا و مدل های تحول متن -به -zonos شده است.
ویژگی های سبک مناطق منظم:
این مدل ها حاوی ۱.۵ میلیارد معلم هستند و با ۷۰۰۰ ساعت داده گفتار آموزش دیده اند. این داده ها شامل تن های خنثی مانند خواندن کتاب های صوتی و لحن های مختلف عاطفی است. داده های اصلی آموزشی این مدل به زبان انگلیسی بود ، اما طیف گسترده ای از زبانهای چینی ، ژاپنی ، فرانسوی ، اسپانیایی و آلمانی در فرایند یادگیری استفاده شد.
به گفته زیفرا ، اطلاعاتی که برای آموزش این مدل های منابع آنلاین استفاده می شود جمع آوری و از کارگزاران داده خریداری نشده است. این مدل ها عملکرد مشابهی برای تبدیل سایر هوش مصنوعی به گفتار دارند و می توانند در زمینه های مختلفی مانند دوبله ، تولید محتوا و دستیاران صدا استفاده شوند.
پایان پیام/

Borna – گروه علوم و فناوری: یک استارتاپ آمریکایی یک فناوری هوش مصنوعی جدید را فاش کرده است که می تواند فقط در دو ثانیه صدای هر دقت بالایی را شبیه سازی کند.
یک استارتاپ آمریکایی به نام Zyphra از نامه جدیدی به مدل TTS رونمایی کرد که می تواند فقط در پنج ثانیه صدای مردم را شبیه سازی کند.
این استارتاپ که در سال ششم توسط دنی مارتینلی و کرت توتات تأسیس شد ، در ابتدا شروع به کار با هدف توسعه یک سیستم عامل چند طبقه به نام Maiaos کرد. تلاش های این شرکت منجر به معرفی مدل های کوچک زبان زامبا و مدل های تحول متن -به -zonos شده است.
ویژگی های سبک مناطق منظم:
این مدل ها حاوی ۱.۵ میلیارد معلم هستند و با ۷۰۰۰ ساعت داده گفتار آموزش دیده اند. این داده ها شامل تن های خنثی مانند خواندن کتاب های صوتی و لحن های مختلف عاطفی است. داده های اصلی آموزشی این مدل به زبان انگلیسی بود ، اما طیف گسترده ای از زبانهای چینی ، ژاپنی ، فرانسوی ، اسپانیایی و آلمانی در فرایند یادگیری استفاده شد.
به گفته زیفرا ، اطلاعاتی که برای آموزش این مدل های منابع آنلاین استفاده می شود جمع آوری و از کارگزاران داده خریداری نشده است. این مدل ها عملکرد مشابهی برای تبدیل سایر هوش مصنوعی به گفتار دارند و می توانند در زمینه های مختلفی مانند دوبله ، تولید محتوا و دستیاران صدا استفاده شوند.
پایان پیام/