Xiaomi відкриває вихідний код OmniVoice: модель клонування голосу з можливістю нульового прикладу, що підтримує 646 мов

За Beating, AI Lab Kaldi від Xiaomi відкрила вихідний код OmniVoice — моделі TTS для клонування голосу без прикладів (zero-shot), що підтримує 646 мов. Модель відтворює характеристики голосу лише за кілька секунд референсного аудіо та працює між мовами: один і той самий голос може синтезувати мовлення китайською, японською, корейською та іншими мовами. Увесь код, ваги та навчальні дані відкриті під ліцензією Apache-2.0.

OmniVoice використовує спрощену архітектуру з одним двонапрямним Transformer, який безпосередньо перетворює текст на дискретні акустичні токени, досягаючи в PyTorch інференсу в 40 разів швидшого за real-time. Навчена на 580 000 годинах аудіо з 50 відкритих наборів даних, OmniVoice продемонструвала перевагу над комерційними системами в голосовій схожості та розбірливості на 24 протестованих мовах і відповідала або перевершувала людські записи в 102 мовах.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

TCV очолює серію B $160M для стартапу Corgi Insurance

Corgi, американський стартап зі страхування бізнесу, 6 травня оголосив, що залучив 160 мільйонів доларів у раунді Series B під керівництвом TCV за оцінки в 1,3 мільярда доларів, повідомляє TechCrunch. Раунд також включав Kindred Ventures, Leblon Capital і First Order Fund. Це збільшує загальне фінансування Corgi до 268

CryptoFrontier7год тому

B.AI перевищує 1,7 мільйона користувачів станом на 7 травня та запускає програму винагород

За даними B.AI, платформа інфраструктури ШІ перевищила 1,7 мільйона користувачів 7 травня. Платформа, яка фокусується на захисті приватності та інфраструктурі agent economy, надає новим користувачам 500 тис. безкоштовних кредитів після реєстрації, ціновий націн без надбавок для всіх моделей і обмежену в часі 1:1

GateNews7год тому

Osome скорочує 70+ ролей і підвищує EBITDA на 50% завдяки переходу на AI

За даними Tech in Asia, сингапурська платформа корпоративного менеджменту Osome скоротила понад 70 посад за останні два роки, упровадивши ШІ для виконання задач із комплаєнсу, зокрема для фіксації транзакцій і обробки рахунків-фактур. Генеральний директор Еудженіо Ферранте заявив, що компанія пожертвувала повільнішим зростанням доходів i

GateNews10год тому

Schneider Electric цього року відкриє навчальний хаб для Південно-Східної Азії в Малайзії, інструменти на основі ШІ скоротять споживання енергії на 2%-3%

За даними Reuters, Schneider Electric планує цього року відкрити навчальний центр для Південно-Східної Азії в Малайзії, щоб реагувати на зростання попиту на електроенергію через розширення інфраструктури для ШІ в регіоні. Центр навчать партнерів і клієнтів системам енергоменеджменту та обладнанню для дата-центрів. Schneider'

GateNews10год тому

Hut 8 підписала угоду на 9,8 мільярда доларів США щодо AI дата-центру, 15-річний довгостроковий контракт; акції на передринкових торгах злетіли на 36%

Hut 8 оголосила про оренду першої черги 352 МВт у дата-центрі Beacon Point потужністю 1 ГВт у штаті Делавер: договір на 15 років, базова вартість 9,8 мільярда доларів США, із щорічним приростом 3% та трьома варіантами подовження на 5 років; якщо всі умови буде виконано, вартість контракту може сягнути близько 25,1 мільярда доларів. Орендарем є клієнт із високим інвестиційним рейтингом, назва ще не розголошена. Ця угода демонструє, що Hut 8 переходить від майнінгу до компанії з побудови AI-інфраструктури: Beacon Point використовує архітектуру NVIDIA DSX, початкова потужність — 352 МВт, очікується, що електропостачання запрацює у 2027 році в Q1, а здача першої черги залів відбудеться у Q3; на майданчику передбачена можливість розширення до 1 ГВт.

ChainNewsAbmedia20год тому

Core Scientific купує майнінг-ферму біткоїн-майнер Polaris за 421 млн доларів, розширює операції AI дата-центру

За даними The Block, Core Scientific сьогодні (6 травня) придбала Polaris DS LLC приблизно за 421 мільйон доларів, уклавши контракт на 440 мегават потужності з Oklahoma Gas & Electric, щоб розширити свій бізнес із хостингу для ШІ та високопродуктивних обчислень. Об’єкт Polaris, розташований в Оклахомі та

GateNews20год тому
Прокоментувати
0/400
Немає коментарів