Alibaba Qwen3.5-Omni представила мультимодальну модель Qwen3.5-Omni, що підтримує 113 видів розпізнавання голосу

Оновлення Gate News, 30 березня, Alibaba Qianwen оголосила про запуск мультимодальної великої моделі Qwen3.5-Omni. Ця серія включає інструктивні версії трьох розмірів: Plus, Flash і Light; підтримує контекст довжиною 256k; модель здатна обробляти понад 10 годин аудіовхідних даних і понад 400 секунд відео та аудіо у форматі 720P (1FPS). Модель проходить нативне мультимодальне переднавчання на величезних обсягах текстових, візуальних та понад 100 мільйонів годин аудіо-відеоданих, демонструючи видатні можливості сприйняття та генерації у всіх модальностях. У порівнянні з попередньою моделлю Qwen3-Omni, Qwen3.5-Omni значно покращила багатомовні можливості: вона підтримує розпізнавання мов і діалектів 113 мов і діалектів, а також генерацію мов і діалектів 36 мов і діалектів.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів