DeepSeek додає режим Vision, оскільки китайські чипи відповідають підтримці запуску

CryptoFrontier

DeepSeek, компанія з галанчжоу в галузі штучного інтелекту, додала можливості розпізнавання зображень і відео до свого основного чатбота через нову функцію «режим розпізнавання зображень», зрівнявшись із іншими провідними чатботами зі ШІ. Запуск збігся зі значущою віхою в ланцюгу постачання китайських чипів: чотири вітчизняні напівпровідникові компанії — Huawei Ascend, Cambricon, Hygon Information і Moore Threads — підтвердили підтримку у той самий день для нового флагманського модельного релізу DeepSeek, DeepSeek-V4, засвідчивши зсув від попередніх місячних періодів адаптації, що були типовими поза екосистемою Nvidia.

Бачення DeepSeek та розширення моделей

DeepSeek непомітно запустила режим розпізнавання зображень разом із двома іншими режимами, які з’явилися раніше цього місяця: «expert» і «flash». За словами Чен Сяоканґа, керівника мультимодальної команди DeepSeek, інструмент уперше протестували на невеликій групі користувачів як на вебсайті, так і в мобільному застосунку. Чен Делі, старший дослідник компанії, відсвяткував запуск дописом із посиланням на логотип компанії: «Маленький кит тепер може бачити».

Функція для зображень і відео надійшла через кілька днів після того, як DeepSeek випустила попередній перегляд DeepSeek-V4 і зробила ваги моделі доступними для публічного завантаження та використання. V4 має структуру з двох окремих моделей: DeepSeek-V4-Pro, що містить 1,6 трлн параметрів і призначена для складних міркувань та багатокрокових автоматизованих робочих процесів, і DeepSeek-V4-Flash, оптимізовану для обробки великих обсягів запитів із нижчою вартістю. Обидві моделі підтримують контекстне вікно в один мільйон токенів і використовують гібридний дизайн уваги, який компанія стверджує, що зменшує потреби в обчислювальній потужності та пам’яті під час інференсу.

Китайські виробники чипів досягли підтримки запуску в той самий день

Те, що привернуло увагу індустрії, — це було не лише сама модель, а й скоординована апаратна підтримка, продемонстрована в день релізу V4. Huawei Ascend підтвердила сумісність із її чипами A2, A3 та 950, причому Ascend 950 використовує злиті обчислювальні процеси та паралельні потоки обробки, щоб прискорити інференс як для V4-Pro, так і для V4-Flash. Cambricon завершила адаптацію, використавши відкритий фреймворк vLLM для інференсу, і опублікувала свій код на GitHub. Hygon Information виконала глибоку оптимізацію моделей на своїй платформі DCU, щоб забезпечити плавний перехід від релізу моделі до розгортання. Moore Threads співпрацювала з Пекінською академією штучного інтелекту, щоб запустити V4 на своїй карті MTT S5000, використовуючи програмний стек FlagOS.

Ця підтримка в той самий день на кількох наборах чипів є відхиленням від історичних патернів. Раніше апаратне забезпечення поза екосистемою Nvidia зазвичай потребувало місяців, щоб почати підтримувати важливі нові моделі. Спостерігачі ринку зазначають, що досягнення сумісності з чотирма різними вітчизняними чипсетами в день запуску свідчить про справжній зсув у зрілості китайської напівпровідникової та AI-інфраструктури.

Стратегічні наслідки: вартість і незалежність від ланцюгів постачання

Значущість загалом запуску DeepSeek виходить за межі окремих технічних досягнень. Дозволяючи V4 нативно працювати одночасно на кількох китайських чипах, DeepSeek знижує ризик залежності від експортних обмежень, які історично блокували китайські компанії від доступу до найпросунутіших американських процесорів. Ефективність за витратами залишається центральною в стратегії DeepSeek — компанія робила акцент на тому, щоб утримувати витрати на роботу моделей низькими, даючи бізнесам можливість будувати автоматизовані системи без непосильних обчислювальних витрат.

Спостерігачі ринку характеризують цей реліз як віддзеркалення того, що дозріває цілий ланцюг постачання, а не як окремий технічний прорив. Координація між DeepSeek, виробниками чипів і програмними фреймворками демонструє інтегрований розвиток екосистеми. Така траєкторія вказує, що конкурентний ландшафт у галузі AI зміщується: з акценту на досконалість окремих моделей до здатності підтримувати повні, економічні та незалежні системи в довгостроковій перспективі.

FAQ

Які нові можливості DeepSeek додав до свого чатбота? DeepSeek додав «режим розпізнавання зображень», який дозволяє його чатботу розуміти фото та відео, а не лише текст. Цю функцію вперше протестували на невеликій групі користувачів як на вебсайті, так і в мобільному застосунку, тож можливості DeepSeek стали узгоджені з іншими провідними чатботами зі ШІ, які пропонують подібні здібності.

Які китайські компанії з чипів підтримали DeepSeek-V4 у день запуску? Чотири китайські компанії з чипів підтвердили підтримку DeepSeek-V4 у день запуску: Huawei Ascend (with A2, A3, and 950 chips), Cambricon, Hygon Information і Moore Threads. Така сумісність у день запуску на кількох чипсетах раніше була рідкістю поза екосистемою Nvidia, зазвичай вимагаючи місяців робіт з адаптації.

Які існують дві версії DeepSeek-V4 і чим вони відрізняються? DeepSeek-V4-Pro має 1,6 трлн параметрів і призначена для складних міркувань та багатокрокових автоматизованих робочих процесів, тоді як DeepSeek-V4-Flash оптимізована для обробки великих обсягів запитів із нижчою вартістю. Обидві підтримують контекстне вікно в один мільйон токенів і використовують гібридний дизайн уваги, щоб зменшити потреби в обчислювальній потужності та пам’яті.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
RugProofRitavip
· 24хв. тому
Щойно спробував розпізнавання зображень, розуміння китайської дійсно краще, ніж у деякої компанії.
Переглянути оригіналвідповісти на0
ybaservip
· 1год тому
Тримайтеся міцно HODL💎 Тримайтеся міцно HODL💎
Переглянути оригіналвідповісти на0
GateUser-0b71fc11vip
· 2год тому
Від чистого тексту до мультимодальності — за півроку пройшли шлях, на який іншим потрібно два роки
Переглянути оригіналвідповісти на0
MirrorBallGazingAtTheSkyvip
· 2год тому
Не хвалися лише словами, чи вирішили проблему галюцинацій RAG?
Переглянути оригіналвідповісти на0
GateUser-ced0257avip
· 2год тому
Розпізнавання відео? Прошу оцінити стабільність у складних сценаріях
Переглянути оригіналвідповісти на0
GateUser-8f9ccfecvip
· 2год тому
Це час публікації вийшов ідеальним, якраз підхоплює тренд на чіпи
Переглянути оригіналвідповісти на0
GateUser-cb789e81vip
· 2год тому
Зниження витрат — це справжнє мистецтво, чекати ціну API
Переглянути оригіналвідповісти на0
GasFeeAnxietyvip
· 2год тому
Останнє питання: коли відкриють для безкоштовних користувачів?
Переглянути оригіналвідповісти на0
GateUser-f78f1f3evip
· 2год тому
Мільстони чіпів + оновлення функцій, дві радісні новини?
Переглянути оригіналвідповісти на0
GateUser-06596f3bvip
· 2год тому
На мультимодальному треку наразі немає цієї функції, вибачте, не виходьте з дому
Переглянути оригіналвідповісти на0
Дізнатися більше