DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости

Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode полностью поддерживают модели серии DeepSeek V4 благодаря тесному сотрудничеству между технологиями чипа и модели.

Ascend 950 обеспечивает развертывание инференса моделей DeepSeek V4 с высокой пропускной способностью и низкой задержкой за счет методов склеивания ядер и параллелизма в несколько потоков, чтобы снизить накладные расходы на вычисления Attention и обращения к памяти. Для DeepSeek V4-Pro с входом 8K Ascend 950 достигает примерно 20ms TPOT при 4,700 TPS на одно устройство в режиме Decode; для DeepSeek V4-Flash при входе до 8K он достигает примерно 10ms TPOT при пропускной способности 1,600 TPS. Серия Ascend A3 supernode также обеспечивает полную совместимость: предоставлены эталонные реализации для быстрого дообучения. На основе supernode Ascend A3 из 64 карт с большим режимом EP DeepSeek V4-Flash достигает более 2,000 TPS на одну карту в режиме Decode в сценариях вход-выход 8K/1K, используя движок инференса vLLM. Полные линейки продуктов Huawei Ascend A2, A3 и 950 поддерживают как DeepSeek V4-Flash, так и V4-Pro.

Huawei Cloud объявила о совместимости с DeepSeek V4 для самых первых, предоставив разработчикам сервисы API token в один клик через свою платформу MaaS. Huawei Cloud оптимизировала возможности системного уровня, уровня операторов и уровня кластера, чтобы обеспечить быструю адаптацию моделей и высокопроизводительное развертывание. Компании, включая Kingsoft WPS и 360, уже интегрировали новую модель DeepSeek через Huawei Cloud.

Cambricon также объявила о совместимости Day 0 с DeepSeek V4-Flash и V4-Pro на основе фреймворка инференса vLLM, а код адаптации был с открытым исходным кодом опубликован для сообщества GitHub. Ранее Cambricon уже достигла совместимости для самых первых при выпуске DeepSeek V3.2 в прошлом году: она провела глубокую оптимизацию совместной производительности ПО и оборудования на моделях серии DeepSeek.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Google планирует инвестировать до $40 Billion в Anthropic, обещает 5+ гигаватт вычислительных мощностей

Сообщение Gate News, 24 апреля — Согласно рыночным источникам, Google планирует инвестировать в Anthropic до $40 миллиарда. Инвестиции начнутся с первоначальных $10 миллиарда наличными, а затем последуют до дополнительных $30 миллиарда в зависимости от достижения указанных вех. Google также предоставит Anthropic не менее 5 гигаватт вычислительных мощностей в рамках партнерства.

GateNews13м назад

Швейцарский регулятор FINMA предупреждает, что инструмент ИИ Anthropic Mythos несет финансовые риски

Сообщение Gate News, 24 апреля — Финансовый надзорный орган Швейцарии (FINMA) заявил, что разрешение банкам быстро и удобно внедрять инструмент искусственного интеллекта Mythos от Anthropic будет создавать серьезные риски для

GateNews36м назад

Fere AI завершает раунд финансирования на $1,3 млн под руководством Ethereal Ventures

Сообщение Gate News, 24 апреля — Fere AI, платформа для торговых агентов цифровыми активами с применением ИИ, объявила о завершении раунда финансирования на $1,3 млн, который возглавила Ethereal Ventures; в нем также участвовали Galaxy Vision Hill и Kosmos Ventures. Платформа поддерживает кроссчейн-сети, включая Ethereum,

GateNews1ч назад

Anthropic откатывает изменения Claude Code после снижения качества; все исправления завершены

Сообщение Gate News от 24 апреля — Anthropic признала недавнее снижение качества Claude Code и подтвердила, что все связанные проблемы были устранены с помощью откатов и исправлений. Проблемы возникли из-за трех изменений продукта и подсказок, внесенных в период между началом и серединой апреля. 4 марта,

GateNews3ч назад

Сооснователь NeoSoul Каэлан: Индустрия ИИ должна позволять существовать игрушкам; инновации часто начинаются с экспериментальных продуктов

Сообщение Gate News, 24 апреля — На недавнем форуме в Гонконге по интеллектуальным зашифрованным финансам сооснователь NeoSoul Каэлан поделился соображениями о том, как оценивать проекты в области ИИ на ранней стадии в быстро развивающейся индустрии ИИ. Помимо оценки текущих продуктов, команды должны продемонстрировать способность идти в ногу с возможностями базовой модели, заявил он.

GateNews3ч назад

Meta развернет десятки миллионов чипов AWS Graviton5 в рамках многолетней сделки на миллиарды долларов

Сообщение Gate News, 24 апреля — Meta подписала многолетнее соглашение с Amazon Web Services (AWS) на развертывание десятков миллионов процессоров Graviton5 для своей инфраструктуры ИИ, что делает Meta одним из крупнейших глобальных клиентов AWS по Graviton. Сделка, рассчитанная на три–пять лет, оценивается в миллиарды

GateNews3ч назад
комментарий
0/400
Нет комментариев