Написал: Люк, Mars Finance
Знакомство
На этой неделе мировые финансовые рынки пережили сильный шок. Биткоин, как «барометр» высокорисковых активов, рухнул под воздействием обвала акций США, и цена когда-то упала до $78 000, запалом этой «лавины» стало коллективное падение акций технологических компаний США, а эпицентр указал на Nvidia — цена акций гиганта AI-чипов рухнула на 10,2% за первую неделю, а его рыночная стоимость сократилась более чем на $300 млрд, напрямую потянув индекс S&P 500 вниз на 4,7% и индекс Nasdaq 100 вниз на 5,9%. Взлеты и падения биткоина — это только поверхность, и для того, чтобы исследовать глубинные причины краха фондового рынка США, мы должны обратить наше внимание на новую переменную: DeepSeek выпустила пять основных технологий на «Неделе открытого исходного кода», заявив, что она может добиться трехкратного увеличения вычислительной мощности на существующем оборудовании, что заставляет рынок сомневаться в будущем монополии на чипы.
Недавний крах NVIDIA: “Ватерлоо” аппаратной империи
Падение NVIDIA не случайно, а является концентрированной вспышкой множественного давления:
Предупреждение о производительности: агентство прогнозирует, что темпы роста выручки дата-центров Nvidia в первом квартале 2025 года замедлятся с 75% до 48%, а ожидания рынка по спросу на оборудование быстро охладятся.
Тень замещения технологий: На той же неделе китайский выскочка DeepSeek, занимающийся искусственным интеллектом, провел громкую «Неделю открытого исходного кода» и выпустил пять программных технологий, которые, как утверждалось, улучшают вычислительную эффективность в три раза на существующих графических процессорах. Это не только пошатнуло бизнес-логику «стекинга чипов» NVIDIA, но и заставило инвесторов почувствовать запах «де-NVIDIA».
За этой бурей на фондовом рынке скрывается наклоняющийся весы конкуренции вычислительной мощности искусственного интеллекта - от эпохи ‘грубой силы’, основанной на аппаратной составляющей, к ‘эпохе умной победы’, основанной на оптимизации программного обеспечения.
DeepSeek Open Source Week: Пять ударов «программно-определяемых вычислений».
Пять открытых технологий DeepSeek - это не простая оптимизация кода, а полномасштабная “революция в программном вычислении”, которая переопределяет отношения между вычислениями, связью и хранением, делая обучение и вывод ИИ не полностью зависимыми от обновления аппаратного обеспечения.
Традиционные вычисления искусственного интеллекта похожи на ручную кухню, где множество задач требуют ручного распределения, что приводит к потерям и ожиданию. В то время как оптимизационное решение FlashMLA больше похоже на “интеллектуальный конвейер”, который позволяет точно планировать текстовые задачи разной длины на графических процессорах, обрабатывая короткие задачи быстро и не тратя ресурсы на длинные задачи.
Критический момент: вычислительная производительность видеокарты H800 была увеличена до 580 терафлопс по сравнению с 220 терафлопс при использовании традиционных методов.
Влияние: количество GPU, необходимых для выполнения одной и той же задачи в области искусственного интеллекта, снижается на 60%, что непосредственно влияет на потребность облачных вычислений в закупке.
При крупномасштабном обучении моделей ИИ узким местом вычислительной мощности часто являются не вычисления, а задержка связи. DeepEP использует технологию сжатия FP8 + RDMA, которая эквивалентна построению «магистрали 5G» между графическими процессорами, и поток данных более эффективен.
Данные о производительности: пропускная способность межузловой связи увеличена до 150 ГБ/с, а задержка снижена на 83%.
Влияние: размер кластера серверов можно уменьшить на 40%, что позволит сократить зависимость от сетевого оборудования Nvidia InfiniBand.
DeepGEMM оптимизирует метод расчета матрицы, что эквивалентно установке на GPU «умной газовой плиты», которая может динамически регулировать огневую мощь в соответствии с разными задачами.
Повышение производительности: увеличение скорости вычислений в 2,3 раза при точности FP8, снижение энергопотребления на 55%.
Влияние на отрасль: Тензорное ядро Nvidia может быть заменено в некоторых сценариях, а некоторые компании заменили заказы A100 на комбинации H800 + DeepGEMM.
Хранение данных является ключом к обучению ИИ, а файловая система 3FS похожа на «автоматизированный складской центр», который может мгновенно извлекать огромные объемы данных, а не вручную находить файлы, как традиционные методы.
Пропускная способность: скорость чтения и записи 6,6 ТБ/с, что в 12 раз выше, чем у файловой системы Lustre.
Результат: время предварительной обработки обучающих данных сокращается на 70%, а требования к инвестициям в графический процессор снижаются на 35%.
Стратегия открытого исходного кода DeepSeek подобна снежному кому, который становится все больше и больше. Данные GitHub показывают, что еженедельное количество загрузок его открытого репозитория превысило 1,2 миллиона раз, причем 30% из них приходится на разработчиков из Европы и Америки. Это означает, что разработчики по всему миру быстро приспосабливаются к этим оптимизационным решениям, дополнительно ослабляя контроль NVIDIA над программной экосистемой.
От “чип-стекла” до “выщипывания кода”: перестройка индустрии искусственного интеллекта
В последние несколько лет логика вычислительных мощностей ИИ заключалась в том, что «кремниевый процесс — это все», но DeepSeek’s Open Source Week показала, что оптимизация программного уровня может быть экспоненциально улучшена без обновления оборудования. Это привело к изменению логики оценки всей индустрии ИИ.
Трудности NVIDIA: компания вложила более 120 миллиардов долларов в разработку GPU архитектуры Blackwell, но закрытая экосистема CUDA стала проблемой “закрывающего клиента”, что привело к тому, что в бюджетах по искусственному интеллекту Meta, Microsoft и других компаний на 2025 год, расходы на оптимизацию программного обеспечения выросли с 15% до 40%.
Оценка материнской компании DeepSeek взлетела на 300% за три месяца до $72 млрд, превзойдя Stability AI.
Выбор мировых разработчиков: статистика GitHub показывает, что доля использования компонента DeepSeek в проектах искусственного интеллекта составляет уже 27%, обогнав PyTorch Lightning.
Nvidia слишком велика, чтобы потерпеть неудачу? Как американские акции переваривают этот медвежий настрой?
Крах NVIDIA затрагивает не только индустрию искусственного интеллекта, но и стабильность всего американского фондового рынка. Как лидер рынка технологических акций, каждое резкое колебание цен акций NVIDIA вызывает цепную реакцию на рынке. Так каким образом американский фондовый рынок должен переварить эту отрицательную новость?
В ближайшее время рынок может пережить период оттока убежищных средств и коррекции технологических акций, особенно оценка промышленности искусственного интеллекта будет пересмотрена.
В долгосрочной перспективе NVIDIA по-прежнему является важной опорой в индустрии искусственного интеллекта, несмотря на вызовы оптимизации программного обеспечения для апгрейда оборудования. Графический процессор по-прежнему является основой обучения и вывода больших моделей. При восстановлении доверия рынка у NVIDIA все еще есть шанс на стабилизацию.
Возрождение рынка биткойнов, возможно, зависит от стабилизации американской фондовой биржи. Как только снизится давление продаж технологических акций, возрастет предпочтение к риску на рынке, восстановится ликвидность, и только тогда биткойн в качестве “цифрового золота” сможет надеяться на восстановление.
Мир искусственного интеллекта будущего — это уже не просто соревнование аппаратного обеспечения, а эра программно-определяемых вычислительных мощностей. В наши дни компании, которые могут использовать код для «превращения камней в золото», пойдут дальше, чем те, кто одержим созданием больших молотков.
DeepSeek’s Open Source Week — это только начало, новый вычислительный ландшафт ИИ, который незаметно меняет мир.