Самое важное событие сегодня — конференция Nvidia GTC, это просто краткая история человечества в версии AI.

robot
Генерация тезисов в процессе

Сегодня самое важное событие — конференция NVIDIA GTC, практически как краткая история человечества в мире ИИ.

Хуанг Жэньсюнь еще не вышел на сцену, а уже утекла такая масса информации, что хватило бы на целую книгу.

Вечер整理了 три главных пункта, давайте, друзья, пойдем со мной.

  1. Стоимость вычислений для ИИ снизилась вдвое

Предыдущее поколение Blackwell уже было очень мощным, верно? Скоро будет объявлено о серийном производстве нового чипа Vera Rubin.

Чем же хорош Vera Rubin? Говоря прямо, двумя словами: дешевый.

Для выполнения одинаковых моделей ИИ, количество чипов сокращено до четверти, а стоимость inference — на 90% ниже. На девяносто процентов! Три крупнейших облачных провайдера — AWS, Microsoft и Google — сразу же присоединились к первому запуску.

  1. Groq, купленная за 20 миллиардов долларов в прошлом году, сегодня сдает работу

Ранее Хуанг Жэньсюнь на отчете о результатах говорил, что Groq будет интегрирована в архитектуру NVIDIA как расширение, подобно тому, как в свое время купили Mellanox для усиления сетевых возможностей.

LPU Groq и GPU NVIDIA размещаются в одном дата-центре: GPU занимается пониманием задач, а LPU отвечает за быстрое выдачу ответов.

Работая вместе, эти два типа чипов сокращают задержки в сценариях с агентами.

AI-агенты выполняют работу за человека: один и тот же задачей могут перебирать десятки раз, каждый раз нагревая вычислительные ресурсы inference, а пользователь ждет, и если задержка увеличивается — опыт страдает.

Inference состоит из двух этапов: сначала понять ваш вопрос, затем по буквам выдавать ответ.

GPU хорошо справляется с первым этапом, но скорость и стабильность второго — сильнее у LPU Groq.

Двадцать миллиардов — дорого?

Подумайте, что в будущем каждая компания будет запускать сотни агентов, каждый день — тысячи вызовов моделей.

  1. Запуск NVIDIA-версии OpenClaw под названием NemoClaw

Это открытая платформа, которая позволяет компаниям установить и развернуть ИИ-работников для автоматизации процессов, обработки данных и управления проектами. Говорят, уже ведутся переговоры с Salesforce и Adobe.

Интересно то, что NemoClaw не требует использования чипов NVIDIA. Посмотрите на этот логический ход. Продажа чипов приносит только доход с аппаратного обеспечения, а установление правил — позволяет зарабатывать на всей цепочке. Хуанг Жэньсюнь прекрасно это понимает.

  1. Хуанг Жэньсюнь заявил, что собирается показать «чипы, которых мир никогда не видел»

Вероятнее всего, это будет первый показ следующего поколения архитектуры Feynman, которая поступит в массовое производство в 2028 году на самом передовом техпроцессе TSMC — 1,6 нм.

Также есть одна малоизвестная, но очень интересная новость.

NVIDIA выпустила ноутбучные процессоры, две модели, ориентированные на игры. Производители видеокарт начинают конкурировать за рынок CPU.

Вечер я чувствую, что Хуанг Жэньсюнь в будущем станет великим человеком.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить