Видение за успехом Sora: Билл Пиблс и элитная команда OpenAI по созданию видео

Когда OpenAI представила Sora в начале 2024 года, это вызвало потрясение в индустрии искусственного интеллекта. За этой революционной моделью генерации видео стоит тщательно сформированная команда из 13 выдающихся исследователей, одним из ключевых архитекторов проекта является Билл Пиблс. Понимание состава и экспертизы этой команды раскрывает, как OpenAI собрала разнообразный талант — включая трех китайских исследователей, докторов наук из MIT и Беркли, а также выпускника Пекинского университета — для достижения того, что многие считали невозможным.

Билл Пиблс: архитектор технологии моделирования мира Sora

Билл Пиблс со-руководит инициативой Sora в OpenAI, где его исследования сосредоточены на генерации видео и технологиях моделирования мира. Его академический путь впечатляет: он завершил аспирантуру в знаменитом Центре исследований искусственного интеллекта Беркли под руководством Алюши Эфрос, того же наставника, который руководил Тимом Бруксом, другим со-руководителем проекта Sora. Во время учебы в MIT Пиблс работал с Антонио Торралбой, что установило связи с одним из ведущих институтов компьютерных наук в мире.

Перед своей ключевой ролью в создании Sora, Пиблс приобрел бесценный опыт в ведущих технологических компаниях. Он проходил стажировки в FAIR (лаборатории AI-исследований Meta), Adobe Research и NVIDIA, погружаясь в передовые знания о генеративном моделировании и вычислительной эффективности. Особенно важным было его участие в FAIR, где он сотрудничал с профессором Ся Сайннингом, ныне работающим в NYU, над знаковой статьей “Масштабируемые диффузионные модели с трансформерами”. Эта работа фактически заложила архитектурную основу, на которой позднее строился Sora — важный этап в переходе от теории к практическому созданию крупномасштабного видео.

Путь от Беркли к Sora не был мгновенным. После защиты кандидатской диссертации Пиблс присоединился к OpenAI и полностью посвятил себя проекту. Сообщается, что основная команда работала в изнурительном режиме более года перед выпуском Sora, что демонстрирует интенсивность усилий по расширению границ возможностей AI-генерируемого видео. Эта преданность, в сочетании с глубоким пониманием масштабирования диффузионных моделей и архитектур трансформеров, сделала его незаменимым в преобразовании академической теории в рабочую систему, способную генерировать связное, реалистичное видео.

Создание исследовательской базы: путь Беркли — OpenAI

Концентрация выпускников Центра исследований искусственного интеллекта Беркли в команде Sora не случайна. И Пиблс, и его со-руководитель Тим Брукс учились у Алюши Эфрос, что говорит о том, что OpenAI сознательно привлекала кадры из центра, известного развитием генеративного моделирования. Эта стратегия — использование существующих исследовательских сетей и проверенных кадровых каналов — отражает, как формируются элитные команды AI в условиях высокой конкуренции.

Тим Брукс, партнер Пиблса по Sora, обладает дополняющими сильными сторонами. Его исследования давно сосредоточены на разработке масштабных моделей, способных моделировать реальный мир. До текущей роли ведущего исследователя в DALL·E 3, Брукс работал в Google над AI для камер Pixel и в NVIDIA над моделями генерации видео. Этот опыт в различных областях — от потребительского AI до исследований — позволил ему критически оценивать коммерческую применимость сгенерированного видео, а не только его теоретическую привлекательность.

Более широкий экосистемный контекст: талант из разных дисциплин

Помимо двух со-руководителей, команда из 13 человек демонстрирует стратегию OpenAI по сочетанию глубоких знаний в области AI с дополнительными навыками. Коннор Холмс, недавно перешедший из Microsoft, обладает специальными знаниями в области эффективности систем при выводе и обучении, что важно для решения инженерных задач масштабирования таких огромных моделей. Его опыт включает работу с большими языковыми моделями (LLMs), энкодерами типа BERT, рекуррентными нейронными сетями и UNets — технический набор инструментов, необходимый для инфраструктуры Sora.

Международный состав команды отражает глобальный характер талантов в области AI. Среди трех китайских исследователей, участвующих в создании Sora, — Ли Цзинь, который имеет как бакалавриат из Пекинского университета, так и степень доктора физики из MIT. Его опыт в мультимодальном обучении и генеративных моделях, полученный в постдокторате в FAIR вместе с Яном Лекуном, дает ценное понимание взаимодействия различных данных внутри генеративных систем. Его ранние вклады в DALL·E 3 подготовили его к решению дополнительных сложностей видеогенерации.

Ви Депюе представляет растущее явление в AI-исследованиях: исключительный талант, который обходится без традиционных ограничений. Родившись после 2000 года, он сразу после выпуска присоединился к OpenAI в качестве штатного исследователя, что показывает, что академические заслуги важнее формальных дипломов. Его раннее основание стартапа во время школы свидетельствует о нестандартном мышлении, которое процветает в исследовательских средах вроде OpenAI.

От академии к производству: создание Sora

Некоторые участники команды, включая Дэвида Шнура, обладают десятилетиями практического опыта. Шнур, ветеран AI, помог создать базовую архитектуру Alexa еще в Graphiq до ее приобретения Amazon, затем работал в Uber, привнося опыт реального внедрения в задачи OpenAI. Такие специалисты гарантируют, что Sora создавалась не только для академических целей, но и для реальных приложений.

В команду также входили специалисты по компьютерному зрению и диффузионным моделям, такие как Эрик Лухман, чьи исследования сосредоточены на эффективных, передовых алгоритмах AI. Джо Тейлор, ранее работавший в команде ChatGPT, привнес понимание пользовательского интерфейса и дизайна — напоминание о том, что даже прорывные системы AI требуют тщательного продумывания взаимодействия с человеком.

Рики Ван, который провел годы в Meta, прежде чем присоединиться к OpenAI в январе 2024, — пример растущей мобильности топ-талантов между конкурентными организациями AI. Его образование в Беркли отражает академический путь многих ключевых участников, что говорит о том, что OpenAI активно нанимает из нескольких ведущих институтов, известных подготовкой кадров в области AI.

Самым поразительным является Адития Рамешт, руководивший разработкой DALL·E 3 и теперь курирующий реализацию Sora, несмотря на наличие только бакалавра из Нью-Йоркского университета. Его карьерный путь — прямое привлечение в OpenAI после выпуска — показывает, что компания ценит продемонстрированные результаты больше, чем формальные дипломы, хотя даже «без диплома» участники обычно обучались у таких фигур, как Янг Лекун.

Заключение: модель для команд AI-исследований

Билл Пиблс и команда Sora демонстрируют, как передовые достижения в AI возникают благодаря целенаправленному формированию команды из дополняющих экспертиз. Объединяя ведущих исследователей из Центра исследований AI Беркли, привлекая международных специалистов (в том числе трех китайских ученых), интегрируя инженеров, ориентированных на производство, и приветствуя нестандартные пути, OpenAI создала условия для выдающегося достижения Sora. По мере развития области AI эта модель состава команды — балансирующая академическую строгость с практическими знаниями, традиционные дипломы с доказанной способностью — служит образцом для того, как организации могут продвигать технологические границы.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить