Выступление Робина Ли на конференции разработчиков искусственного интеллекта Baidu: Что узнал Baidu после того, как столкнулся с бесчисленными ловушками?
Пока ты умеешь говорить, ты можешь стать разработчиком.
Сценарист: Лиан Ран
Редактор: Чжэн Сюань
Источник: Компьютерщик
«Естественный язык станет языком программирования следующего поколения, и каждый сможет стать разработчиком».
16 апреля в Шэньчжэне прошла конференция разработчиков AI Baidu Create 2024. Основатель, председатель и генеральный директор Baidu Робин Ли выступил с программной речью на тему «Каждый является разработчиком», описав мир, который больше не ограничивается миром навыков кодирования. но эпоха, когда естественный язык используется в качестве средства массовой информации, и каждый может участвовать в творчестве.
Выпуск версии инструмента Wenxin Large Model 4.0 от Baidu сделал концепцию, описанную Робином Ли, на большой шаг ближе к реальности. Этот инструмент не только позволяет разработчикам обрабатывать сложные данные и файлы посредством взаимодействия на естественном языке, но также может создавать диаграммы или файлы, чтобы быстро получить представление о характеристиках данных, проанализировать изменяющиеся тенденции и обеспечить эффективную и точную поддержку для последующего принятия решений. .
В то же время во время основного выступления Робин Ли представил три основных инструмента разработки, в том числе инструмент разработки агентов AgentBuilder, инструмент разработки собственных приложений AI AppBuilder и инструмент настройки модели ModelBuilder. Эти инструменты значительно снизили порог разработки, позволяя разработчикам создавать мощные, простые в использовании и удобные приложения искусственного интеллекта всего за несколько простых шагов.
Источник изображения: Baidu
Робин Ли отметил: «Интеллектуальные агенты могут стать самым близким и наиболее распространенным способом использования больших моделей для всех в будущем. На основе мощных базовых моделей интеллектуальные агенты могут создаваться партиями и применяться в различных сценариях. Baidu только что обновила Wenxin Разведка. На данный момент создано более 30 000 агентов, на нем обосновались более 50 000 разработчиков и десятки тысяч компаний».
По мнению Робина Ли, разрабатывать приложения в будущем будет так же просто, как снять короткое видео. У каждого есть возможность стать разработчиком, и каждый является творцом. «Сегодня можно создать приложение, не умея писать код; можно создать интеллектуальный агент без программирования. ИИ совершает революцию в творчестве. В будущем разрабатывать приложения будет так же просто, как снять короткое видео, и каждый может. Мы все разработчики, каждый — творец».
В своем выступлении Робин Ли поделился конкретными идеями и инструментами, которые Baidu реализовала в прошлом году для разработки собственных приложений искусственного интеллекта. Он подчеркнул: «Большие языковые модели сами по себе не создают ценности напрямую. Только приложения ИИ, разработанные на основе больших моделей, могут удовлетворить реальные потребности рынка. Сегодня я хочу поделиться с вами некоторыми конкретными идеями и инструментами для разработки собственных приложений ИИ на основе больших моделей». Это то, чего мы в Baidu добились, преодолев бесчисленные ловушки и заплатив высокую плату за обучение, исходя из нашей практики за последний год».
Ниже приводится стенограмма основного выступления Робина Ли на тему «Каждый является разработчиком», составленная Geek Park.
Привет всем, добро пожаловать на конференцию разработчиков AI Baidu Create 2024. Впервые конференция Create проводится в районе Большого залива Гуандун-Гонконг-Макао. Сегодня на мероприятие пришли более 5000 разработчиков и энтузиастов технологий.
За последний год я общался со многими предпринимателями и разработчиками и чувствую, что все находятся в состоянии «FOMO», то есть страха упустить что-то. Они одновременно взволнованы и боятся что-то упустить. Действительно, большие модели и генеративный искусственный интеллект полностью изменят сообщество разработчиков.
В прошлом разработчики использовали код, чтобы изменить мир; в будущем естественный язык станет новым универсальным языком программирования. Пока вы умеете говорить, вы можете стать разработчиком и использовать свои творческие способности, чтобы изменить мир.
Этот день не за горами. Мы увидели, что благодаря мощной базовой большой модели и множеству инструментов разработки с низким или даже нулевым порогом производительность разработчиков значительно повысилась.
Например, Comate, интеллектуальный помощник по написанию кода, основанный на большой модели Wenxin, не только поддерживает более 100 языков и все основные платформы IDE, но и может рекомендовать коды, генерировать комментарии к коду, находить дефекты кода и предлагать решения по оптимизации. Он также может глубоко интерпретировать библиотеку кода и сопоставлять знания о частной области, генерирующие новый код. После более чем года работы Comate использовался десятками тысяч компаний, таких как Himalaya, Mitsubishi Elevator, iSoftStone и т. д., а уровень внедрения сгенерированного кода достиг 46 % кодов, добавляемых Baidu каждый год. день, 27% было получено Comate of.
Сегодня вы можете создать приложение ИИ без написания кода; вы можете создать интеллектуальный агент без программирования; ИИ совершает революцию в творчестве. В будущем разрабатывать приложения будет так же просто, как снимать короткое видео. Каждый — разработчик, каждый — создатель.
Роль Baidu как технологической компании заключается в том, чтобы предоставить каждому максимально возможное количество инструментов разработки, необходимых для постоянного повышения творческих способностей всего общества. В частности, мы предлагаем мощную базовую серию моделей, а именно серию больших моделей Wenxin, включающую флагманские версии ERNIE3.5, ERNIE4.0 и облегченные версии ERNIE Speed, Lite, Tiny и т. д.
Мы также предоставляем инструменты для разработки различных приложений на основе больших моделей, включая инструмент разработки агентов AgentBuilder, собственный инструмент разработки приложений AI AppBuilder и инструмент настройки модели ModelBuilder различных размеров. Все эти три инструмента представляют повышенную производительность. Ниже я покажу вам один за другим.
У Wenxin Yiyan более 200 миллионов пользователей, выпущена версия инструмента Wenxin Big Model 4.0.
Для начала давайте поговорим о последних достижениях Вэнь Синь И Яня и большой модели Вэнь Синь:
Прошел год и один месяц с тех пор, как 16 марта прошлого года Вэнь Синь Иян была освобождена. Число наших пользователей превысило 200 миллионов, среднее количество ежедневных вызовов API также превысило 200 миллионов, количество клиентов, которых мы обслуживаем, достигло 85 000, а количество собственных приложений искусственного интеллекта, разработанных с использованием платформы Qianfan, превысило 190 000.
Давайте посмотрим, что все делают с Вэнь Синьианом?
Реальные люди на видео — лишь верхушка айсберга. Мы видим, что Вэнь Синьянь меняет работу и жизнь большего числа людей.
Базовая модель, подтверждающая слова Вэнь Синя, — это большая модель Вэнь Синя. За последний год она изменилась с версии 3.0 до версии 3.5, а затем до версии 4.0. Wenxin 4.0 достиг ведущего в отрасли уровня по четырем основным возможностям: понимание, генерация, логика и память.
В последние месяцы Wenxin Big Model добилась дальнейших значительных улучшений в общих возможностях, таких как генерация кода, интерпретация кода и оптимизация кода, достигнув лидирующего международного уровня.
Сегодня мы официально выпустили версию инструмента Wenxin Big Model 4.0. Теперь вы можете использовать функцию интерпретатора кода в этой версии инструмента. Благодаря взаимодействию на естественном языке вы можете обрабатывать и анализировать сложные данные и файлы, а также создавать диаграммы или файлы. файлы могут быстро получить представление о характеристиках данных, проанализировать изменяющиеся тенденции и обеспечить эффективную и точную поддержку для последующего принятия решений.
Большая модель Вэньсинь стала самой ведущей и наиболее широко используемой базовой моделью искусственного интеллекта в Китае.
Мало того, что по сравнению с годом ранее эффективность обучения алгоритма большой модели Вэньсинь увеличилась в 5,1 раза, средняя еженедельная эффективность обучения достигла 98,8%, производительность вывода увеличилась в 105 раз, а стоимость вывода выросла упал до 1% от исходного.
Другими словами, первоначально клиент звонил 10 000 раз в день, но теперь может звонить 1 миллион раз по той же цене. Средства массовой информации, вероятно, не будут в восторге от снижения затрат на 99%. Но будь то предприятие или разработчик, после его использования самое главное — это эффект и стоимость.
Мы можем повысить производительность, сократив затраты на логический вывод до 1 % именно потому, что Baidu имеет полнофункциональную четырехуровневую архитектуру микросхем, платформ, моделей и приложений. Благодаря сквозной оптимизации мы продолжаем снижать затраты. Это позволит большему количеству людей использовать большие модели для эффективного и недорогого создания приложений ИИ.
Нет сомнений в том, что темы, связанные с большими моделями, по-прежнему будут актуальными в 2024 году, а различные технологические прорывы будут продолжать появляться. Средства массовой информации по-прежнему будут активно использовать такие названия, как «шокирующий релиз» и «эпическое обновление», чтобы представить это. Но я хочу подчеркнуть, что большие модели сами по себе не создают ценности напрямую. Только приложения ИИ, разработанные на основе больших моделей, могут удовлетворить реальные потребности рынка.
Поделитесь конкретными идеями и инструментами для разработки собственных приложений искусственного интеллекта: «Я столкнулся с бесчисленными ловушками и заплатил высокую плату за обучение».
Сегодня я хочу поделиться с вами некоторыми конкретными идеями и инструментами для разработки собственных приложений ИИ на основе больших моделей. Это то, чего мы в Baidu добились на основе нашей практики за последний год, наступая на бесчисленные ловушки и платя высокую плату за обучение.
Первое – МО. В будущем крупномасштабные собственные приложения искусственного интеллекта будут в основном использовать архитектуру MoE. Упомянутая здесь MoE — это не общая академическая концепция, а смесь больших и малых моделей, без использования одной модели для решения всех проблем. Но когда вызывать маленькую модель, когда вызывать большую модель, а когда не вызывать модель, все они имеют техническое содержание и должны соответствовать различным сценариям применения.
Вторая – маленькая модель. Маленькие модели имеют низкие затраты на вывод и быстрое время отклика. В некоторых конкретных сценариях производительность небольшой модели, точно настроенной с помощью SFT, может быть сопоставима с производительностью большой модели. Именно поэтому мы выпустили три облегченные модели: Speed, Lite и Tiny. Мы сжимаем и очищаем большую модель для создания базовой модели, а затем используем данные для обучения. Это намного лучше, чем обучение небольшой модели с нуля. Это лучше, быстрее и дешевле, чем модель, обученная на основе открытого исходного кода. модель.
Третий — интеллектуальный агент. Интеллектуальные агенты сейчас являются горячей темой. По мере совершенствования возможностей интеллектуальных агентов будет продолжать появляться большое количество новых приложений. Механизм интеллектуального агента включает в себя понимание, планирование, размышление и эволюцию. Он позволяет машинам думать и действовать как люди. Они могут выполнять сложные задачи автономно, продолжать учиться в окружающей среде и осуществлять самоитерацию и эволюцию. В некоторых сложных системах мы также можем позволить различным агентам взаимодействовать и сотрудничать друг с другом для выполнения задач с более высоким качеством. Мы разработали эти возможности агента и полностью открыты для разработчиков.
По трем направлениям: МО, небольшие модели и агенты, Baidu предоставила «готовые» инструменты для каждого. Далее я представлю вам три различных инструмента, а именно: инструмент разработки агентов AgentBuilder, собственный инструмент разработки приложений AI AppBuilder и инструмент настройки моделей различных размеров ModelBuilder.
Инструмент разработки агентов AgentBuilder
Первый — это инструмент разработки агентов AgentBuilder. Агенты могут стать самым близким и наиболее распространенным способом использования больших моделей для всех в будущем. На основе мощных базовых моделей агенты можно будет создавать в пакетном режиме и применять в различных сценариях.
Baidu только что обновила свою интеллектуальную агентскую платформу Wenxin. На данный момент создано более 30 000 агентов, обосновалось более 50 000 разработчиков и десятки тысяч компаний. Наша цель — дать возможность каждой организации стать разработчиком интеллектуальных агентов и создать наиболее полную экосистему интеллектуальных агентов в Китае.
Так как же достичь этой цели? Целью проекта является предоставить каждому инструмент разработки агентов с нулевым порогом AgentBuilder.
Давайте сначала возьмем в качестве примера «Совет по туризму Сингапура», чтобы увидеть, как создается интеллектуальный агент.
Сначала мы открываем платформу агента Wenxin. Страница создания имеет два режима: с нулевым кодом и с низким кодом. Новички могут напрямую выбрать «режим с нулевым кодом» и использовать естественный язык для создания агента в нескольких предложениях.
Сначала мы назвали агента «Совет по туризму Сингапура», а затем указали в настройках, что нам нужно для создания планов поездок, ответов на вопросы и предоставления услуг по бронированию билетов в отели. Эти настройки используются для управления агентом. Вы можете указать, что он делает. .
Если нужны только базовые агенты, платформа автоматически завершит заполнение. Но мы надеемся, что «Совет по туризму Сингапура» является профессиональным интеллектуальным агентом, поэтому требуется расширенная настройка. Я могу добавлять записи Сингапурской энциклопедии и ссылки на официальные веб-сайты в базу знаний, и она будет обновляться каждый день. Затем добавьте некоторые инструменты, такие как запрос отелей, покупка билетов на аттракционы и т. д., чтобы расширить возможности обслуживания. В настоящее время мы сотрудничаем с Ctrip, предоставляя инструменты туристических услуг, такие как отели, достопримечательности и продажа билетов. Таким образом, интеллектуальный агент Сингапурского управления по туризму готов, который можно дополнительно просмотреть и настроить.
Теперь откройте приложение Baidu и найдите «Когда в Сингапуре будет меньше всего людей, потому что во время путешествий все хотят избежать скопления людей?» Агент объединит информацию из нескольких источников, чтобы сгенерировать ответ: «В январе-марте людей меньше всего». Мы также можем нажать на агента, чтобы продолжить взаимодействие с ним, например, получить советы по поездке в Сингапур, рекомендации по трем лучшим отелям Сингапура, а также его можно использовать для прямого бронирования билетов в Universal Studios Singapore — универсальное решение. для наших нужд, что экономит много времени пользователя.
Помимо Сингапура, на платформе интеллектуальных агентов Wenxin также доступны интеллектуальные агенты в сфере культуры и туризма, такие как Далянь и Шэньян. Существуют также различные интеллектуальные агенты для знаний, творчества, обучения, развлечений и т. д. Все они используются компанией AgentBuilder. .
Когда в прошлом году впервые был выпущен «Вэнь Синьиян», я сказал, что «Вэньсиньянь» повлияет на каждую компанию. Благодаря своим мощным возможностям понимания, выражения и рассуждения на естественном языке он может приблизить любую компанию к ее клиентам.
Сегодня каждый продавец и каждый покупатель могут иметь эксклюзивного интеллектуального агента на Baidu. Весь процесс вообще не требует программирования. Введя информацию, похожую на слова-подсказки, и скорректировав несколько простых шагов, можно быстро создать интеллектуального агента, который станет продавцом с золотой медалью в режиме онлайн 24/7.
Давайте посмотрим, как устроен агент бизнес-разведки.
Kai Tak Education — известная образовательная компания с более чем 60 филиалами по всей стране и множеством зарубежных филиалов. Она охватывает широкий спектр стран и предъявляет высокие требования к навыкам приема. Как мы можем отвечать на запросы клиентов 24 часа в сутки, улучшить уровень приема и сократить эксплуатационные расходы?
Kai Tak Education использует AgentBuilder от Baidu для создания собственного интеллектуального агента.
Давайте посмотрим, как создать интеллектуального агента с базовыми возможностями. Это очень просто. Введите аватар, имя, сферу деятельности и приветственное сообщение агента на платформе, а затем укажите некоторую информацию, которую должен предоставить пользователь, например возраст и образование. Через 5 минут и при нулевом пороге интеллектуальный агент готов.
Кай Так Эдьюкейшн также надеется, что этот агент будет консультантом по обучению за рубежом, который разбирается в бизнесе и студентах. Он может проводить профессиональный анализ и давать точные ответы в зависимости от различных ситуаций студентов, например, хотят ли они поехать в Соединенные Штаты или Австралию, хотят ли они получить степень магистра или бакалавра, какие баллы они набрали на IELTS и TOEFL, и т. д. Мы можем создать более продвинутого интеллектуального агента, добавив несколько модулей, таких как знания, роли и инструменты.
В модуле знаний загрузите знания из частной области и позвольте платформе анализировать их в режиме реального времени и автоматически генерировать материалы для диалога в ролевом модуле, добавьте в схему фильтрации некоторые страны обучения за рубежом, которые не входят в сферу деятельности бизнеса, что может улучшиться; эффективность пользовательских подсказок в инструментальном модуле, добавление таких услуг, как бронирование в магазине; С помощью этих нескольких простых операций готов образовательный интеллектуальный агент Qi Tak с профессиональными возможностями.
Теперь давайте найдем «Требования к подаче заявления на обучение в Австралии». Мы видим, что агент быстро предоставляет семь необходимых условий, таких как требуемое знание языка и выбор специальности, а также может предоставить соответствующие консультационные планы обучения за границей для решения различных проблем. будет дан ответ, и на все запросы будут даны ответы.
Kai Tak Educational Intelligence очень популярен. За первую неделю после запуска он был успешно распространен 1,55 миллиона раз и взаимодействовал с пользователями 58 000 раз. Количество конверсий лидов росло линейно, стоимость конверсии эффективных лидов значительно снизилась, а эффективность работы значительно повысилась.
Далее я познакомлю вас с интеллектуальным агентом в домашней индустрии.
Sophia — бренд товаров для дома, специализирующийся на индивидуальной отделке всего дома. Как только что было показано, он также может создать базовую бизнес-аналитику, заполнив чрезвычайно простую информацию. Но для индустрии товаров для дома опыт потребителей в офлайн-режиме более важен, поэтому София надеется добиться золотой медали продаж в Интернете и восстановить опыт приема в офлайн-режиме.
Поэтому в дальнейших настройках он выбрал цифровых людей в качестве метода отображения в ролевом модуле, затем выбрал соответствующие фоны и голоса для цифровых людей и в сочетании с возможностями интеллектуального анализа платформы автоматически суммировал набор методов продаж. В конце концов, мы создали продавца с золотой медалью, мягкого, доброго и профессионального в разговорных навыках. Она может удовлетворять различные потребности пользователей 24 часа в сутки и предоставлять услуги высокого уровня.
Когда у пользователя поиска Baidu есть запрос на украшение, агент София будет использовать возможность большой модели Wenxin, чтобы сначала дать ответ на вопрос. Кроме того, она также будет активно подтверждать конкретные потребности клиентов, такие как тип украшения, бюджет и т. д., и рекомендовать близлежащие офлайн-магазины.
С момента запуска Sophia Merchant Intelligence эффективные затраты на потенциальных клиентов снизились на 30%. Другими словами, чтобы привлечь эффективного клиента, если раньше стоимость составляла 100 юаней, сейчас это стоит всего 70 юаней.
В настоящее время более 10 000 клиентов Baidu имеют торговую информацию, охватывающую более 30 отраслей, таких как образование и обучение, недвижимость и мебель, машины и оборудование, а также бизнес-услуги.
Выше, с помощью трех демонстраций, я показал, как разработчики и продавцы могут использовать AgentBuilder для создания интеллектуальных агентов для различных отраслей.
Теперь создание интеллектуального агента действительно занимает всего несколько минут. Но вот проблема! Если нет трафика, нет распространения, нет поиска и никто его не использует, то у разработчиков и мерчантов не будет дохода. Без дохода не будет мотивации. Как решить эту болевую точку?
Наша агентская платформа Wenxin предоставляет разработчикам возможность монетизировать трафик. Помимо Baidu Search, другие продукты в экосистеме Baidu, такие как Xiaodu, Maps, Tieba, Cheji и т. д., могут быть подключены к соответствующим возможностям интеллектуального агента, решая проблемы распределения трафика для разработчиков и получая реальные результаты. преимущества.
Если есть распределение, будет и обратная связь по данным; при наличии обратной связи маховик будет вращаться, и интеллектуальный агент сможет выполнять итерации самостоятельно, и чем больше он будет использоваться, тем умнее он станет. Агентская платформа Wenxin также запустила модули анализа данных агента и настройки вопросов и ответов, а в ближайшее время будут запущены новые возможности. Платформа интеллектуальных агентов Wenxin будет стимулировать интеллектуальных агентов формировать позитивный цикл лучшего качества, лучшего трафика и больших доходов посредством маховика данных распределения-диагностики-доходов.
AppBuilder: вы можете разработать приложение на естественном языке в три этапа.
Далее я познакомлю вас со вторым инструментом разработки — AppBuilder. На данный момент это лучший инструмент для разработки собственных приложений с использованием искусственного интеллекта. В AppBuilder мы заранее инкапсулировали и предварительно установили различные компоненты и платформы, необходимые для разработки собственных приложений ИИ, что значительно снижает порог разработки.
Всего за три шага разработчики могут разработать собственное приложение искусственного интеллекта с использованием естественного языка, которое можно легко выпустить и интегрировать в различные бизнес-среды. Давайте рассмотрим несколько случаев:
В начале этого года мы провели конкурс по разработке собственных приложений для искусственного интеллекта. Темой конкурса было использование AppBuilder для создания «помощника по планированию очереди на игровой площадке», который поможет туристам лучше понять ситуацию с очередью на детской площадке и разработать персонализированные игровые маршруты. лучший игровой опыт за ограниченное время.
Чемпион этого конкурса разработал приложение, не написав ни единой строчки кода, и выиграл главный приз в размере 100 000 юаней, предоставленный Baidu. Если вы можете написать код для этой темы, вам не составит труда его написать, но если вы все еще можете сделать это, не написав ни строчки кода, это все равно во многом зависит от базовой модели и возможностей инструмента AppBuilder.
Давайте посмотрим, как использовать AppBuilder для создания этого приложения AI.
Давайте сначала рассмотрим вопросы конкурса. Он предполагает время ожидания и индекс стимуляции каждого проекта в «Universal Studios», поэтому получение опыта с наибольшим индексом стимуляции за ограниченное время является задачей, которую предстоит решить в этом выпуске.
Сначала открываем интерфейс разработки AppBuilder и называем приложение «Помощник по организации очереди на игровой площадке»; во-вторых, в ролевых инструкциях описываем конкретные требования, включая вызов интерпретатора кода, расчет лучшей комбинации в течение фиксированного времени, вывод результатов и т. д. ; Третий шаг — перейти к инструментальному компоненту и добавить интерпретатор кода, который поможет с расчетами.
Теперь проверим эффект. Введите вопрос «У меня есть 3 с половиной часа, как играть интереснее всего?». Вы можете видеть, что интерпретатор кода переводит этот вопрос в код, а затем вызывает. инструмент понимания данных. Анализ известных условий. После ряда расчетов был сделан вывод, что наилучшие результаты будут достигнуты при объединении этих четырех проектов: «Гарри Поттер и запретное путешествие», «Приключения юрского периода», «Американские горки десептиконов» и «Бамблби-спиннер». Если с тестом проблем нет, нажмите «Опубликовать», и приложение будет создано без кода.
Теперь AppBuilder был дополнительно обновлен. В процессе создания все могут использовать функцию «Оптимизированная конфигурация с использованием искусственного интеллекта», которая автоматически помогает разработчикам оптимизировать инструкции ролей, конфигурацию компонентов и другие аспекты, что еще больше повышает эффективность разработки.
Давайте посмотрим на другой пример.
В начале этого года Северо-Китайский университет электроэнергетики заявил, что надеется предоставлять интеллектуальные и эксклюзивные услуги учителям и ученикам всей школы. На основе AppBuilder от Baidu мы совместно создали Huadian AI Assistant. Теперь позвольте мне показать вам, как создается Huadian AI Assistant:
Шаг 1. Откройте AppBuilder, войдите на страницу создания и нажмите AI, чтобы автоматически сгенерировать конфигурацию. Сначала укажите для приложения основную информацию, такую как имя, представление, аватар и т. д.
Шаг 2. Используйте естественный язык для описания конкретных требований в ролевых инструкциях, включая задачи, возможности компонентов, требования и ограничения.
Шаг 3. Вставьте настраиваемые компоненты, такие как запрос на получение книг, запрос о расписании занятий, запрос об успеваемости учащихся и т. д., чтобы ассистент кампуса мог иметь возможности интеллектуального обслуживания. Затем добавьте вступительное слово для Campus Assistant, и приложение будет настроено.
Далее отлаживаем помощника в интерфейсе предварительного просмотра на основе вопросов пользователей. Например, спросите о времени регистрации на экзамены CET-4 и CET-6 и проверьте эффект автоматического вызова каждого компонента.
Как видите, посредством этих простых операций приложение завершено. В настоящее время он запущен в мелкомасштабное тестирование и связан с высокочастотными сценариями, такими как проверка системы, проверка курсов, пополнение карточек на питание, получение книг и т. д., и обслуживает большинство учителей и студентов. в школе. В будущем мы будем сотрудничать с Северо-Китайским университетом электроэнергетики для дальнейшего углубления сотрудничества в области приложений и предоставления более обширных и удобных услуг.
Baidu также имеет многолетний опыт накопления кросс-модальных технологий. В AppBuilder мы также предоставляем определенные кросс-модальные возможности. Вам нужно всего лишь указать абзац текста или несколько предложений, чтобы быстро создавать приложения для рисования, такие как комиксы, детские книжки с картинками и т. д.
Процесс также очень прост: откройте AppBuilder, нажмите, чтобы войти в «Создание приложения», введите инструкции по роли, выберите компонент «Добавить изображение Винсента», введите три рекомендуемых вопроса и нажмите, чтобы опубликовать. После завершения приложения нам нужно только ввести приблизительный персонаж или сюжет, и AppBuilder может автоматически генерировать историю и выводить изображения.
Новейшая интеллектуальная функция создания комиксов и книжек с картинками Baidu Wenku использует такие компоненты, предоставленные в AppBuilder. Давайте посмотрим, как функция создания комиксов Baidu Wenku позволяет каждому, у кого есть творческие идеи, создавать хорошие работы.
Возьмем, к примеру, классическую «Чжоу Чу устраняет три зла».
Откройте библиотеку Baidu и войдите в тему «Чжоу Чу устраняет три зла». Это написано в «Книге Цзинь» и «Шишуосинь». После поиска в библиотеке история будет создана на основе исходного текста. Мы также можем изменить. Внесите изменения в содержание истории, затем нажмите панель инструментов AI справа, чтобы начать создание этого комикса.
Войдите в интерфейс создания комиксов, и Wenku автоматически создаст для нас раскадровки комиксов на основе сюжетной линии, а затем выберет стиль комикса, который лучше всего подходит для истории, из различных стилей, таких как свет и тень, реализм, мультфильм и т. д., наконец, выберите другой; персонажи по персонажам, так что генерация комикса завершена.
После создания комикса мы можем просмотреть его целиком в интеллектуальном редакторе комиксов Baidu Wenku. При этом библиотека поддерживает редактирование, модификацию и тонкую настройку каждой картинки. Например, выберите слева картинку «Чжоу Чу и Белолобый тигр», нажмите «Редактировать», добавьте описание картинки «Лицо персонажа». четкое, изображение яркое», и вы можете его точно настроить. Вызовите комиксы, которые лучше соответствуют вашим потребностям. Как видите, комическая функция Baidu Wenku отлично справляется с точки зрения стилистической согласованности персонажей и сцен.
Интеллектуальные комические возможности Baidu Wenku значительно повысили эффективность создания комиксов, снизили стоимость и порог создания комиксов и позволили более вдумчивым и творческим людям реализовать свои мечты о создании комиксов.
Помимо создания комиксов, Baidu Wenku теперь может помочь пользователям создавать книжки с картинками с нулевым порогом. Возможно, вы не знаете, что китайские дети читают всего 10 книжек с картинками в год на душу населения, тогда как в странах Европы и Америки их около 50. Теперь ИИ может позволить родителям, не умеющим рисовать, создать для своих детей эксклюзивную детскую книжку с картинками. Давайте посмотрим эту иллюстрированную аудиокнигу!
С прошлого года мы использовали ИИ для реконструкции Baidu Wenku, сделав его «отправной точкой для производства контента» для пользователей. Теперь, при поддержке AppBuilder, недавно выпущенные функции интеллектуальных комиксов Baidu Wenku и интеллектуальных книжек с картинками расширили сцену до более интересных кросс-модальных областей создания.
Я только что использовал три примера, чтобы показать, как использовать AppBuilder от Baidu для создания собственных приложений ИИ. Каждый должен почувствовать два очевидных преимущества AppBuilder:
Во-первых, это мощно. Опираясь на способность Wenxin 4.0 понимать и следовать инструкциям, наш AppBuilder может гарантировать, что холодный запуск достигнет хорошего уровня. Настройка не займет много времени из-за низкой производительности, что значительно снижает порог разработки. Благодаря технологии улучшения поиска RAG в типичных сценариях, таких как вопросы и ответы на знания, наш уровень точности вопросов и ответов и уровень дружелюбных ответов достигли более 95%, что значительно превосходит другие аналогичные продукты. AppBuilder также предоставляет богатый и полный набор инструментов, включая 55 компонентов, таких как поиск Baidu и другие компоненты возможностей искусственного интеллекта, основанные на многолетнем накоплении технологий Baidu, компоненты возможностей больших моделей и эксклюзивные компоненты открытого бизнеса Baidu. А также сторонние API для некоторых основных сценариев, таких как запрос рейса, запрос бумаги и т. д. Мы также только что поддержали пользовательские компоненты, поэтому клиенты могут напрямую подключать любые свои собственные инструменты и данные. Эти богатые компоненты совместно поддерживают эффективную разработку собственных приложений искусственного интеллекта.
Во-вторых, он прост и удобен в использовании. Используя AppBuilder, вы можете быстро создавать приложения за три шага и распространять их одним щелчком мыши. Мы также поддерживаем SDK с открытым исходным кодом для облегчения вторичной разработки.
Инструмент настройки модели ModelBuilder: эффективное и недорогое создание моделей
Далее я представлю инструмент, который больше подходит для профессиональных разработчиков, а именно ModelBuilder. Он может настраивать модели любого размера в соответствии с потребностями разработчиков и дополнительно настраивать SFT на основе разделенных сценариев, чтобы можно было получить лучшие результаты. достигнут эффект. Для разработчиков, чтобы эффективно использовать большие модели, очень важно освоить метод точной настройки модели.
Давайте возьмем в качестве примера сценарий исправления эссе в сфере образования. Потому что коррекция состава имеет четкие стандарты оценки, а разные оценки имеют разные требования к композиции и стандарты оценки. Это требует тонкой настройки модели, чтобы выходные результаты большой модели более соответствовали конкретным требованиям.
Давайте посмотрим, как ModelBuilder реализует точную настройку модели для оценки эссе.
Шаг 1: Создайте набор данных. Эффективность точной настройки модели во многом зависит от качества наших данных. В этом случае исходные данные содержат всего 180 элементов, а качество недостаточно высокое. Нам нужно использовать три функции: очистку данных, аннотацию данных и улучшение данных. Очистка данных позволяет быстро устранить пробелы в данных, искаженные символы и другие проблемы. Что касается аннотации данных, мы добавили в композицию больше измерений, таких как глубина контента, техника письма и другие оценки. Функция расширения данных может генерировать аналогичные, но не повторяющиеся данные для расширения данных. После расширения ModelBuilder сгенерировал для нас 920 фрагментов высококачественных данных.
Вторым шагом является переход на этап тонкой настройки модели. Для начала нам нужно выбрать базовую модель для тонкой настройки. Здесь в качестве базовой модели мы выбираем ERNIE Speed. Затем мы настраиваем параметры в соответствии с рекомендуемыми значениями платформы. На этот раз данные близки к 1000. Согласно рекомендуемым раундам итерации, конфигурация составляет 10 раундов, а затем модель может начать обучение.
Шаг 3. Разверните модель на платформе, и весь процесс тонкой настройки завершен.
Давайте воспользуемся сочинением для средней школы, чтобы проверить эффект точно настроенной модели. Название эссе – «С нетерпением жду взросления», ограничений по теме нет, объем должен быть не менее 800 слов.
Мы вводим требования к сочинению учащегося и формату коррекции в две модели до и после тонкой настройки. Давайте посмотрим на сравнение двух моделей и комментарии учителя. Видно, что точно настроенная большая модель имеет более профессиональное мышление учителя и лучшее соответствие формату. Задачи по исправлению эссе, которые изначально требовали от учителей много времени, теперь могут быть выполнены быстро с помощью больших моделей за несколько секунд, что значительно повышает скорость и эффективность обратной связи с учащимися. В настоящее время этот тип доработанной модели используется во многих ведущих компаниях образовательной отрасли.
Ранее я упоминал, что крупномасштабные собственные приложения ИИ обычно создаются Министерством образования. Итак, как объединить эти модели, чтобы получить лучшее соотношение цены и качества? Далее я воспользуюсь Xiaodu, чтобы продемонстрировать пример маршрутизации модели MoE. Давайте сначала посмотрим, стал ли Сяоду умнее с благословения большой модели:
Робин: Сяоду Сяоду
Сяоду: Вот ты где
Робин: Какие новости сегодня?
Сяоду: Сяоду транслирует 3-5 выпусков новостей за день.
Робин: Сяоду Сяоду. Я слышал, что в последнее время ты стал более способным? Сяоду: Я могу не только общаться с тобой, но и быть твоим ИИ-помощником по расписанию.
Робин: Тогда я собираюсь тебя проверить. Пожалуйста, помогите мне составить расписание. После сегодняшнего мероприятия я поужинаю с г-ном Чжаном, а затем в отеле состоится встреча руководства, которая продлится около полутора часов, я надеюсь, что она закончится до 10 часов. 'Часы. Завтра утром я собираюсь пойти на утреннюю пробежку и посмотреть, какая погода. Затем в 8 утра у меня назначена встреча. Пожалуйста, помогите мне составить расписание.
Сяоду: Основываясь на ваших потребностях, Сяоду составит для вас оптимальное расписание следующим образом:
Ваш ужин с г-ном Чжаном запланирован на 18:00-19:30. После этого вы примете участие в собрании руководства в 20:00 и завершится около 21:30.
Будильник напомнит вам завтра утром встать в 6 часов и отправиться на утреннюю пробежку. Время бега следует контролировать в пределах 1 часа, чтобы вы не опоздали на утреннюю встречу завтра утром в 8 часов. .
Завтра утром будет солнечно, температура 25 градусов. При выходе на улицу рекомендуется носить одежду с короткими рукавами и защиту от солнца.
Как думаешь, я смогу быть твоим секретарем? У меня есть еще новые навыки?
Робин: Очень хорошо, отлично (палец вверх Сяоду), синхронизируйте эти расписания с моим мобильным телефоном.
Только что я задал Сяоду несколько вопросов, от простых запросов о новостях до сложных потребностей в планировании. Кажется, что мы общаемся с одним и тем же Xiaodu, но на самом деле за ним называются разные модели. Когда он получил мой вопрос, он сначала выполнил работу по «маршрутизации модели» на небольшой модели ERNIE Tiny для решения проблемы погоды, он вызвал точно настроенную модель на основе ERNIE Lite на основе результатов запроса погоды, который также был получен; обрабатывается программой ERNIE Lite от SFT и дает рекомендации по оформлению для более сложных графиков; Wenxin 4.0, наиболее эффективная большая модель, используется для расчета различных договоренностей с сегодняшнего вечера до завтрашнего утра;
Сегодня каждый вопрос, который мы задаем Сяоду, будет назначен для выполнения различным моделям. При вызове интерфейса API приложения будет использоваться модель ERNIE Functions. При объяснении вопросов детям будет использоваться Wenxin Big Model 3.5 или 4.0. Интеллектуальный Ассистент был создан с использованием модели персонажа ERNIE, чтобы улучшить согласованность персонажа и стимулировать желание пользователей общаться.
Благодаря этому комбинированному методу планирования больших и малых моделей Xiaodu не только успешно завершил «операцию по замене мозга» и установил новую операционную систему искусственного интеллекта DuerOS X, но также сформировал оптимальное сочетание эффекта, скорости и стоимости по сравнению со всем использованием. Флагманская версия Wenxin Large Model, скорость отклика увеличена в 2 раза, а стоимость снижена на 99%. Планшетный робот Xiaodu Tiantian AI, с которым я только что разговаривал, вчера поступил в продажу на всех основных платформах. Заинтересованные друзья могут немедленно разместить заказ, чтобы испытать его.
Эти примеры ModelBuilder демонстрируют способность Baidu эффективно и по низким ценам создавать модели. Благодаря самой мощной базовой модели Wenxin 4.0 мы можем адаптировать модели меньшего размера, подходящие для различных сценариев в соответствии с потребностями, принимая во внимание различные факторы, такие как эффект, скорость ответа и стоимость вывода, а также поддерживать точную настройку и предварительное обучение. Таким образом, модель, вырезанная за счет уменьшения размерности, значительно лучше, чем модель, скорректированная непосредственно из источника. При том же размере эффект явно лучше, а стоимость при том же эффекте явно ниже. Раньше люди использовали открытый исходный код и думали, что это дешево. На самом деле в сценариях с большими моделями открытый исходный код является самым дорогим. Таким образом, модель с открытым исходным кодом будет отставать все дальше и дальше.
Чтобы каждому было легче быстро приступить к работе, в ModelBuilder заданы наиболее полные и богатые большие модели. В него входят ERNIE3.5 и ERNIE4.0, которые являются флагманскими большими моделями, подходящими для общих сложных сцен и обладающими мощными возможностями. Также есть три легкие большие модели: ERNIE Speed, Lite и Tiny, и еще две; В качестве модели для вертикальных сцен ERNIE Feature подходит для ролевых игр; ERNIE Functions подходит для использования внешних инструментов и вызовов бизнес-функций в диалогах или сценариях вопросов и ответов. Конечно, ModelBuilder также поддерживает основные модели отечественных и зарубежных сторонних производителей, общее количество которых составляет 77, что делает его платформой разработки с наибольшим количеством крупных моделей в Китае.
Официально объявлен второй конкурс предпринимателей «Кубок Вэньсиня»: определен специальный главный приз в размере 50 миллионов тайваньских долларов.
Для разработчиков, помимо предоставления этих инструментов разработки, мы также предоставляем финансовую и ресурсную поддержку.
В мае прошлого года Baidu запустила конкурс предпринимателей «Кубок Вэньсиня», надеясь способствовать процветанию экосистемы крупных моделей, создать более динамичную экосистему и помочь предпринимателям и разработчикам разрабатывать различные собственные приложения искусственного интеллекта. На первый конкурс предпринимателей «Кубок Вэньсинь» мы получили около 1000 заявок от предпринимательских команд. Baidu предоставила почти 100 миллионов юаней инвестиционной поддержки 15 командам-победителям и продолжила предоставлять комплексную технологическую, командную и ориентационную поддержку.
Сегодня я объявляю, что второй конкурс предпринимателей «Кубок Вэньсинь» официально стартовал. На этот раз мы расширим сферу проверки проектов, создадим подобласти, ориентируемся на глобальный рынок и студентов колледжей, а также наймем команды предпринимательских инноваций. Если вашим предпринимательским направлением являются собственные приложения для искусственного интеллекта, вы можете зарегистрироваться на официальном сайте. конкурс. В то же время мы также увеличили нашу поддержку предпринимателей, предоставляя более достаточные инвестиционные фонды и более богатые бизнес-ресурсы. Мы также впервые учредили «Специальную награду». Особо выдающиеся проекты будут иметь возможность получить до 50. миллионов юаней наличными и ресурсной поддержкой.
Китайские предприниматели и разработчики очень хорошо умеют использовать новые технологии для разработки приложений. Я считаю, что Большая модель Вэньсинь станет первым выбором для китайских предпринимателей и разработчиков искусственного интеллекта, и на основе Большой модели Вэньсинь будет создаваться все больше и больше приложений. Я также надеюсь, что к нам присоединится больше предпринимателей и разработчиков, чтобы создать процветающую экосистему искусственного интеллекта.
Самый крупный сценарий применения больших визуальных моделей — автономное вождение.
Большинство инструментов и случаев, о которых мы говорили ранее, основаны на больших языковых моделях. Глядя в будущее, я считаю, что мультимодальные большие модели или сочетание текста, изображений, голоса, видео и других мультимодальных режимов являются очень важным долгосрочным направлением развития базовых моделей и единственным путем к AGI. Baidu имеет долгосрочные инвестиции в эти области и будет своевременно информировать о технологическом прогрессе.
У меня совсем другое мнение: самый большой сценарий применения больших визуальных моделей — это автономное вождение. Baidu является лучшим в этом направлении и является мировым лидером в области автономного вождения. Мы не только обучаем ИИ создавать видео, но и обучаем ИИ понимать, что происходит в реальном мире, и предсказывать будущее.
Основываясь на данных о пробеге более 100 миллионов километров дорожных испытаний в сложных городах Китая, Baidu обучила большую модель визуального восприятия Apollo. Он имеет четыре основные возможности: обнаружение, отслеживание, понимание и картографирование. Это дает Baidu более умное, более адаптируемое и безопасное решение для автономного вождения.
Baidu Maps также стала лидером в применении крупномасштабных моделей визуального восприятия в области картографии. Теперь крупнейшие в мире картографические данные на уровне полос движения были запущены в 360 городах по всей стране. Пока существует навигация по картам Baidu, умное вождение может управлять автомобилем.
После Весеннего фестиваля в этом году компания Baidu Carrot Run завершила «первый участок» реки Янцзы. Мы расширили наши услуги с северного берега до южного берега реки Янцзы. В некоторых районах Ухани мы достигли круглосуточной работы. -погодная операция, и мы планируем сделать это в течение года. Ухань развернет 1000 беспилотных автомобилей.
Это знаковое событие для того, чтобы автономное вождение стало по-настоящему коммерциализированным. Это уже не просто региональная демонстрация, а вступило в новый этап демонстрации приложений на уровне города. Луобо Куайпао занимает площадь более 3000 квадратных километров и имеет население в 7,7 миллиона человек в Ухане, что делает его крупнейшей территорией автономного вождения в мире.
«Собери и забери, используй, когда захочешь».
Только что я показал вам большую серию моделей Baidu Wenxin и три инструмента разработки — AgentBuilder, AppBuilder и ModelBuilder. Они образуют набор инструментов, который вы можете сразу же забрать и использовать в любое время.
В данный момент я стою здесь, я на самом деле разработчик и предприниматель, и я так же взволнован, как и все остальные. Сегодня в Китае 1 миллиард пользователей Интернета, сильная базовая крупномасштабная модель, достаточное количество сценариев применения искусственного интеллекта и самая полная промышленная система в мире. Страна также активно поощряет и поддерживает действие «искусственный интеллект +». Каждому предприятию достаточно только в полной мере использовать эти инструменты, чтобы раскрыть безграничный творческий потенциал и продуктивность.
Сегодня каждый может стать разработчиком. И будущее определенно будет будущим, созданным разработчиками вместе.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Выступление Робина Ли на конференции разработчиков искусственного интеллекта Baidu: Что узнал Baidu после того, как столкнулся с бесчисленными ловушками?
Сценарист: Лиан Ран
Редактор: Чжэн Сюань
Источник: Компьютерщик
«Естественный язык станет языком программирования следующего поколения, и каждый сможет стать разработчиком».
16 апреля в Шэньчжэне прошла конференция разработчиков AI Baidu Create 2024. Основатель, председатель и генеральный директор Baidu Робин Ли выступил с программной речью на тему «Каждый является разработчиком», описав мир, который больше не ограничивается миром навыков кодирования. но эпоха, когда естественный язык используется в качестве средства массовой информации, и каждый может участвовать в творчестве.
Выпуск версии инструмента Wenxin Large Model 4.0 от Baidu сделал концепцию, описанную Робином Ли, на большой шаг ближе к реальности. Этот инструмент не только позволяет разработчикам обрабатывать сложные данные и файлы посредством взаимодействия на естественном языке, но также может создавать диаграммы или файлы, чтобы быстро получить представление о характеристиках данных, проанализировать изменяющиеся тенденции и обеспечить эффективную и точную поддержку для последующего принятия решений. .
В то же время во время основного выступления Робин Ли представил три основных инструмента разработки, в том числе инструмент разработки агентов AgentBuilder, инструмент разработки собственных приложений AI AppBuilder и инструмент настройки модели ModelBuilder. Эти инструменты значительно снизили порог разработки, позволяя разработчикам создавать мощные, простые в использовании и удобные приложения искусственного интеллекта всего за несколько простых шагов.
Источник изображения: Baidu
Робин Ли отметил: «Интеллектуальные агенты могут стать самым близким и наиболее распространенным способом использования больших моделей для всех в будущем. На основе мощных базовых моделей интеллектуальные агенты могут создаваться партиями и применяться в различных сценариях. Baidu только что обновила Wenxin Разведка. На данный момент создано более 30 000 агентов, на нем обосновались более 50 000 разработчиков и десятки тысяч компаний».
По мнению Робина Ли, разрабатывать приложения в будущем будет так же просто, как снять короткое видео. У каждого есть возможность стать разработчиком, и каждый является творцом. «Сегодня можно создать приложение, не умея писать код; можно создать интеллектуальный агент без программирования. ИИ совершает революцию в творчестве. В будущем разрабатывать приложения будет так же просто, как снять короткое видео, и каждый может. Мы все разработчики, каждый — творец».
В своем выступлении Робин Ли поделился конкретными идеями и инструментами, которые Baidu реализовала в прошлом году для разработки собственных приложений искусственного интеллекта. Он подчеркнул: «Большие языковые модели сами по себе не создают ценности напрямую. Только приложения ИИ, разработанные на основе больших моделей, могут удовлетворить реальные потребности рынка. Сегодня я хочу поделиться с вами некоторыми конкретными идеями и инструментами для разработки собственных приложений ИИ на основе больших моделей». Это то, чего мы в Baidu добились, преодолев бесчисленные ловушки и заплатив высокую плату за обучение, исходя из нашей практики за последний год».
Ниже приводится стенограмма основного выступления Робина Ли на тему «Каждый является разработчиком», составленная Geek Park.
Привет всем, добро пожаловать на конференцию разработчиков AI Baidu Create 2024. Впервые конференция Create проводится в районе Большого залива Гуандун-Гонконг-Макао. Сегодня на мероприятие пришли более 5000 разработчиков и энтузиастов технологий.
За последний год я общался со многими предпринимателями и разработчиками и чувствую, что все находятся в состоянии «FOMO», то есть страха упустить что-то. Они одновременно взволнованы и боятся что-то упустить. Действительно, большие модели и генеративный искусственный интеллект полностью изменят сообщество разработчиков.
В прошлом разработчики использовали код, чтобы изменить мир; в будущем естественный язык станет новым универсальным языком программирования. Пока вы умеете говорить, вы можете стать разработчиком и использовать свои творческие способности, чтобы изменить мир.
Этот день не за горами. Мы увидели, что благодаря мощной базовой большой модели и множеству инструментов разработки с низким или даже нулевым порогом производительность разработчиков значительно повысилась.
Например, Comate, интеллектуальный помощник по написанию кода, основанный на большой модели Wenxin, не только поддерживает более 100 языков и все основные платформы IDE, но и может рекомендовать коды, генерировать комментарии к коду, находить дефекты кода и предлагать решения по оптимизации. Он также может глубоко интерпретировать библиотеку кода и сопоставлять знания о частной области, генерирующие новый код. После более чем года работы Comate использовался десятками тысяч компаний, таких как Himalaya, Mitsubishi Elevator, iSoftStone и т. д., а уровень внедрения сгенерированного кода достиг 46 % кодов, добавляемых Baidu каждый год. день, 27% было получено Comate of.
Сегодня вы можете создать приложение ИИ без написания кода; вы можете создать интеллектуальный агент без программирования; ИИ совершает революцию в творчестве. В будущем разрабатывать приложения будет так же просто, как снимать короткое видео. Каждый — разработчик, каждый — создатель.
Роль Baidu как технологической компании заключается в том, чтобы предоставить каждому максимально возможное количество инструментов разработки, необходимых для постоянного повышения творческих способностей всего общества. В частности, мы предлагаем мощную базовую серию моделей, а именно серию больших моделей Wenxin, включающую флагманские версии ERNIE3.5, ERNIE4.0 и облегченные версии ERNIE Speed, Lite, Tiny и т. д.
Мы также предоставляем инструменты для разработки различных приложений на основе больших моделей, включая инструмент разработки агентов AgentBuilder, собственный инструмент разработки приложений AI AppBuilder и инструмент настройки модели ModelBuilder различных размеров. Все эти три инструмента представляют повышенную производительность. Ниже я покажу вам один за другим.
У Wenxin Yiyan более 200 миллионов пользователей, выпущена версия инструмента Wenxin Big Model 4.0.
Для начала давайте поговорим о последних достижениях Вэнь Синь И Яня и большой модели Вэнь Синь:
Прошел год и один месяц с тех пор, как 16 марта прошлого года Вэнь Синь Иян была освобождена. Число наших пользователей превысило 200 миллионов, среднее количество ежедневных вызовов API также превысило 200 миллионов, количество клиентов, которых мы обслуживаем, достигло 85 000, а количество собственных приложений искусственного интеллекта, разработанных с использованием платформы Qianfan, превысило 190 000.
Давайте посмотрим, что все делают с Вэнь Синьианом?
Реальные люди на видео — лишь верхушка айсберга. Мы видим, что Вэнь Синьянь меняет работу и жизнь большего числа людей.
Базовая модель, подтверждающая слова Вэнь Синя, — это большая модель Вэнь Синя. За последний год она изменилась с версии 3.0 до версии 3.5, а затем до версии 4.0. Wenxin 4.0 достиг ведущего в отрасли уровня по четырем основным возможностям: понимание, генерация, логика и память.
В последние месяцы Wenxin Big Model добилась дальнейших значительных улучшений в общих возможностях, таких как генерация кода, интерпретация кода и оптимизация кода, достигнув лидирующего международного уровня.
Сегодня мы официально выпустили версию инструмента Wenxin Big Model 4.0. Теперь вы можете использовать функцию интерпретатора кода в этой версии инструмента. Благодаря взаимодействию на естественном языке вы можете обрабатывать и анализировать сложные данные и файлы, а также создавать диаграммы или файлы. файлы могут быстро получить представление о характеристиках данных, проанализировать изменяющиеся тенденции и обеспечить эффективную и точную поддержку для последующего принятия решений.
Большая модель Вэньсинь стала самой ведущей и наиболее широко используемой базовой моделью искусственного интеллекта в Китае.
Мало того, что по сравнению с годом ранее эффективность обучения алгоритма большой модели Вэньсинь увеличилась в 5,1 раза, средняя еженедельная эффективность обучения достигла 98,8%, производительность вывода увеличилась в 105 раз, а стоимость вывода выросла упал до 1% от исходного.
Другими словами, первоначально клиент звонил 10 000 раз в день, но теперь может звонить 1 миллион раз по той же цене. Средства массовой информации, вероятно, не будут в восторге от снижения затрат на 99%. Но будь то предприятие или разработчик, после его использования самое главное — это эффект и стоимость.
Мы можем повысить производительность, сократив затраты на логический вывод до 1 % именно потому, что Baidu имеет полнофункциональную четырехуровневую архитектуру микросхем, платформ, моделей и приложений. Благодаря сквозной оптимизации мы продолжаем снижать затраты. Это позволит большему количеству людей использовать большие модели для эффективного и недорогого создания приложений ИИ.
Нет сомнений в том, что темы, связанные с большими моделями, по-прежнему будут актуальными в 2024 году, а различные технологические прорывы будут продолжать появляться. Средства массовой информации по-прежнему будут активно использовать такие названия, как «шокирующий релиз» и «эпическое обновление», чтобы представить это. Но я хочу подчеркнуть, что большие модели сами по себе не создают ценности напрямую. Только приложения ИИ, разработанные на основе больших моделей, могут удовлетворить реальные потребности рынка.
Поделитесь конкретными идеями и инструментами для разработки собственных приложений искусственного интеллекта: «Я столкнулся с бесчисленными ловушками и заплатил высокую плату за обучение».
Сегодня я хочу поделиться с вами некоторыми конкретными идеями и инструментами для разработки собственных приложений ИИ на основе больших моделей. Это то, чего мы в Baidu добились на основе нашей практики за последний год, наступая на бесчисленные ловушки и платя высокую плату за обучение.
Первое – МО. В будущем крупномасштабные собственные приложения искусственного интеллекта будут в основном использовать архитектуру MoE. Упомянутая здесь MoE — это не общая академическая концепция, а смесь больших и малых моделей, без использования одной модели для решения всех проблем. Но когда вызывать маленькую модель, когда вызывать большую модель, а когда не вызывать модель, все они имеют техническое содержание и должны соответствовать различным сценариям применения.
Вторая – маленькая модель. Маленькие модели имеют низкие затраты на вывод и быстрое время отклика. В некоторых конкретных сценариях производительность небольшой модели, точно настроенной с помощью SFT, может быть сопоставима с производительностью большой модели. Именно поэтому мы выпустили три облегченные модели: Speed, Lite и Tiny. Мы сжимаем и очищаем большую модель для создания базовой модели, а затем используем данные для обучения. Это намного лучше, чем обучение небольшой модели с нуля. Это лучше, быстрее и дешевле, чем модель, обученная на основе открытого исходного кода. модель.
Третий — интеллектуальный агент. Интеллектуальные агенты сейчас являются горячей темой. По мере совершенствования возможностей интеллектуальных агентов будет продолжать появляться большое количество новых приложений. Механизм интеллектуального агента включает в себя понимание, планирование, размышление и эволюцию. Он позволяет машинам думать и действовать как люди. Они могут выполнять сложные задачи автономно, продолжать учиться в окружающей среде и осуществлять самоитерацию и эволюцию. В некоторых сложных системах мы также можем позволить различным агентам взаимодействовать и сотрудничать друг с другом для выполнения задач с более высоким качеством. Мы разработали эти возможности агента и полностью открыты для разработчиков.
По трем направлениям: МО, небольшие модели и агенты, Baidu предоставила «готовые» инструменты для каждого. Далее я представлю вам три различных инструмента, а именно: инструмент разработки агентов AgentBuilder, собственный инструмент разработки приложений AI AppBuilder и инструмент настройки моделей различных размеров ModelBuilder.
Инструмент разработки агентов AgentBuilder
Первый — это инструмент разработки агентов AgentBuilder. Агенты могут стать самым близким и наиболее распространенным способом использования больших моделей для всех в будущем. На основе мощных базовых моделей агенты можно будет создавать в пакетном режиме и применять в различных сценариях.
Baidu только что обновила свою интеллектуальную агентскую платформу Wenxin. На данный момент создано более 30 000 агентов, обосновалось более 50 000 разработчиков и десятки тысяч компаний. Наша цель — дать возможность каждой организации стать разработчиком интеллектуальных агентов и создать наиболее полную экосистему интеллектуальных агентов в Китае.
Так как же достичь этой цели? Целью проекта является предоставить каждому инструмент разработки агентов с нулевым порогом AgentBuilder.
Давайте сначала возьмем в качестве примера «Совет по туризму Сингапура», чтобы увидеть, как создается интеллектуальный агент.
Сначала мы открываем платформу агента Wenxin. Страница создания имеет два режима: с нулевым кодом и с низким кодом. Новички могут напрямую выбрать «режим с нулевым кодом» и использовать естественный язык для создания агента в нескольких предложениях.
Сначала мы назвали агента «Совет по туризму Сингапура», а затем указали в настройках, что нам нужно для создания планов поездок, ответов на вопросы и предоставления услуг по бронированию билетов в отели. Эти настройки используются для управления агентом. Вы можете указать, что он делает. .
Если нужны только базовые агенты, платформа автоматически завершит заполнение. Но мы надеемся, что «Совет по туризму Сингапура» является профессиональным интеллектуальным агентом, поэтому требуется расширенная настройка. Я могу добавлять записи Сингапурской энциклопедии и ссылки на официальные веб-сайты в базу знаний, и она будет обновляться каждый день. Затем добавьте некоторые инструменты, такие как запрос отелей, покупка билетов на аттракционы и т. д., чтобы расширить возможности обслуживания. В настоящее время мы сотрудничаем с Ctrip, предоставляя инструменты туристических услуг, такие как отели, достопримечательности и продажа билетов. Таким образом, интеллектуальный агент Сингапурского управления по туризму готов, который можно дополнительно просмотреть и настроить.
Теперь откройте приложение Baidu и найдите «Когда в Сингапуре будет меньше всего людей, потому что во время путешествий все хотят избежать скопления людей?» Агент объединит информацию из нескольких источников, чтобы сгенерировать ответ: «В январе-марте людей меньше всего». Мы также можем нажать на агента, чтобы продолжить взаимодействие с ним, например, получить советы по поездке в Сингапур, рекомендации по трем лучшим отелям Сингапура, а также его можно использовать для прямого бронирования билетов в Universal Studios Singapore — универсальное решение. для наших нужд, что экономит много времени пользователя.
Помимо Сингапура, на платформе интеллектуальных агентов Wenxin также доступны интеллектуальные агенты в сфере культуры и туризма, такие как Далянь и Шэньян. Существуют также различные интеллектуальные агенты для знаний, творчества, обучения, развлечений и т. д. Все они используются компанией AgentBuilder. .
Когда в прошлом году впервые был выпущен «Вэнь Синьиян», я сказал, что «Вэньсиньянь» повлияет на каждую компанию. Благодаря своим мощным возможностям понимания, выражения и рассуждения на естественном языке он может приблизить любую компанию к ее клиентам.
Сегодня каждый продавец и каждый покупатель могут иметь эксклюзивного интеллектуального агента на Baidu. Весь процесс вообще не требует программирования. Введя информацию, похожую на слова-подсказки, и скорректировав несколько простых шагов, можно быстро создать интеллектуального агента, который станет продавцом с золотой медалью в режиме онлайн 24/7.
Давайте посмотрим, как устроен агент бизнес-разведки.
Kai Tak Education — известная образовательная компания с более чем 60 филиалами по всей стране и множеством зарубежных филиалов. Она охватывает широкий спектр стран и предъявляет высокие требования к навыкам приема. Как мы можем отвечать на запросы клиентов 24 часа в сутки, улучшить уровень приема и сократить эксплуатационные расходы?
Kai Tak Education использует AgentBuilder от Baidu для создания собственного интеллектуального агента.
Давайте посмотрим, как создать интеллектуального агента с базовыми возможностями. Это очень просто. Введите аватар, имя, сферу деятельности и приветственное сообщение агента на платформе, а затем укажите некоторую информацию, которую должен предоставить пользователь, например возраст и образование. Через 5 минут и при нулевом пороге интеллектуальный агент готов.
Кай Так Эдьюкейшн также надеется, что этот агент будет консультантом по обучению за рубежом, который разбирается в бизнесе и студентах. Он может проводить профессиональный анализ и давать точные ответы в зависимости от различных ситуаций студентов, например, хотят ли они поехать в Соединенные Штаты или Австралию, хотят ли они получить степень магистра или бакалавра, какие баллы они набрали на IELTS и TOEFL, и т. д. Мы можем создать более продвинутого интеллектуального агента, добавив несколько модулей, таких как знания, роли и инструменты.
В модуле знаний загрузите знания из частной области и позвольте платформе анализировать их в режиме реального времени и автоматически генерировать материалы для диалога в ролевом модуле, добавьте в схему фильтрации некоторые страны обучения за рубежом, которые не входят в сферу деятельности бизнеса, что может улучшиться; эффективность пользовательских подсказок в инструментальном модуле, добавление таких услуг, как бронирование в магазине; С помощью этих нескольких простых операций готов образовательный интеллектуальный агент Qi Tak с профессиональными возможностями.
Теперь давайте найдем «Требования к подаче заявления на обучение в Австралии». Мы видим, что агент быстро предоставляет семь необходимых условий, таких как требуемое знание языка и выбор специальности, а также может предоставить соответствующие консультационные планы обучения за границей для решения различных проблем. будет дан ответ, и на все запросы будут даны ответы.
Kai Tak Educational Intelligence очень популярен. За первую неделю после запуска он был успешно распространен 1,55 миллиона раз и взаимодействовал с пользователями 58 000 раз. Количество конверсий лидов росло линейно, стоимость конверсии эффективных лидов значительно снизилась, а эффективность работы значительно повысилась.
Далее я познакомлю вас с интеллектуальным агентом в домашней индустрии.
Sophia — бренд товаров для дома, специализирующийся на индивидуальной отделке всего дома. Как только что было показано, он также может создать базовую бизнес-аналитику, заполнив чрезвычайно простую информацию. Но для индустрии товаров для дома опыт потребителей в офлайн-режиме более важен, поэтому София надеется добиться золотой медали продаж в Интернете и восстановить опыт приема в офлайн-режиме.
Поэтому в дальнейших настройках он выбрал цифровых людей в качестве метода отображения в ролевом модуле, затем выбрал соответствующие фоны и голоса для цифровых людей и в сочетании с возможностями интеллектуального анализа платформы автоматически суммировал набор методов продаж. В конце концов, мы создали продавца с золотой медалью, мягкого, доброго и профессионального в разговорных навыках. Она может удовлетворять различные потребности пользователей 24 часа в сутки и предоставлять услуги высокого уровня.
Когда у пользователя поиска Baidu есть запрос на украшение, агент София будет использовать возможность большой модели Wenxin, чтобы сначала дать ответ на вопрос. Кроме того, она также будет активно подтверждать конкретные потребности клиентов, такие как тип украшения, бюджет и т. д., и рекомендовать близлежащие офлайн-магазины.
С момента запуска Sophia Merchant Intelligence эффективные затраты на потенциальных клиентов снизились на 30%. Другими словами, чтобы привлечь эффективного клиента, если раньше стоимость составляла 100 юаней, сейчас это стоит всего 70 юаней.
В настоящее время более 10 000 клиентов Baidu имеют торговую информацию, охватывающую более 30 отраслей, таких как образование и обучение, недвижимость и мебель, машины и оборудование, а также бизнес-услуги.
Выше, с помощью трех демонстраций, я показал, как разработчики и продавцы могут использовать AgentBuilder для создания интеллектуальных агентов для различных отраслей.
Теперь создание интеллектуального агента действительно занимает всего несколько минут. Но вот проблема! Если нет трафика, нет распространения, нет поиска и никто его не использует, то у разработчиков и мерчантов не будет дохода. Без дохода не будет мотивации. Как решить эту болевую точку?
Наша агентская платформа Wenxin предоставляет разработчикам возможность монетизировать трафик. Помимо Baidu Search, другие продукты в экосистеме Baidu, такие как Xiaodu, Maps, Tieba, Cheji и т. д., могут быть подключены к соответствующим возможностям интеллектуального агента, решая проблемы распределения трафика для разработчиков и получая реальные результаты. преимущества.
Если есть распределение, будет и обратная связь по данным; при наличии обратной связи маховик будет вращаться, и интеллектуальный агент сможет выполнять итерации самостоятельно, и чем больше он будет использоваться, тем умнее он станет. Агентская платформа Wenxin также запустила модули анализа данных агента и настройки вопросов и ответов, а в ближайшее время будут запущены новые возможности. Платформа интеллектуальных агентов Wenxin будет стимулировать интеллектуальных агентов формировать позитивный цикл лучшего качества, лучшего трафика и больших доходов посредством маховика данных распределения-диагностики-доходов.
AppBuilder: вы можете разработать приложение на естественном языке в три этапа.
Далее я познакомлю вас со вторым инструментом разработки — AppBuilder. На данный момент это лучший инструмент для разработки собственных приложений с использованием искусственного интеллекта. В AppBuilder мы заранее инкапсулировали и предварительно установили различные компоненты и платформы, необходимые для разработки собственных приложений ИИ, что значительно снижает порог разработки.
Всего за три шага разработчики могут разработать собственное приложение искусственного интеллекта с использованием естественного языка, которое можно легко выпустить и интегрировать в различные бизнес-среды. Давайте рассмотрим несколько случаев:
В начале этого года мы провели конкурс по разработке собственных приложений для искусственного интеллекта. Темой конкурса было использование AppBuilder для создания «помощника по планированию очереди на игровой площадке», который поможет туристам лучше понять ситуацию с очередью на детской площадке и разработать персонализированные игровые маршруты. лучший игровой опыт за ограниченное время.
Чемпион этого конкурса разработал приложение, не написав ни единой строчки кода, и выиграл главный приз в размере 100 000 юаней, предоставленный Baidu. Если вы можете написать код для этой темы, вам не составит труда его написать, но если вы все еще можете сделать это, не написав ни строчки кода, это все равно во многом зависит от базовой модели и возможностей инструмента AppBuilder.
Давайте посмотрим, как использовать AppBuilder для создания этого приложения AI.
Давайте сначала рассмотрим вопросы конкурса. Он предполагает время ожидания и индекс стимуляции каждого проекта в «Universal Studios», поэтому получение опыта с наибольшим индексом стимуляции за ограниченное время является задачей, которую предстоит решить в этом выпуске.
Сначала открываем интерфейс разработки AppBuilder и называем приложение «Помощник по организации очереди на игровой площадке»; во-вторых, в ролевых инструкциях описываем конкретные требования, включая вызов интерпретатора кода, расчет лучшей комбинации в течение фиксированного времени, вывод результатов и т. д. ; Третий шаг — перейти к инструментальному компоненту и добавить интерпретатор кода, который поможет с расчетами.
Теперь проверим эффект. Введите вопрос «У меня есть 3 с половиной часа, как играть интереснее всего?». Вы можете видеть, что интерпретатор кода переводит этот вопрос в код, а затем вызывает. инструмент понимания данных. Анализ известных условий. После ряда расчетов был сделан вывод, что наилучшие результаты будут достигнуты при объединении этих четырех проектов: «Гарри Поттер и запретное путешествие», «Приключения юрского периода», «Американские горки десептиконов» и «Бамблби-спиннер». Если с тестом проблем нет, нажмите «Опубликовать», и приложение будет создано без кода.
Теперь AppBuilder был дополнительно обновлен. В процессе создания все могут использовать функцию «Оптимизированная конфигурация с использованием искусственного интеллекта», которая автоматически помогает разработчикам оптимизировать инструкции ролей, конфигурацию компонентов и другие аспекты, что еще больше повышает эффективность разработки.
Давайте посмотрим на другой пример.
В начале этого года Северо-Китайский университет электроэнергетики заявил, что надеется предоставлять интеллектуальные и эксклюзивные услуги учителям и ученикам всей школы. На основе AppBuilder от Baidu мы совместно создали Huadian AI Assistant. Теперь позвольте мне показать вам, как создается Huadian AI Assistant:
Шаг 1. Откройте AppBuilder, войдите на страницу создания и нажмите AI, чтобы автоматически сгенерировать конфигурацию. Сначала укажите для приложения основную информацию, такую как имя, представление, аватар и т. д.
Шаг 2. Используйте естественный язык для описания конкретных требований в ролевых инструкциях, включая задачи, возможности компонентов, требования и ограничения.
Шаг 3. Вставьте настраиваемые компоненты, такие как запрос на получение книг, запрос о расписании занятий, запрос об успеваемости учащихся и т. д., чтобы ассистент кампуса мог иметь возможности интеллектуального обслуживания. Затем добавьте вступительное слово для Campus Assistant, и приложение будет настроено.
Далее отлаживаем помощника в интерфейсе предварительного просмотра на основе вопросов пользователей. Например, спросите о времени регистрации на экзамены CET-4 и CET-6 и проверьте эффект автоматического вызова каждого компонента.
Как видите, посредством этих простых операций приложение завершено. В настоящее время он запущен в мелкомасштабное тестирование и связан с высокочастотными сценариями, такими как проверка системы, проверка курсов, пополнение карточек на питание, получение книг и т. д., и обслуживает большинство учителей и студентов. в школе. В будущем мы будем сотрудничать с Северо-Китайским университетом электроэнергетики для дальнейшего углубления сотрудничества в области приложений и предоставления более обширных и удобных услуг.
Baidu также имеет многолетний опыт накопления кросс-модальных технологий. В AppBuilder мы также предоставляем определенные кросс-модальные возможности. Вам нужно всего лишь указать абзац текста или несколько предложений, чтобы быстро создавать приложения для рисования, такие как комиксы, детские книжки с картинками и т. д.
Процесс также очень прост: откройте AppBuilder, нажмите, чтобы войти в «Создание приложения», введите инструкции по роли, выберите компонент «Добавить изображение Винсента», введите три рекомендуемых вопроса и нажмите, чтобы опубликовать. После завершения приложения нам нужно только ввести приблизительный персонаж или сюжет, и AppBuilder может автоматически генерировать историю и выводить изображения.
Новейшая интеллектуальная функция создания комиксов и книжек с картинками Baidu Wenku использует такие компоненты, предоставленные в AppBuilder. Давайте посмотрим, как функция создания комиксов Baidu Wenku позволяет каждому, у кого есть творческие идеи, создавать хорошие работы.
Возьмем, к примеру, классическую «Чжоу Чу устраняет три зла».
Откройте библиотеку Baidu и войдите в тему «Чжоу Чу устраняет три зла». Это написано в «Книге Цзинь» и «Шишуосинь». После поиска в библиотеке история будет создана на основе исходного текста. Мы также можем изменить. Внесите изменения в содержание истории, затем нажмите панель инструментов AI справа, чтобы начать создание этого комикса.
Войдите в интерфейс создания комиксов, и Wenku автоматически создаст для нас раскадровки комиксов на основе сюжетной линии, а затем выберет стиль комикса, который лучше всего подходит для истории, из различных стилей, таких как свет и тень, реализм, мультфильм и т. д., наконец, выберите другой; персонажи по персонажам, так что генерация комикса завершена.
После создания комикса мы можем просмотреть его целиком в интеллектуальном редакторе комиксов Baidu Wenku. При этом библиотека поддерживает редактирование, модификацию и тонкую настройку каждой картинки. Например, выберите слева картинку «Чжоу Чу и Белолобый тигр», нажмите «Редактировать», добавьте описание картинки «Лицо персонажа». четкое, изображение яркое», и вы можете его точно настроить. Вызовите комиксы, которые лучше соответствуют вашим потребностям. Как видите, комическая функция Baidu Wenku отлично справляется с точки зрения стилистической согласованности персонажей и сцен.
Интеллектуальные комические возможности Baidu Wenku значительно повысили эффективность создания комиксов, снизили стоимость и порог создания комиксов и позволили более вдумчивым и творческим людям реализовать свои мечты о создании комиксов.
Помимо создания комиксов, Baidu Wenku теперь может помочь пользователям создавать книжки с картинками с нулевым порогом. Возможно, вы не знаете, что китайские дети читают всего 10 книжек с картинками в год на душу населения, тогда как в странах Европы и Америки их около 50. Теперь ИИ может позволить родителям, не умеющим рисовать, создать для своих детей эксклюзивную детскую книжку с картинками. Давайте посмотрим эту иллюстрированную аудиокнигу!
С прошлого года мы использовали ИИ для реконструкции Baidu Wenku, сделав его «отправной точкой для производства контента» для пользователей. Теперь, при поддержке AppBuilder, недавно выпущенные функции интеллектуальных комиксов Baidu Wenku и интеллектуальных книжек с картинками расширили сцену до более интересных кросс-модальных областей создания.
Я только что использовал три примера, чтобы показать, как использовать AppBuilder от Baidu для создания собственных приложений ИИ. Каждый должен почувствовать два очевидных преимущества AppBuilder:
Во-первых, это мощно. Опираясь на способность Wenxin 4.0 понимать и следовать инструкциям, наш AppBuilder может гарантировать, что холодный запуск достигнет хорошего уровня. Настройка не займет много времени из-за низкой производительности, что значительно снижает порог разработки. Благодаря технологии улучшения поиска RAG в типичных сценариях, таких как вопросы и ответы на знания, наш уровень точности вопросов и ответов и уровень дружелюбных ответов достигли более 95%, что значительно превосходит другие аналогичные продукты. AppBuilder также предоставляет богатый и полный набор инструментов, включая 55 компонентов, таких как поиск Baidu и другие компоненты возможностей искусственного интеллекта, основанные на многолетнем накоплении технологий Baidu, компоненты возможностей больших моделей и эксклюзивные компоненты открытого бизнеса Baidu. А также сторонние API для некоторых основных сценариев, таких как запрос рейса, запрос бумаги и т. д. Мы также только что поддержали пользовательские компоненты, поэтому клиенты могут напрямую подключать любые свои собственные инструменты и данные. Эти богатые компоненты совместно поддерживают эффективную разработку собственных приложений искусственного интеллекта.
Во-вторых, он прост и удобен в использовании. Используя AppBuilder, вы можете быстро создавать приложения за три шага и распространять их одним щелчком мыши. Мы также поддерживаем SDK с открытым исходным кодом для облегчения вторичной разработки.
Инструмент настройки модели ModelBuilder: эффективное и недорогое создание моделей
Далее я представлю инструмент, который больше подходит для профессиональных разработчиков, а именно ModelBuilder. Он может настраивать модели любого размера в соответствии с потребностями разработчиков и дополнительно настраивать SFT на основе разделенных сценариев, чтобы можно было получить лучшие результаты. достигнут эффект. Для разработчиков, чтобы эффективно использовать большие модели, очень важно освоить метод точной настройки модели.
Давайте возьмем в качестве примера сценарий исправления эссе в сфере образования. Потому что коррекция состава имеет четкие стандарты оценки, а разные оценки имеют разные требования к композиции и стандарты оценки. Это требует тонкой настройки модели, чтобы выходные результаты большой модели более соответствовали конкретным требованиям.
Давайте посмотрим, как ModelBuilder реализует точную настройку модели для оценки эссе.
Шаг 1: Создайте набор данных. Эффективность точной настройки модели во многом зависит от качества наших данных. В этом случае исходные данные содержат всего 180 элементов, а качество недостаточно высокое. Нам нужно использовать три функции: очистку данных, аннотацию данных и улучшение данных. Очистка данных позволяет быстро устранить пробелы в данных, искаженные символы и другие проблемы. Что касается аннотации данных, мы добавили в композицию больше измерений, таких как глубина контента, техника письма и другие оценки. Функция расширения данных может генерировать аналогичные, но не повторяющиеся данные для расширения данных. После расширения ModelBuilder сгенерировал для нас 920 фрагментов высококачественных данных.
Вторым шагом является переход на этап тонкой настройки модели. Для начала нам нужно выбрать базовую модель для тонкой настройки. Здесь в качестве базовой модели мы выбираем ERNIE Speed. Затем мы настраиваем параметры в соответствии с рекомендуемыми значениями платформы. На этот раз данные близки к 1000. Согласно рекомендуемым раундам итерации, конфигурация составляет 10 раундов, а затем модель может начать обучение.
Шаг 3. Разверните модель на платформе, и весь процесс тонкой настройки завершен.
Давайте воспользуемся сочинением для средней школы, чтобы проверить эффект точно настроенной модели. Название эссе – «С нетерпением жду взросления», ограничений по теме нет, объем должен быть не менее 800 слов.
Мы вводим требования к сочинению учащегося и формату коррекции в две модели до и после тонкой настройки. Давайте посмотрим на сравнение двух моделей и комментарии учителя. Видно, что точно настроенная большая модель имеет более профессиональное мышление учителя и лучшее соответствие формату. Задачи по исправлению эссе, которые изначально требовали от учителей много времени, теперь могут быть выполнены быстро с помощью больших моделей за несколько секунд, что значительно повышает скорость и эффективность обратной связи с учащимися. В настоящее время этот тип доработанной модели используется во многих ведущих компаниях образовательной отрасли.
Ранее я упоминал, что крупномасштабные собственные приложения ИИ обычно создаются Министерством образования. Итак, как объединить эти модели, чтобы получить лучшее соотношение цены и качества? Далее я воспользуюсь Xiaodu, чтобы продемонстрировать пример маршрутизации модели MoE. Давайте сначала посмотрим, стал ли Сяоду умнее с благословения большой модели:
Робин: Сяоду Сяоду
Сяоду: Вот ты где
Робин: Какие новости сегодня?
Сяоду: Сяоду транслирует 3-5 выпусков новостей за день.
Робин: Сяоду Сяоду. Я слышал, что в последнее время ты стал более способным? Сяоду: Я могу не только общаться с тобой, но и быть твоим ИИ-помощником по расписанию.
Робин: Тогда я собираюсь тебя проверить. Пожалуйста, помогите мне составить расписание. После сегодняшнего мероприятия я поужинаю с г-ном Чжаном, а затем в отеле состоится встреча руководства, которая продлится около полутора часов, я надеюсь, что она закончится до 10 часов. 'Часы. Завтра утром я собираюсь пойти на утреннюю пробежку и посмотреть, какая погода. Затем в 8 утра у меня назначена встреча. Пожалуйста, помогите мне составить расписание.
Сяоду: Основываясь на ваших потребностях, Сяоду составит для вас оптимальное расписание следующим образом:
Ваш ужин с г-ном Чжаном запланирован на 18:00-19:30. После этого вы примете участие в собрании руководства в 20:00 и завершится около 21:30.
Будильник напомнит вам завтра утром встать в 6 часов и отправиться на утреннюю пробежку. Время бега следует контролировать в пределах 1 часа, чтобы вы не опоздали на утреннюю встречу завтра утром в 8 часов. .
Завтра утром будет солнечно, температура 25 градусов. При выходе на улицу рекомендуется носить одежду с короткими рукавами и защиту от солнца.
Как думаешь, я смогу быть твоим секретарем? У меня есть еще новые навыки?
Робин: Очень хорошо, отлично (палец вверх Сяоду), синхронизируйте эти расписания с моим мобильным телефоном.
Только что я задал Сяоду несколько вопросов, от простых запросов о новостях до сложных потребностей в планировании. Кажется, что мы общаемся с одним и тем же Xiaodu, но на самом деле за ним называются разные модели. Когда он получил мой вопрос, он сначала выполнил работу по «маршрутизации модели» на небольшой модели ERNIE Tiny для решения проблемы погоды, он вызвал точно настроенную модель на основе ERNIE Lite на основе результатов запроса погоды, который также был получен; обрабатывается программой ERNIE Lite от SFT и дает рекомендации по оформлению для более сложных графиков; Wenxin 4.0, наиболее эффективная большая модель, используется для расчета различных договоренностей с сегодняшнего вечера до завтрашнего утра;
Сегодня каждый вопрос, который мы задаем Сяоду, будет назначен для выполнения различным моделям. При вызове интерфейса API приложения будет использоваться модель ERNIE Functions. При объяснении вопросов детям будет использоваться Wenxin Big Model 3.5 или 4.0. Интеллектуальный Ассистент был создан с использованием модели персонажа ERNIE, чтобы улучшить согласованность персонажа и стимулировать желание пользователей общаться.
Благодаря этому комбинированному методу планирования больших и малых моделей Xiaodu не только успешно завершил «операцию по замене мозга» и установил новую операционную систему искусственного интеллекта DuerOS X, но также сформировал оптимальное сочетание эффекта, скорости и стоимости по сравнению со всем использованием. Флагманская версия Wenxin Large Model, скорость отклика увеличена в 2 раза, а стоимость снижена на 99%. Планшетный робот Xiaodu Tiantian AI, с которым я только что разговаривал, вчера поступил в продажу на всех основных платформах. Заинтересованные друзья могут немедленно разместить заказ, чтобы испытать его.
Эти примеры ModelBuilder демонстрируют способность Baidu эффективно и по низким ценам создавать модели. Благодаря самой мощной базовой модели Wenxin 4.0 мы можем адаптировать модели меньшего размера, подходящие для различных сценариев в соответствии с потребностями, принимая во внимание различные факторы, такие как эффект, скорость ответа и стоимость вывода, а также поддерживать точную настройку и предварительное обучение. Таким образом, модель, вырезанная за счет уменьшения размерности, значительно лучше, чем модель, скорректированная непосредственно из источника. При том же размере эффект явно лучше, а стоимость при том же эффекте явно ниже. Раньше люди использовали открытый исходный код и думали, что это дешево. На самом деле в сценариях с большими моделями открытый исходный код является самым дорогим. Таким образом, модель с открытым исходным кодом будет отставать все дальше и дальше.
Чтобы каждому было легче быстро приступить к работе, в ModelBuilder заданы наиболее полные и богатые большие модели. В него входят ERNIE3.5 и ERNIE4.0, которые являются флагманскими большими моделями, подходящими для общих сложных сцен и обладающими мощными возможностями. Также есть три легкие большие модели: ERNIE Speed, Lite и Tiny, и еще две; В качестве модели для вертикальных сцен ERNIE Feature подходит для ролевых игр; ERNIE Functions подходит для использования внешних инструментов и вызовов бизнес-функций в диалогах или сценариях вопросов и ответов. Конечно, ModelBuilder также поддерживает основные модели отечественных и зарубежных сторонних производителей, общее количество которых составляет 77, что делает его платформой разработки с наибольшим количеством крупных моделей в Китае.
Официально объявлен второй конкурс предпринимателей «Кубок Вэньсиня»: определен специальный главный приз в размере 50 миллионов тайваньских долларов.
Для разработчиков, помимо предоставления этих инструментов разработки, мы также предоставляем финансовую и ресурсную поддержку.
В мае прошлого года Baidu запустила конкурс предпринимателей «Кубок Вэньсиня», надеясь способствовать процветанию экосистемы крупных моделей, создать более динамичную экосистему и помочь предпринимателям и разработчикам разрабатывать различные собственные приложения искусственного интеллекта. На первый конкурс предпринимателей «Кубок Вэньсинь» мы получили около 1000 заявок от предпринимательских команд. Baidu предоставила почти 100 миллионов юаней инвестиционной поддержки 15 командам-победителям и продолжила предоставлять комплексную технологическую, командную и ориентационную поддержку.
Сегодня я объявляю, что второй конкурс предпринимателей «Кубок Вэньсинь» официально стартовал. На этот раз мы расширим сферу проверки проектов, создадим подобласти, ориентируемся на глобальный рынок и студентов колледжей, а также наймем команды предпринимательских инноваций. Если вашим предпринимательским направлением являются собственные приложения для искусственного интеллекта, вы можете зарегистрироваться на официальном сайте. конкурс. В то же время мы также увеличили нашу поддержку предпринимателей, предоставляя более достаточные инвестиционные фонды и более богатые бизнес-ресурсы. Мы также впервые учредили «Специальную награду». Особо выдающиеся проекты будут иметь возможность получить до 50. миллионов юаней наличными и ресурсной поддержкой.
Китайские предприниматели и разработчики очень хорошо умеют использовать новые технологии для разработки приложений. Я считаю, что Большая модель Вэньсинь станет первым выбором для китайских предпринимателей и разработчиков искусственного интеллекта, и на основе Большой модели Вэньсинь будет создаваться все больше и больше приложений. Я также надеюсь, что к нам присоединится больше предпринимателей и разработчиков, чтобы создать процветающую экосистему искусственного интеллекта.
Самый крупный сценарий применения больших визуальных моделей — автономное вождение.
Большинство инструментов и случаев, о которых мы говорили ранее, основаны на больших языковых моделях. Глядя в будущее, я считаю, что мультимодальные большие модели или сочетание текста, изображений, голоса, видео и других мультимодальных режимов являются очень важным долгосрочным направлением развития базовых моделей и единственным путем к AGI. Baidu имеет долгосрочные инвестиции в эти области и будет своевременно информировать о технологическом прогрессе.
У меня совсем другое мнение: самый большой сценарий применения больших визуальных моделей — это автономное вождение. Baidu является лучшим в этом направлении и является мировым лидером в области автономного вождения. Мы не только обучаем ИИ создавать видео, но и обучаем ИИ понимать, что происходит в реальном мире, и предсказывать будущее.
Основываясь на данных о пробеге более 100 миллионов километров дорожных испытаний в сложных городах Китая, Baidu обучила большую модель визуального восприятия Apollo. Он имеет четыре основные возможности: обнаружение, отслеживание, понимание и картографирование. Это дает Baidu более умное, более адаптируемое и безопасное решение для автономного вождения.
Baidu Maps также стала лидером в применении крупномасштабных моделей визуального восприятия в области картографии. Теперь крупнейшие в мире картографические данные на уровне полос движения были запущены в 360 городах по всей стране. Пока существует навигация по картам Baidu, умное вождение может управлять автомобилем.
После Весеннего фестиваля в этом году компания Baidu Carrot Run завершила «первый участок» реки Янцзы. Мы расширили наши услуги с северного берега до южного берега реки Янцзы. В некоторых районах Ухани мы достигли круглосуточной работы. -погодная операция, и мы планируем сделать это в течение года. Ухань развернет 1000 беспилотных автомобилей.
Это знаковое событие для того, чтобы автономное вождение стало по-настоящему коммерциализированным. Это уже не просто региональная демонстрация, а вступило в новый этап демонстрации приложений на уровне города. Луобо Куайпао занимает площадь более 3000 квадратных километров и имеет население в 7,7 миллиона человек в Ухане, что делает его крупнейшей территорией автономного вождения в мире.
«Собери и забери, используй, когда захочешь».
Только что я показал вам большую серию моделей Baidu Wenxin и три инструмента разработки — AgentBuilder, AppBuilder и ModelBuilder. Они образуют набор инструментов, который вы можете сразу же забрать и использовать в любое время.
В данный момент я стою здесь, я на самом деле разработчик и предприниматель, и я так же взволнован, как и все остальные. Сегодня в Китае 1 миллиард пользователей Интернета, сильная базовая крупномасштабная модель, достаточное количество сценариев применения искусственного интеллекта и самая полная промышленная система в мире. Страна также активно поощряет и поддерживает действие «искусственный интеллект +». Каждому предприятию достаточно только в полной мере использовать эти инструменты, чтобы раскрыть безграничный творческий потенциал и продуктивность.
Сегодня каждый может стать разработчиком. И будущее определенно будет будущим, созданным разработчиками вместе.