Поки ви можете говорити, ви можете стати розробником.
Автор: Ліан Ран
Редактор: Чжен Сюань
Джерело: Geek Park
«Натуральна мова стане наступним поколінням мови програмування, і кожен може стати розробником».
16 квітня в Шеньчжені відбулася конференція розробників Baidu AI. Засновник, голова правління та генеральний директор Baidu Робін Лі виступив з основною промовою на тему «Кожен є розробником», описуючи світ, який більше не обмежується світом програмування. але ера, коли природна мова використовується як засіб і кожен може брати участь у створенні.
Випуск версії інструменту Wenxin Large Model 4.0 від Baidu значно наблизив бачення, описане Робін Лі, до реальності. Цей інструмент не тільки дозволяє розробникам обробляти складні дані та файли за допомогою взаємодії природної мови, але також може створювати діаграми або файли, щоб швидко отримати уявлення про характеристики даних, проаналізувати мінливі тенденції та забезпечити ефективну та точну підтримку для подальшого прийняття рішень. .
У той же час Робін Лі випустив три основні інструменти розробки під час основної промови, включаючи інструмент розробки агентів AgentBuilder, власний інструмент розробки додатків AI AppBuilder і інструмент налаштування моделі ModelBuilder. Ці інструменти значно знизили поріг розробки, дозволяючи розробникам створювати потужні, прості у використанні та зручні програми штучного інтелекту лише за кілька простих кроків.
Джерело зображення: Baidu
Робін Лі зазначив: «Інтелектуальні агенти можуть бути найближчим і найпоширенішим способом використання великих моделей для всіх у майбутньому. Базуючись на потужних базових моделях, інтелектуальні агенти можна генерувати партіями та застосовувати в різних сценаріях. Baidu щойно оновив Wenxin Розвідка На даний момент створено більше 30 000 агентів, більше 50 000 розробників і десятки тисяч компаній зупинилися на ньому».
На думку Робіна Лі, розробка додатків у майбутньому буде такою ж простою, як зйомка короткого відео. Кожен має можливість стати розробником і кожен є творцем. «Сьогодні ви можете створити програму, не знаючи, як писати код; ви можете створити інтелектуального агента, не програмуючи. ШІ розпочинає революцію у творчості. У майбутньому розробка програм буде такою ж простою, як створення короткого відео та кожен може Ми всі розробники, кожен творець».
У своїй промові Робін Лі поділився конкретними ідеями та інструментами, які Baidu реалізувала минулого року для розробки власних програм ШІ. Він підкреслив: «Великі мовні моделі самі по собі безпосередньо не створюють цінності. Лише програми ШІ, розроблені на основі великих моделей, можуть задовольнити реальні потреби ринку. Сьогодні я хочу поділитися з вами деякими конкретними ідеями та інструментами для розробки власних програм ШІ на основі великих Ми в Baidu отримали незліченну кількість підводних каменів і платили за навчання протягом минулого року».
Нижче наведено стенограму основної промови Робіна Лі на тему «Кожен є розробником», складену Geek Park.
Привіт усім! Ласкаво просимо на конференцію розробників Baidu AI 2024. Це перша конференція Create у районі Великої затоки Гуандун-Гонконг-Макао. Сьогодні на захід прийшло понад 5000 розробників і ентузіастів технологій.
Минулого року я спілкувався з багатьма підприємцями та розробниками, і я відчуваю, що всі перебувають у стані «FOMO», який є страхом втратити. Вони водночас схвильовані та бояться втратити. Дійсно, великі моделі та генеративний ШІ повністю змінять спільноту розробників.
У минулому розробники використовували код, щоб змінити світ; у майбутньому природна мова стане новою універсальною мовою програмування.
Цей день не за горами. Ми побачили, що завдяки потужній базовій великій моделі та багатьом інструментам розробки з низьким або навіть нульовим порогом продуктивність розробників значно підвищилася.
Наприклад, Comate, інтелектуальний кодовий помічник на основі великої моделі Wenxin, не тільки підтримує понад 100 мов і всі основні платформи IDE, але може рекомендувати коди, генерувати коментарі до коду, знаходити дефекти коду та надавати рішення для оптимізації. Він також може глибоко інтерпретувати бібліотеку коду та співвідносити знання приватної області з генерацією нового коду. Після більш ніж року роботи Comate використовувався десятками тисяч компаній, таких як Himalaya, Mitsubishi Elevator, iSoftStone тощо, і рівень впровадження згенерованого коду досяг 46% кожного коду, доданого Baidu день, 27% було створено Comate of.
Сьогодні ви можете створити програму ШІ без написання коду, ви можете створити інтелектуального агента без програмування. Штучний інтелект починає революцію в творчості. У майбутньому розробка програм буде такою ж простою, як створення короткого відео.
Як технологічна компанія, роль Baidu полягає в тому, щоб надати кожному необхідні інструменти розробки, наскільки це можливо, щоб постійно розвивати креативність усього суспільства. Зокрема, ми пропонуємо потужну базову модельну серію, яка є великою серією моделей Wenxin, включаючи флагманські версії ERNIE3.5, ERNIE4.0 і полегшені версії ERNIE Speed, Lite, Tiny тощо.
Ми також надаємо інструменти для розробки різноманітних додатків на основі великих моделей, зокрема інструмент розробки агентів AgentBuilder, власний інструмент розробки додатків штучного інтелекту AppBuilder та інструмент налаштування моделі ModelBuilder різних розмірів. Усі ці три інструменти представляють підвищену продуктивність. Нижче я покажу вам один за іншим.
По-перше, давайте поговоримо про останні досягнення Wen Xin Yi Yan і Wen Xin Big Model:
16 березня минулого року минуло рік і місяць з моменту звільнення Вень Сінь Іяня. Кількість наших користувачів перевищила 200 мільйонів, середня щоденна кількість викликів API також перевищила 200 мільйонів, кількість клієнтів, яких ми обслуговуємо, досягла 85 000, а кількість власних додатків ШІ, розроблених на платформі Qianfan, перевищила 190 000.
Давайте подивимося, що всі роблять із Вень Сіньянь?
Реальні люди на відео – лише верхівка айсберга. Ми бачимо, що Вень Сіньянь змінює роботу та життя багатьох людей.
Базовою моделлю, яка підтверджує слова Вень Сінь, є велика модель Вень Сінь. Минулого року він розвинувся з версії 3.0 до 3.5, а потім до версії 4.0. Wenxin 4.0 досягла провідного рівня в галузі з точки зору чотирьох основних можливостей: розуміння, генерування, логіка та пам’ять.
За останні місяці Wenxin Big Model досягла подальших значних покращень у загальних можливостях, таких як генерація коду, інтерпретація коду та оптимізація коду, досягнувши провідних міжнародних рівнів.
Сьогодні ми офіційно випустили інструментальну версію Wenxin Big Model 4.0. Тепер ви можете випробувати функцію інтерпретатора коду у версії інструменту, ви можете обробляти та аналізувати складні дані та файли, а також генерувати діаграми або Файли можуть швидко отримати уявлення про характеристики даних, проаналізувати мінливі тенденції та забезпечити ефективну та точну підтримку для подальшого прийняття рішень.
Велика модель Wenxin стала найпровіднішою та найпоширенішою базовою моделлю ШІ в Китаї.
Мало того, що порівняно з роком тому ефективність навчання алгоритму великої моделі Wenxin зросла в 5,1 рази, середня тижнева ефективність навчання досягла 98,8%, продуктивність логічного висновку зросла в 105 разів, а вартість висновку зросла знизився до 1% від початкового.
Іншими словами, клієнт спочатку телефонував 10 000 разів на день, але тепер може дзвонити 1 мільйон разів за ту саму вартість. ЗМІ, ймовірно, не будуть в захваті від зниження витрат на 99%. Але будь то підприємство чи розробник, після його використання головне – ефект і вартість.
Ми можемо покращити продуктивність, одночасно зменшивши витрати на висновки до 1% саме тому, що Baidu має повний стек у чотирирівневій архітектурі чіпів, фреймворків, моделей і додатків, завдяки наскрізній оптимізації, ми продовжуємо знижувати витрати. Це дозволить більшій кількості людей використовувати великі моделі, щоб створювати додатки ШІ ефективно та з низькою ціною.
Безсумнівно, теми, пов’язані з великими моделями, залишаться актуальними і в 2024 році, а різноманітні технологічні прориви продовжуватимуть з’являтися. Засоби масової інформації продовжуватимуть використовувати такі назви, як «шоковий випуск» і «епічне оновлення», щоб відтворити це. Але я хочу підкреслити, що самі великі моделі безпосередньо не створюють цінності. Лише програми ШІ, розроблені на основі великих моделей, можуть задовольнити реальні потреби ринку.
Сьогодні я хочу поділитися з вами деякими конкретними ідеями та інструментами для розробки власних додатків ШІ на основі великих моделей. Це те, що ми в Baidu отримали на основі нашої практики за останній рік, наступаючи на незліченні підводні камені та сплачуючи високу плату за навчання.
Перший – Міністерство освіти. У майбутньому великомасштабні нативні додатки штучного інтелекту в основному використовуватимуть архітектуру MoE. Згадана тут MoE не є загальною академічною концепцією, а сумішшю великих і малих моделей, не покладаючись на одну модель для вирішення всіх проблем. Але коли викликати маленьку модель, коли викликати велику модель, а коли не викликати модель, усе це має технічний зміст і потребує узгодження відповідно до різних сценаріїв застосування.
Друга - маленька модель. Малі моделі мають низьку вартість висновків і швидкий час відгуку. У деяких конкретних сценаріях продуктивність маленької моделі, налаштованої за допомогою SFT, може бути порівнянна з продуктивністю великої моделі. Ось чому ми випустили три полегшені моделі: Speed, Lite і Tiny. Ми стискаємо та дистилюємо велику модель для створення базової моделі, а потім використовуємо дані для навчання. Це набагато краще, ніж навчання маленької моделі з нуля. Це краще, швидше та дешевше, ніж модель, навчена на основі відкритого коду модель.
Третій — розумний агент. Інтелектуальні агенти зараз є актуальною темою. Оскільки можливості інтелектуальних агентів удосконалюються, з’являтиметься велика кількість нових програм. Механізм інтелектуального агента включає розуміння, планування, рефлексію та еволюцію. Він дозволяє машинам мислити та діяти як люди. Вони можуть самостійно виконувати складні завдання, продовжувати навчатися в середовищі та здійснювати самоітерацію та еволюцію. У деяких складних системах ми також можемо дозволити різним агентам взаємодіяти та співпрацювати один з одним, щоб виконувати завдання з вищою якістю. Ми розробили ці агентські можливості та повністю відкриті для розробників.
У трьох напрямках: Міністерство економіки, малі моделі та агенти, Baidu надав готові інструменти для всіх. Далі я познайомлю вас із трьома різними інструментами, а саме: інструментом розробки агентів AgentBuilder, власним інструментом розробки додатків AI AppBuilder та інструментом налаштування моделі різних розмірів ModelBuilder.
Перший — це засіб розробки агентів AgentBuilder. Агенти можуть бути найближчим і найпоширенішим способом використання великих моделей для всіх у майбутньому. Базуючись на потужних базових моделях, агенти можна генерувати пакетами та застосовувати в різних сценаріях.
Baidu щойно оновив свою платформу інтелектуального агента Wenxin. На даний момент створено понад 30 000 агентів, влаштувалися понад 50 000 розробників і десятки тисяч компаній. Наша мета — дати можливість усім і кожній організації стати розробником інтелектуальних агентів і створити найповнішу екосистему інтелектуальних агентів у Китаї.
Тож як досягти цієї мети? Він полягає в тому, щоб надати кожному інструмент розробки агента з нульовим порогом AgentBuilder.
Давайте спочатку візьмемо «Раду з туризму Сінгапуру» як приклад, щоб побачити, як створюється розумний агент.
По-перше, ми відкриваємо платформу Wenxin, яка має два режими: новачки можуть безпосередньо вибрати «режим нульового коду» і створити агента кількома реченнями.
Спочатку ми назвали агента «Сінгапурська рада з туризму», а потім указали, що нам потрібно створити плани подорожей, відповісти на запитання та надати послуги бронювання квитків у готелі. Ви можете вказати, що робити .
Якщо потрібні лише базові агенти, платформа автоматично завершить заповнення. Але ми сподіваємося, що «Сінгапурська рада з туризму» є професійним інтелектуальним агентом, тому потрібна розширена конфігурація. Я можу додавати записи Сінгапурської енциклопедії та посилання на офіційні веб-сайти до бази знань і оновлювати її щодня. Потім додайте деякі інструменти, такі як запити в готелі, купівля квитків на визначні пам’ятки тощо, щоб покращити його сервісні можливості. Наразі ми співпрацюємо з Ctrip, щоб надати такі інструменти туристичних послуг, як готелі, пам’ятки та продаж квитків. Таким чином, інтелектуальний агент Сінгапурської ради з туризму готовий, який можна додатково переглянути та налаштувати.
Тепер відкрийте програму Baidu і знайдіть «Коли буде найменша кількість людей, які відвідають Сінгапур?», оскільки кожен хоче уникнути натовпу під час подорожей. Агент об’єднає інформацію з кількох джерел, щоб згенерувати відповідь «Найменше людей у січні-березні». Ми також можемо натиснути на агента, щоб далі взаємодіяти з ним, наприклад поради щодо подорожі до Сінгапуру, рекомендації щодо трьох найкращих готелів у Сінгапурі, а також його можна використовувати для прямого бронювання квитків до Universal Studios Singapore, універсального рішення для наших потреб, що економить багато часу користувача.
На додаток до Сінгапуру, на платформі інтелектуальних агентів Wenxin також є інтелектуальні агенти в галузі культури та туризму. Усі вони використовуються від AgentBuilder .
Коли минулого року Вень Сіньян вперше був звільнений, я сказав, що Вень Сіньян вплине на кожну компанію. Завдяки своїм потужним можливостям розуміння природної мови, вираження та аргументації він може наблизити будь-яку компанію до її клієнтів.
Сьогодні кожен продавець і кожен клієнт може мати ексклюзивного інтелектуального агента на Baidu. Весь процес взагалі не потребує програмування. Вводячи інформацію, схожу на слова підказки, і регулюйте кілька простих кроків, інтелектуальний агент може бути швидко створений і стати продавцем із золотою медаллю в режимі 24/7.
Давайте подивимося, як створюється агент бізнес-розвідки.
Kai Tak Education – це відома освітня компанія, яка має понад 60 відділень по всій країні та багато закордонних відділень. Вона охоплює широкий спектр країн і має високі вимоги до навичок прийому. Як ми можемо відповідати на запити клієнтів 24 години на добу, покращити рівень прийому та зменшити операційні витрати?
Kai Tak Education використовує AgentBuilder від Baidu для створення власного інтелектуального агента.
Давайте розглянемо, як створити інтелектуального агента з базовими можливостями. Це дуже просто, введіть аватар, ім’я, сферу діяльності та вітальне повідомлення агента на платформі, а потім встановіть певну інформацію, яку має надати користувач, наприклад вік та освіту. Через 5 хвилин і з нульовим порогом інтелектуальний агент готовий.
Kai Tak Education також сподівається, що цей агент буде консультантом з навчання за кордоном, який розуміє бізнес і студентів. Він може проводити професійний аналіз і давати точні відповіді на основі різних ситуацій студентів, наприклад, чи хочуть вони поїхати до Сполучених Штатів чи Австралії, чи хочуть вони отримати ступінь магістра чи бакалавра, які бали вони набрали в IELTS і TOEFL, тощо Ми можемо створити більш просунутий інтелектуальний агент, додавши кілька модулів, таких як знання, ролі та інструменти.
У модулі знань завантажте знання приватної області та дозвольте платформі аналізувати їх у режимі реального часу та автоматично генерувати матеріали для діалогу в рольовому модулі, додайте деякі країни навчання за кордоном, які не входять до сфери діяльності, до схеми фільтрації, що може покращити; ефективність підказок користувача в модулі інструментів, додавання таких послуг, як бронювання в магазині; За допомогою цих кількох простих операцій інтелектуальний освітній агент Qi Tak із професійними можливостями готовий.
Тепер давайте пошукаємо «Вимоги до подання заявки на навчання в Австралії». Ми можемо побачити, що агент швидко надає сім необхідних умов, таких як необхідні знання мови та основний вибір, а також може надати відповідні плани навчання за кордоном для вирішення різних проблем буде надано відповідь і на всі запити буде надано відповідь.
Kai Tak Educational Intelligence дуже популярний. За перший тиждень його запуску було успішно розповсюджено 1,55 мільйона разів і 58 000 разів взаємодіяли з користувачами ефективність роботи була значно покращена.
Далі я познайомлю вас з інтелектуальним агентом у домашньому господарстві.
Sophia – це бренд меблів для дому, який зосереджується на персоналізації всього будинку. Як щойно було показано, він також може створити базову бізнес-аналітику, заповнивши надзвичайно просту інформацію. Але для індустрії меблів для дому досвід споживачів офлайн є важливішим, тому Софія сподівається створити золоту медаль продажів онлайн і відновити офлайн-споживання.
Тому в подальших налаштуваннях він вибрав цифрових людей як метод відображення в рольовому модулі, потім вибрав відповідний фон і голоси для цифрових людей і в поєднанні з можливостями інтелектуального аналізу платформи автоматично узагальнив набір технік продажу. Зрештою, ми створили продавця із золотою медаллю, який є м’яким, добрим і професійним у спілкуванні. Вона може задовольнити різноманітні потреби користувачів 24 години на добу та надати послуги високого рівня.
Коли користувач пошуку Baidu має запит на оформлення, агент Sophia використовуватиме можливість великої моделі Wenxin, щоб першим дати відповідь на запитання. Крім того, вона також заздалегідь підтверджуватиме конкретні потреби клієнтів, як-от тип декору, бюджет тощо, і рекомендуватиме найближчі офлайн-магазини.
З моменту запуску Sophia Merchant Intelligence ефективні витрати на потенційних клієнтів знизилися на 30%. Іншими словами, щоб залучити ефективного клієнта, якщо вартість була 100 юанів у минулому, зараз це коштує лише 70 юанів.
Наразі понад 10 000 клієнтів Baidu мають торгові дані, що охоплюють понад 30 галузей, таких як освіта та навчання, нерухомість і меблі, машини та обладнання та бізнес-послуги.
Вище, за допомогою трьох демонстрацій, я показав, як розробники та торговці можуть використовувати AgentBuilder для створення інтелектуальних агентів для різних галузей.
Тепер створення інтелектуального агента займає лише лічені хвилини. Але тут виникає проблема! Якщо немає трафіку, немає розповсюдження, немає і ніхто не користується цим, то розробники та торговці не матимуть доходу, не буде мотивації. Як вирішити цю больову точку?
Наша агентська платформа Wenxin надає розробникам можливість монетизувати трафік. На додаток до Baidu Search, інші продукти в екосистемі Baidu, такі як Xiaodu, Maps, Tieba, Cheji тощо, можуть бути підключені до відповідних можливостей інтелектуального агента, вирішуючи турботи про розподіл трафіку для розробників і отримуючи реальні переваги.
Якщо є розподіл, буде зворотний зв’язок з даними, маховик буде обертатися, і розумний агент зможе виконувати ітерації незалежно, і чим більше він використовується, тим розумнішим він стане. Агентська платформа Wenxin також запустила модулі аналізу даних агента та налаштування запитань і відповідей, і незабаром буде запущено більше нових можливостей. Платформа інтелектуальних агентів Wenxin спонукатиме інтелектуальних агентів формувати позитивний цикл кращої якості, кращого трафіку та більшого доходу через маховик даних розподіл-діагностика-дохід.
Далі я познайомлю вас з другим інструментом розробки, AppBuilder. Наразі це найкращий власний інструмент розробки додатків зі штучним інтелектом. У AppBuilder ми заздалегідь інкапсулювали та попередньо встановили різні компоненти та фреймворки, необхідні для розробки власних програм штучного інтелекту, значно зменшивши поріг розробки.
Лише за три найшвидші кроки розробники можуть розробити рідну програму штучного інтелекту за допомогою природної мови, яку можна легко випустити та інтегрувати в різні бізнес-середовища. Давайте розглянемо кілька випадків:
На початку цього року ми провели конкурс нативної розробки додатків, щоб створити «помічника з планування черги на ігровому майданчику», щоб допомогти туристам краще зрозуміти ситуацію в черзі на ігровому майданчику та розробити персоналізовані ігрові маршрути найкращий ігровий досвід за обмежений час.
Чемпіон цього конкурсу розробив програму, не написавши жодного рядка коду, і виграв головний приз у 100 000 юанів, наданий Baidu. Якщо ви можете написати код для цієї теми, вам не складно його написати, але якщо ви все ще можете це зробити, не написавши жодного рядка коду, це все ще значною мірою покладається на базову модель і можливості інструменту AppBuilder.
Давайте розглянемо, як використовувати AppBuilder для створення цієї програми ШІ.
Давайте спочатку розглянемо конкурсні питання. Він передбачає час черги та індекс стимуляції кожного проекту в «Universal Studios», тому отримання досвіду з найвищим індексом стимуляції за обмежений час є проблемою, яку потрібно вирішити в цьому випуску.
По-перше, відкрийте інтерфейс розробки AppBuilder і назвіть програму «Playground Queuing Assistant», по-друге, ми опишемо конкретні вимоги в інструкціях щодо ролі, включаючи виклик інтерпретатора коду, обчислення найкращої комбінації протягом фіксованого часу, виведення результатів тощо. ; третій крок - перейти до компонента інструменту та додати інтерпретатор коду, щоб допомогти з обчисленням.
Тепер давайте перевіримо ефект. Введіть питання «У мене є 3 з половиною години, який спосіб грати найцікавіше?» Ви бачите, що інтерпретатор коду переводить це питання в код, а потім викликає інструмент розуміння даних Аналізуйте відомі умови. Після низки розрахунків було зроблено висновок, що найкращих результатів можна досягти, об’єднавши ці чотири проекти: «Гаррі Поттер і заборонена подорож», «Пригоди Юрського періоду», «Американські гірки десептиконов» і «Бамблбі Спінер». Якщо з тестом немає проблем, натисніть «Опублікувати», і програма буде згенерована з нульовим кодом.
Тепер AppBuilder було додатково оновлено. У процесі створення всі можуть використовувати функцію «оптимізована конфігурація штучного інтелекту», щоб автоматично допомагати розробникам оптимізувати рольові інструкції, конфігурацію компонентів та інші аспекти, що ще більше підвищує ефективність розробки.
Давайте розглянемо інший приклад.
На початку цього року Північнокитайський електроенергетичний університет запропонував надавати інтелектуальні та ексклюзивні послуги вчителям і студентам у всій школі. На основі AppBuilder від Baidu ми спільно створили Huadian AI Assistant. Тепер дозвольте мені показати вам, як створюється Huadian AI Assistant.
Крок 1: відкрийте AppBuilder, увійдіть на сторінку створення та натисніть AI, щоб автоматично створити конфігурацію. Спочатку встановіть основну інформацію, таку як ім’я, вступ, аватар тощо для програми.
Крок 2. Використовуйте природну мову, щоб описати конкретні вимоги в інструкціях щодо ролі, включаючи завдання, можливості компонентів, вимоги та обмеження.
Крок 3. Вставте налаштовані компоненти, такі як запит про запозичення книг, запит про розклад занять, запит про успішність студентів тощо, щоб асистент кампусу міг мати інтелектуальні можливості обслуговування. Потім додайте початкову заяву для Campus Assistant, і програму буде налаштовано.
Далі ми налагоджуємо помічника в інтерфейсі попереднього перегляду на основі запитань користувача. Наприклад, запитайте про час реєстрації на іспити CET-4 і CET-6 і перевірте ефект автоматичного виклику кожного компонента.
Як бачите, за допомогою цих простих операцій додаток завершено. Наразі він був запущений у невеликому тестуванні та був пов’язаний з високочастотними сценаріями, такими як перевірка системи, перевірка курсів, поповнення карток харчування, позичання книг тощо, і служив більшості викладачів і студентів в школі. У майбутньому ми працюватимемо з Північно-Китайським університетом електроенергетики для подальшого поглиблення співпраці в області застосування та надання більш різноманітних і зручних послуг.
Baidu також багато років накопичує технології в крос-модальності. У AppBuilder ми також надаємо певні крос-модальні можливості. Вам потрібно лише надати абзац тексту або кілька речень, щоб швидко створювати додатки для малювання, наприклад комікси, дитячі книжки з картинками тощо.
Процес також дуже простий: відкрийте AppBuilder, натисніть, щоб увійти в «Application Creation», введіть інструкції щодо ролі, виберіть компонент «Add Vincent Picture», введіть три рекомендовані запитання та натисніть, щоб опублікувати. Після завершення програми нам потрібно лише ввести приблизний персонаж або сюжет, і AppBuilder зможе автоматично створити історію та вивести зображення.
Остання розумна функція генерації коміксів і книжок із малюнками від Baidu Wenku використовує такі компоненти, надані в AppBuilder. Давайте подивимося, як функція генерації коміксів Baidu Wenku дозволяє кожному з творчими ідеями створювати хороші роботи.
Візьмемо, наприклад, класичну «Чжоу Чу усуває три зла».
Відкрийте бібліотеку Baidu і введіть тему «Чжоу Чу усуває три зла». Це написано в «Книзі Цзінь» і «Шишуосінью». Після пошуку в бібліотеці історія буде створена на основі оригінального тексту Внесіть зміни в історію, а потім клацніть на панелі інструментів ШІ праворуч, щоб почати створення коміксу.
Увійдіть в інтерфейс створення коміксів, і Венку автоматично створить для нас розкадровки на основі сюжетної лінії; потім виберіть стиль коміксів, який найкраще підходить до історії, наприклад світло і тінь, реалізм, мультфільм тощо; персонажі відповідно до персонажів, тому генерація коміксу завершена.
Після створення коміксу ми можемо переглядати повний комікс у розумному редакторі коміксів Baidu Wenku. У той же час бібліотека підтримує редагування, модифікацію та тонку настройку кожного малюнка. Наприклад, виберіть зображення «Чжоу Чу і білолобий тигр» зліва, натисніть «Редагувати», додайте опис зображення «Обличчя персонажа. чітке, зображення яскраве", і ви можете його точно налаштувати. Викличте комікси, які більше відповідають вашим потребам. Як бачите, функція коміксів Baidu Wenku відмінно справляється з поглядом стилістичної узгодженості персонажів і сцен.
Інтелектуальні коміксові можливості Baidu Wenku значно підвищили ефективність створення коміксів, знизили вартість і поріг створення коміксів і дозволили більш вдумливим і творчим людям реалізувати свої мрії щодо створення коміксів.
Окрім створення коміксів, Baidu Wenku тепер може допомагати користувачам створювати книжки з картинками з нульовим порогом. Можливо, ви не знаєте, що китайські діти читають лише 10 книжок з картинками на рік на душу населення, тоді як у країнах Європи та Америки – близько 50. Тепер ШІ може дозволити батькам, які не мають здібностей до малювання, створити ексклюзивну дитячу книжку з малюнками для своїх дітей. Давайте подивимося на цю ілюстровану аудіокнигу!
З минулого року ми використовуємо штучний інтелект для реконструкції Baidu Wenku, роблячи його «відправною точкою для створення контенту» для користувачів. Тепер, завдяки підтримці AppBuilder, нещодавно запущені функції розумних коміксів і розумної книжки з малюнками Baidu Wenku розширили сцену до більш цікавих крос-модальних полів створення.
Я щойно використав три випадки, щоб показати, як використовувати Baidu AppBuilder для створення власних програм ШІ. Кожен повинен відчути дві очевидні переваги AppBuilder:
По-перше, він потужний. Покладаючись на здатність Wenxin 4.0 розуміти і виконувати інструкції, наш AppBuilder може гарантувати, що холодний запуск може досягти хорошого рівня. Налаштування не займе багато часу через низьку продуктивність, що значно знижує поріг розробки. Покладаючись на технологію вдосконалення пошуку RAG, у типових сценаріях, таких як знання та відповіді, наш рівень точності запитань і відповідей і рівень дружніх відповідей досяг понад 95%, що значно перевершує інші подібні продукти. AppBuilder також надає багатий і повний набір компонентних інструментів, включаючи 55 компонентів, таких як пошук Baidu та інші компоненти можливостей AI, засновані на багаторічному накопиченні технологій Baidu, компоненти можливостей великих моделей і ексклюзивні відкриті бізнес-компоненти Baidu. А також сторонні API для деяких основних сценаріїв, таких як запит на політ, паперовий запит тощо. Ми також щойно підтримали користувальницькі компоненти, тому клієнти можуть напряму підключати будь-які власні власні інструменти та дані. Ці багатофункціональні компоненти спільно підтримують ефективну розробку власних програм ШІ.
По-друге, він простий і зручний у використанні. Використовуючи AppBuilder, ви можете швидко створювати програми за три кроки та поширювати їх одним клацанням миші. Ми також підтримуємо SDK з відкритим вихідним кодом для полегшення вторинної розробки.
Далі я розповім про інструмент, який більше підходить для професійних розробників, це ModelBuilder. Він може налаштовувати моделі будь-якого розміру відповідно до потреб розробників і додатково налаштовувати SFT на основі поділених сценаріїв, щоб отримати кращі результати. досягнутий ефект. Для розробників одна річ, яка дуже важлива для ефективного використання великих моделей, — це оволодіти методом тонкого налаштування моделі.
Розглянемо як приклад сценарій виправлення есе в галузі освіти. Оскільки корекція композиції має чіткі стандарти оцінки, а різні оцінки мають різні вимоги до композиції та стандарти оцінки. Це потребує тонкого налаштування моделі, щоб зробити вихідні результати великої моделі більш узгодженими з конкретними вимогами.
Давайте подивимося, як ModelBuilder реалізує точне налаштування моделі для оцінювання есе.
Крок 1: Створіть набір даних. Ефективність точного налаштування моделі значною мірою залежить від якості наших даних. У цьому випадку вихідні дані містять лише 180 елементів, а якість недостатньо висока. Нам потрібно використовувати три функції: очищення даних, анотацію даних і покращення даних. Очищення даних може швидко усунути прогалини даних, спотворені символи та інші проблеми. Що стосується анотації даних, ми додали більше параметрів до композиції, таких як глибина вмісту, техніка написання та інші оцінки. Функція розширення даних може генерувати подібні, але не повторювані дані для розширення даних. Після розширення ModelBuilder створив для нас 920 фрагментів високоякісних даних.
Другим кроком є вихід на етап тонкого налаштування моделі. По-перше, нам потрібно вибрати базову модель для тонкого налаштування. Тут ми вибираємо ERNIE Speed як базову модель. Потім ми налаштовуємо параметри відповідно до рекомендованих значень платформи. Цього разу дані наближаються до 1000. Згідно з рекомендованими ітераційними раундами, конфігурація становить 10 раундів, а потім модель може почати навчання.
Крок 3. Розгорніть модель на платформі, і весь процес тонкого налаштування завершено.
Давайте використаємо твір для середньої школи, щоб перевірити ефект точно налаштованої моделі. Есе має назву «З нетерпінням чекаю на дорослішання», тема необмежена, і воно має містити не менше 800 слів.
Ми вводимо вимоги студента до композиції та формату корекції у дві моделі до та після тонкого налаштування. Давайте подивимося на порівняння двох моделей і коментарі вчителя. Можна побачити, що налаштована велика модель має більш професійне мислення для коментарів викладача та кращу відповідність формату. Завдання для виправлення есе, які спочатку займали багато часу для вчителів, тепер можна швидко виконати за допомогою великих моделей за кілька секунд, що значно покращує швидкість і ефективність зворотного зв’язку зі студентами. В даний час цей тип точно налаштованої моделі використовується в багатьох провідних компаніях освітньої галузі.
Раніше я згадував, що великомасштабні власні програми штучного інтелекту, як правило, є MoE. Отже, як поєднати ці моделі, щоб отримати найкраще співвідношення ціни та якості? Далі я використаю Xiaodu, щоб показати випадок маршрутизації моделі MoE. Давайте спочатку подивимося, чи став Сяоду розумнішим завдяки благословенню великої моделі:
Робін: Сяоду Сяоду
Сяоду: Ось ти
Робін: Які сьогодні новини?
Xiaodu: Xiaodu транслює 3-5 спалахів новин за день
Робін: Сяоду Сяоду. Я чув, що останнім часом ти став більш здібним? Сяоду: Я можу не лише спілкуватися з вами, але й бути вашим помічником зі штучного інтелекту
Робін: Тоді я тебе перевірю. Будь ласка, допоможіть мені організувати мій розклад. Після сьогоднішнього заходу я пообідаю з паном Чжаном, а потім відбудеться нарада керівництва в готелі, яка, я сподіваюся, закінчиться до 10 години 'годинник. Завтра вранці я піду на ранкову пробіжку, а потім у мене ранкова зустріч о 8 ранку.
Xiaodu: Виходячи з ваших потреб, Xiaodu складе для вас оптимальний графік:
Ваша вечеря з паном Чжаном запланована на 18:00-19:30, після чого ви відвідаєте нараду керівництва о 20:00 і закінчите її близько 21:30
Будильник нагадає вам встати о 6 годині ранку і піти на ранкову пробіжку протягом 1 години, щоб ви не спізнилися на ранкову зустріч завтра о 8 годині ранку. .
Завтра вранці буде сонячно з температурою 25 градусів. Рекомендуємо виходити на вулицю з короткими рукавами та використовувати засоби захисту від сонця.
Як ти думаєш, я можу бути твоїм секретарем?
Робін: Дуже добре, чудово (великий палець Сяоду), синхронізуйте ці розклади з моїм мобільним телефоном.
Щойно я поставив Сяоду кілька запитань, починаючи від простих запитів на новини до складних потреб у плануванні. Здається, що ми спілкуємося з одним і тим же Сяоду, але насправді за ним називаються різні моделі. Коли він отримав моє запитання, він спочатку виконав роботу з «маршрутизацією моделі» на маленькій моделі ERNIE Tiny для погодної проблеми, він викликав налаштовану модель на основі ERNIE Lite на основі результатів запиту погоди, який також був; обробляється ERNIE Lite від SFT, дає пропозиції щодо складніших розкладів, Wenxin 4.0, найефективніша велика модель, використовується для розрахунку різноманітних заходів від сьогоднішнього вечора до завтрашнього ранку.
Сьогодні кожне запитання, яке ми задаємо Xiaodu, буде призначено для виконання різними моделями. Під час виклику інтерфейсу API додатка буде використовуватися модель ERNIE Functions. Під час пояснення питань дітям буде використовуватися Wenxin Big Model 3.5 або 4.0 Інтелектуальний Помічник створено з використанням моделі персонажа ERNIE, щоб покращити послідовність персонажа та стимулювати бажання користувачів спілкуватися.
За допомогою цього комбінованого методу планування великих і малих моделей Xiaodu не тільки успішно завершив «операцію заміни мозку» та встановив нову власну операційну систему AI DuerOS X, але й сформував оптимальне поєднання ефекту, швидкості та вартості в порівнянні з усіма використаннями флагманська версія Wenxin Large Model, швидкість відгуку збільшена в 2 рази, а вартість знижена на 99%. Робот-планшет Xiaodu Tiantian AI, з яким я щойно розмовляв, учора надійшов у продаж на всіх основних платформах. Зацікавлені друзі можуть негайно замовити його.
Ці приклади ModelBuilder демонструють здатність Baidu створювати моделі ефективно та за низькими цінами. Завдяки найпотужнішій базовій моделі Wenxin 4.0 ми можемо адаптувати менші моделі, які підходять для різних сценаріїв відповідно до потреб, беручи до уваги різні аспекти, такі як ефект, швидкість відповіді та вартість висновків, а також підтримуємо тонке налаштування та попереднє навчання. Таким чином, модель, вирізана за допомогою зменшення розмірності, є значно кращою, ніж модель, налаштована безпосередньо з джерела, ефект, очевидно, кращий, а вартість, очевидно, нижча. Раніше люди користувалися відкритим кодом і вважали, що це дешево. Насправді у сценаріях великих моделей відкритий код є найдорожчим. Таким чином, модель з відкритим вихідним кодом все більше відставатиме.
Щоб усім було простіше швидко розпочати роботу, ModelBuilder попередньо встановив найповніші та багаті великі моделі. Він включає в себе ERNIE3.5 і ERNIE4.0, які є флагманськими великими моделями, які підходять для загальних складних сцен і мають потужні можливості; також є три легкі великі моделі, ERNIE Speed, Lite і Tiny; Як модель для вертикальних сцен ERNIE Character підходить для рольових ігор; ERNIE Functions підходить для зовнішнього використання інструментів і викликів бізнес-функцій у сценаріях діалогу або запитань і відповідей. Звичайно, ModelBuilder також підтримує основні моделі вітчизняних і іноземних виробників із загальною кількістю 77, що робить його платформою для розробки з найбільшою кількістю великих моделей у Китаї.
Для розробників, окрім надання цих інструментів розробки, ми також надаємо фінансову та ресурсну підтримку.
У травні минулого року Baidu запустив підприємницький конкурс «Wenxin Cup», сподіваючись сприяти процвітанню екосистеми великих моделей, створити більш динамічну екосистему та допомогти підприємцям і розробникам розробляти різноманітні власні додатки ШІ. Для першого конкурсу підприємництва «Wenxin Cup» ми отримали близько 1000 реєстрацій від підприємницьких команд, надавши близько 100 мільйонів юанів інвестиційної підтримки 15 командам-переможцям, а також продовжували надавати підтримку в області технологій, команд і ресурсів.
Сьогодні я оголошую про офіційний старт другого змагання з підприємництва «Wenxin Cup». Цього разу ми розширимо сферу перевірки проектів, налаштуємо підгалузі, націлимося на світовий ринок і студентів коледжів, а також наберемо команди підприємницьких інновацій. Якщо ваш підприємницький напрямок — це рідні програми ШІ, ви можете зареєструватися на офіційному веб-сайті змагання. У той же час ми також збільшили підтримку підприємців, забезпечивши достатніми інвестиційними коштами та багатшими бізнес-ресурсами, а також вперше запровадили «Особливо видатні проекти», які матимуть можливість отримати до 50 мільйони юанів готівкою та ресурсною підтримкою.
Китайські підприємці та розробники дуже добре вміють використовувати нові технології для розробки програм. Я вірю, що велика модель Wenxin стане першим вибором для китайських підприємців і розробників штучного інтелекту, і все більше додатків буде створено на основі великої моделі Wenxin. Я також сподіваюся, що більше підприємців і розробників приєднаються до нас, щоб створити процвітаючу екосистему ШІ.
Більшість інструментів і випадків, про які ми говорили раніше, засновані на великих мовних моделях. Дивлячись у майбутнє, я вважаю, що мультимодальні великі моделі або поєднання тексту, зображень, голосу, відео та інших мультимодальних режимів є дуже важливим довгостроковим напрямком розвитку базових моделей і єдиним шляхом до AGI. Baidu має довгострокові інвестиції в ці сфери та своєчасно оновлюватиме технологічний прогрес.
Я маю зовсім інше судження: найбільшим сценарієм застосування великих візуальних моделей є автономне водіння. Baidu є найкращим у цьому напрямку та є світовим лідером у сфері автономного керування автомобілем.
Базуючись на даних про пробіг понад 100 мільйонів кілометрів у складних містах Китаю, Baidu навчив велику модель візуального сприйняття Apollo. Він має чотири основні можливості: виявлення, відстеження, розуміння та відображення. Це дає Baidu розумніше, адаптивніше та безпечніше рішення для автономного водіння.
Baidu Maps також взяла на себе лідерство у застосуванні великомасштабних моделей візуального сприйняття в області картографії. Тепер у 360 містах по всій країні запущено найбільшу у світі карту даних на рівні смуг. Поки може працювати навігація за картою Baidu, розумне водіння може керувати.
Після весняного фестивалю Baidu’s Carrot Run завершив «перший проліт» річки Янцзи. Ми розширили наші послуги з північного берега річки на південний берег Уханя -погодні роботи, і ми плануємо зробити це протягом року, коли Ухань розгорне 1000 безпілотних автомобілів.
Це знакова подія для справжнього комерціалізації автономного водіння. Це вже не просто регіональна демонстрація, а вийшла на новий етап демонстрації додатків на рівні міста. Luobo Kuaipao охоплює понад 3000 квадратних кілометрів і населення в 7,7 мільйона жителів Уханя, що робить його найбільшою територією автономного водіння в світі.
«Упакуйте і заберіть, використовуйте, коли захочете».
Щойно я показав вам велику модельну серію Baidu Wenxin і три інструменти розробки — AgentBuilder, AppBuilder і ModelBuilder. Вони утворюють набір інструментів, який ви можете негайно взяти з собою та використовувати в будь-який час.
У цей момент я стою тут, насправді, розробник і підприємець, і я схвильований, як і всі інші. Сьогодні Китай має 1 мільярд користувачів Інтернету, потужну базову масштабну модель, достатню кількість сценаріїв застосування штучного інтелекту та найповнішу промислову систему в світі. кожне підприємство має лише повністю використовувати ці інструменти, щоб розкрити необмежену творчість і продуктивність.
Сьогодні кожен може стати розробником. І майбутнє точно буде майбутнім, створеним розробниками разом.