DeepSeek 30 квітня представив метод Visual Primitives для покращення мультимодальних міркувань

Згідно з технічним звітом DeepSeek, 30 квітня компанія представила Visual Primitives — метод, який вбудовує базові візуальні елементи, зокрема точки та рамки, у ланцюги міркувань, щоб подолати проблему Reference Gap у мультимодальних задачах. Метод зменшує споживання токенів зображень завдяки стисненню KV cache.

У тестах з лічби та просторових міркувань підхід відповідає за продуктивністю GPT-5.4, Claude-Sonnet-4.6 та Gemini-3-Flash на вибраних вимірах. DeepSeek заявила, що відкриє вихідний код частин бенчмарків і наборів даних, а ваги моделей буде випущено після інтеграції.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Підтримуваний OpenAI проєкт 1X відкриває 58 000 кв. футів фабрики в Каліфорнії та планує 10 000 роботів у перший рік

Згідно з Bloomberg, 1X Technologies — стартап у сфері робототехніки, підтримуваний OpenAI, заснований у Норвегії, — відкрив виробничий об’єкт площею 58 000 квадратних футів у Гейворді (Каліфорнія), прагнучи стати лідером у масовому виробництві споживчих гуманоїдних роботів. Очікується, що на підприємстві вироблятимуть 10 000 роботів у своєму

GateNews2год тому

Білий дім готує проєкт меморандуму з політики щодо ШІ, який зобов’язує держагенції США використовувати кількох постачальників ШІ 30 квітня

За даними джерел, на які PANews посилається 30 квітня, посадовці Білого дому готують всеосяжну політику щодо штучного інтелекту у вигляді службової записки, яка доручає урядовим агенціям США впроваджувати кількох постачальників AI-послуг і уникати залежності від одного постачальника. Записка також вимагає, щоб усі компанії з AI, яких укладають

GateNews2год тому

Адміністрація кіберпростору Китаю запускає 4-місячну кампанію для стримування хаосу застосунків на базі ШІ з 30 квітня

За даними CCTV News, Адміністрація кіберпростору Китаю 30 квітня запустила загальнонаціональну чотиримісячну кампанію для врегулювання хаосу в застосуванні ШІ. Ініціатива, розгорнута у дві фази, націлена на проблеми, зокрема відсутність реєстрацій моделей, недостатні можливості безпеки та перевірок на платформах,

GateNews3год тому

Forefront Tech завершує $100M зведення цін IPO, лістинг на Nasdaq за кодом FTHAU

За даними ChainCatcher, спеціальна інвестиційна компанія з викупом Forefront Tech завершила розміщення IPO на суму 100 мільйонів доларів 30 квітня та буде торгуватися на Nasdaq під тикером FTHAU. Компанія планує використати виручені кошти для пошуку можливостей злиттів і поглинань у блокчейні, фінтеху, штучному

GateNews4год тому

Код Anthropic Claude завищив оплату користувачу на $200,98 через помилку в білінгу; спочатку відмовили у поверненні коштів, перш ніж повністю компенсувати збитки

За моніторингом від Beating, помилка в білінгу в сервісі Anthropic Claude Code спричинила тому, що Max 20x підписника було переплачено $200,98 додаткових комісій за використання, хоча він використав лише 13% свого щомісячного ліміту. Помилка виникла, коли в історії комітів git-репозиторію користувача містився верхній регістр

GateNews4год тому

NVIDIA випустила ваги флагманської моделі Cosmos-Reason2-32B і розширила контекстне вікно до 256K токенів

За даними Beating, NVIDIA випустила ваги для Cosmos-Reason2-32B — флагманської версії її фізичного AI-міркувального vision-language-моделю (VLM), створеної для того, щоб роботи та системи автономного керування могли розуміти просторові, часові й фізичні принципи. Модель із 32 мільярдами параметрів,

GateNews5год тому
Прокоментувати
0/400
Немає коментарів