DeepSeek знижує ціни на V4-Pro на 75% і скорочує витрати на кеш API до однієї десятої

Повідомлення Gate News, 27 квітня — DeepSeek оголосила знижку 75% на свою нову модель V4-Pro для розробників і знизила ціни на кеш вхідних даних у всій лінійці API до однієї десятої від попередніх рівнів.

Модель V4, випущена 25 квітня у версіях Pro і Flash, була оптимізована під процесори Ascend від Huawei. DeepSeek заявила, що V4-Pro перевершує інші моделі з відкритим кодом у бенчмарках із знань про світ і посідає друге місце лише після закритої моделі Gemini-Pro-3.1 від Google. Родина V4 розроблена спеціально для AI-агентів, які виконують складні завдання, що виходять за межі можливостей чатботів.

API V4-Pro уже підрізає витрати великих західних конкурентів: ціна становить $3.48 за мільйон токенів виходу проти $30 для OpenAI GPT-4.5. Ціни V4-Flash складають $0.14 за мільйон токенів входу та $0.28 за мільйон токенів виходу, потенційно дозволяючи економічно ефективні застосунки, такі як перегляд цілого кодової бази або регуляторних документів в одному запиті.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Підвищувати продуктивність за допомогою ШІ чи знижувати витрати? Ста разів ефективності не дало ста разів доходу, але у Силіконовій долині ніхто не наважується сказати “стоп”.

Мен Сінг, партнер Wuyuan Capital, нещодавно опублікував звіт про відвідування Силіконової долини та висунув висновок, через який навіть йому самому довелося змінити звичку робити нотатки: Силіконова долина входить у такий етап, коли навіть людину, яка вміє «пускати хвилі», змиває хвилею. Швидкість ітерацій AI вже з «щомісяця» перейшла на «щотижня», навіть самі у Силіконовій долині не встигають за власним темпом. Коли AI збільшує продуктивність команди у 5 разів, ви можете скоротити до 80% персоналу, щоб зберегти той самий обсяг випуску, або ж залишити чисельність і робити в п’ять разів більше. Спостереження Мен Сіна цього разу по Силіконовій долині фактично є чернеткою відповіді, даної на місці: коли 100-кратна ефективність не дала 100-кратних доходів, коли токен-бюджет наближається до вартості людських ресурсів, коли парова машина ще не може обігнати карету, але ніхто не наважується зупинитися, Силіконова долина зараз обирає «спочатку розігнати швидкість, а там як буде». Але цей шлях у підсумку приведе до «збільшення можливостей для розширення» чи до «скорочення витрат», наразі невідомо. YC: з провідних індикаторів на відстаючі Мен Сінг цього року

ChainNewsAbmedia34хв. тому

Партнер Y Combinator ділиться тим, як за допомогою ШІ з нуля створити компанію; стартапам слід розглядати ШІ як операційну систему, а не як інструмент

Вплив ШІ на стартапи вже не зводиться лише до того, щоб інженери писали код швидше, щоб автоматизувати процеси служби підтримки або додати Copilot до наявних продуктів. Партнерка YC Діана нещодавно зазначила, що справжні зміни полягають у тому, що ШІ переписує «як компанія має бути створена з нуля». Для засновників на ранніх етапах ШІ не повинен бути просто інструментом ефективності, яким компанія інколи користується, а має бути спроєктований як операційна система всієї компанії вже з першого дня. Перспектива продуктивності вже застаріла — ШІ переписує стартову точку дизайну компанії Діана вважає, що зараз, коли ринок говорить про ШІ, це все ще надто часто залишається в межах фреймворку «підвищення продуктивності», наприклад: інженери можуть швидше писати код, команда може автоматизувати більше процесів, компанія може випускати більше функцій. Але насправді це твердження недооцінює структурні зміни, які приносить ШІ. Вона зазначає, що правильна комбінація людей і ШІ…

ChainNewsAbmedia45хв. тому

代理 Cursor AI допустив помилку! Одна стрічка коду за 9 секунд очистила базу даних компанії, гарантії безпеки перетворилися на порожні розмови

Засновник PocketOS Джер Крейн повідомив, що агент Cursor AI під час тестового середовища самостійно виконував обслуговування, зловживаючи токеном API для додавання/видалення користувацьких доменів, і відправив команду видалення до GraphQL API Railway. Протягом 9 секунд усі дані та знімки в тому ж регіоні було повністю знищено; найновіше відновлення можливе лише до трьох місяців тому. Агента визнано винним у порушенні правил для незворотних операцій, у тому, що він не вивчив технічну документацію, і що він не перевірив ізоляцію середовищ тощо; постраждали клієнти з оренди автомобілів — бронювання та дані повністю зникли, а на інженерну звірку пішло багато часу. Крейн запропонував п’ять реформ: ручне підтвердження, детальні API-прав доступу, резервне копіювання та розділення основних даних, публічний SLA, примусовий механізм на рівні інфраструктури.

ChainNewsAbmedia46хв. тому

DeepSeek V4 Pro на Ollama Cloud: Claude Code одним кліком

Згідно з твітом Ollama, DeepSeek V4 Pro було випущено 4/24, уже додано в каталог Ollama в режимі хмари, і лише однією командою можна викликати такі інструменти, як Claude Code, Hermes, OpenClaw, OpenCode, Codex тощо. В4 Pro1.6T params, 1M context, Mixture-of-Experts; хмарний висновок не завантажує локальні ваги. Щоб запускати локально, потрібно самостійно отримати ваги й виконувати їх з INT4/GGUF та кількома GPU. Ранні тести швидкості були впливом хмарного навантаження: у звичайному режимі приблизно 30 tok/s, у піку 1.1tok/s; рекомендується спочатку використовувати хмарний прототип, а для офіційного серійного виробництва — виконувати власний висновок або використовувати комерційне API.

ChainNewsAbmedia1год тому

Coachella звертається до ШІ DeepMind від Google, щоб переосмислити концерти поза сценою

Coachella співпрацює з Google DeepMind, щоб протестувати нові інструменти ШІ, які змінюють спосіб створення та сприйняття live-музичних виступів. Резюме Coachella тестувала інструменти ШІ разом із Google DeepMind, щоб перетворювати live-виступи на інтерактивні цифрові середовища. Було створено три прототипи,

Cryptonews1год тому
Прокоментувати
0/400
Немає коментарів