Архітектура, яка допомагає зменшити витрати на 90% і при цьому зберегти якість

robot
Генерація анотацій у процесі

Дослідження Delphi Digital мають великий вплив на ринок. Однак, коли вони розробили продукт AI для глибокого аналізу крипто, проект майже був зупинений через надто жорсткі економічні обмеження. Складні запити щодо on-chain, токеноміки або моделей оцінки можуть коштувати кілька доларів за кожне питання. При масштабуванні для тисяч користувачів витрати значно перевищать можливості стабільної роботи. Вони не обрали простий шлях переходу на дешевшу модель. Замість цього вони повністю переробили архітектуру системи.

Три рівні архітектури для вирішення проблеми витрат 1️⃣ Інтелектуальний маршрутизатор запитів – Intelligent Query Router Більше 60% запитів не потребують залучення LLM. Ціни на дані → виклик API безпосередньо Основні визначення, концепції → з кешу Лише складний аналіз → активує модель розуміння Принцип: використовувати правильний інструмент для правильного завдання. Не всі питання потребують важкої AI. 2️⃣ Багаторівневе кешування – Tiered Caching Більшість запитів повторюються. Менш змінюваний контент → попередньо згенерувати Повільно змінюваний контент → кешувати Динамічний контент у реальному часі → створювати новий Результати: Зменшення затримки відповіді на 70% Більш стабільна система Значне зниження витрат на розрахунки 3️⃣ Тестування моделей «всліпу» – Blind Model Testing Delphi надсилає один і той самий запит кільком моделям. Експерти оцінюють результати без знання джерела. Неочікуваний висновок: Малі моделі часто дають результати, порівнянні з великими. Звідси вони маршрутизують запити до найдешевшої моделі, яка все ще відповідає вимогам якості. Ключовий фактор: підтвердження точності Оптимізація витрат дійсно ефективна лише при забезпеченні надійності. Саме тут @mira_network відіграє свою роль. Децентралізований механізм консенсусу допомагає підтвердити результати, дозволяючи Delphi використовувати дешевші моделі без розширення ручного контролю. Результати Зниження витрат на 90% Збереження якості аналізу Прискорення відповіді Стабільність роботи системи Найбільший урок Технологічна потужність без економічної реалізації — лише дослідження. Delphi доводить, що: Проблема впровадження (deployment problem) не менш важлива за проблему моделі (model problem). І коли є шар підтвердження, як #Mira, обидві задачі можна вирішити. $MIRA

MIRA-5,96%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.38KХолдери:1
    0.00%
  • Рин. кап.:$2.44KХолдери:2
    0.35%
  • Рин. кап.:$2.38KХолдери:0
    0.00%
  • Рин. кап.:$2.43KХолдери:2
    0.14%
  • Рин. кап.:$2.43KХолдери:1
    0.00%
  • Закріпити