Blockify überarbeitet Unternehmens-RAG: Mit IdeaBlock statt Chunking, komprimiert um das 40-Fache, reduziert Token um das 3-Fache

ChainNewsAbmedia

企業-AI-Datenoptimierungs-Neuwerkzeug Blockify wurde am 9. Mai von akshay_pachaar kuratiert und beworben. Dabei wird behauptet, dass es im RAG-(Retrieval-Augmented Generation)-Prozess Unternehmensdaten um 40-fach komprimieren, den Token-Verbrauch bei Abfragen um 3-fach senken und die Treffergenauigkeit der Vektorsuche um 2,3-fach erhöhen kann. Die offizielle GitHub-Erklärung von Blockify lautet: Das Produkt wird von Iternal Technologies herausgegeben, nutzt mit dem „IdeaBlock“-Schema strukturierte Wissenseinheiten anstelle des traditionellen chunking und hält die Wissensdatenbank durch De-Duplication und Zusammenführung schlank, kohärent und verwaltbar.

Kernkonzept: IdeaBlock ersetzt traditionelles chunking

Technisches Design von Blockify:

Traditioneller Ansatz: Lange Dokumente in feste Chunk-Größen schneiden, Vektor-Einbettungen erstellen, bei der Suche top-k abrufen

Ansatz von Blockify: Rohinhalte in IdeaBlock umwandeln – XML-strukturierte Wissenseinheiten

Jeder IdeaBlock enthält: eigene Frage, vertrauenswürdige Antwort, Tags, Entitäten, Schlüsselwörter

Ähnliche IdeaBlocks werden automatisch de-dupliciert und zusammengeführt, sodass die Wissensdatenbank nicht mit dem Inhaltswachstum „aufbläht“

Das Problem von traditionellem chunking ist, dass dieselbe Information in mehreren Chunks wiederholt auftauchen kann, was Suchredundanz und Token-Verschwendung verursacht; IdeaBlock erhöht die Informationsdichte, indem es doppelte Inhalte per De-Duplication entfernt – und derselbe Inhalt wird mit weniger Speicherplatz ausgedrückt.

Konkrete Vorteile: Komprimierung um 40-fach, Token um 3-fach reduzieren, Genauigkeit um 2,3-fach steigern

Von Blockify veröffentlichte konkrete Kennzahlen:

Datenkomprimierung: Die Unternehmensdatenbank wird auf etwa 2,5% der ursprünglichen Größe reduziert (40-fach komprimiert), wobei mehr als 99% der Informationen erhalten bleiben

Token pro Abfrage: von etwa 303 (traditionelle Chunks) auf etwa 98 (IdeaBlock) – 3,09-fach Effizienz

Genauigkeit der Vektorsuche: Steigerung um 2,29-fach

Gesamtverbesserung der Trefferquote: etwa 78-fach (kombinierte Wirkung aus De-Duplication und Verbesserungen bei der Suche)

Kosteneinsparungsrechnung: 100 Millionen Abfragen/Jahr, Einsparung bei Token-Kosten von rund 738.000 US-Dollar

Die 78-fach verbesserte Gesamtgenauigkeit ist ein zusammengesetzter Effekt: De-Duplication reduziert Rauschen, Inhalte im IdeaBlock-Strukturformat sind vektorsuche-freundlicher, und die Anzahl der Token pro Antwort sinkt zugleich, wodurch auch der Spielraum für Modellfehler kleiner wird.

Integrationsbereich: LlamaIndex, LangChain, Milvus, Cloudflare und weitere gängige Frameworks

Bereits integrierte Entwickler-Tools und Infrastruktur von Blockify:

RAG-Frameworks: LlamaIndex, LangChain

Wissensmanagement: Obsidian

Vektordatenbanken: Milvus, Elastic, Supabase

Edge-Computing: Cloudflare

Low-Code-Integration: n8n (über Workflow-Templates)

Die Integrationsstrategie von Blockify ist: „Bestehende RAG-Frameworks nicht ersetzen, sondern als vorgelagerte Datenoptimierungs-Schicht fungieren“. Entwickler können in bestehenden LlamaIndex- oder LangChain-Prozessen den chunking-Schritt durch Blockify ersetzen; der übrige Ablauf bleibt unverändert.

Konkrete, später verfolgbar Ereignisse: Wachstum der Blockify-GitHub-Sternzahlen und die Community-Akzeptanz, ob Iternal Technologies für die Idee der IdeaBlock-Struktur ein Patent beantragt oder technische Details offengelegt (aktuell wird „patented ingestion“ beworben), sowie ob gängige RAG-Frameworks ähnliche De-Duplication-Logik als Standardfunktion integrieren.

Dieser Artikel Blockify rewritet Enterprise-RAG: IdeaBlock statt chunking, 40-fach komprimieren, Token um 3-fach reduzieren erschien zuerst in der Ketten-News ABMedia.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Tencent Yuan Bao startet heute die Funktion „Chat-Zusammenfassung“ in WeChat

Laut Tencents Ankündigung vom 13. Mai hat Tencent Yuan Bao eine neue Funktion eingeführt, mit der Nutzer WeChat-Chatverläufe zusammenfassen können. Nutzer können den Chatverlauf in WeChat auswählen, auf „Weiterleiten an andere Apps“ tippen und Yuan Bao aus der Liste auswählen, um Inhalte direkt in die Chat-Oberfläche der App zu kopieren, wo die KI intelligente Zusammenfassungen und Analysen bereitstellt.

GateNews36M her

XYO bringt am 12. Mai ein KI-SDK auf den Markt, um Blockchain-Entwicklung ohne Solidity-Kenntnisse zu ermöglichen

Laut XYO hat das Unternehmen am 12. Mai ein KI-Software-Development-Kit veröffentlicht, das darauf ausgelegt ist, die Erstellung von Blockchain-Anwendungen auf XYO Layer One mithilfe natürlicher Sprache zu vereinfachen. Das KI-SDK ermöglicht es Entwicklern, dezentrale Anwendungen über KI-Code-Assistenten wie Codex und Claude zu bauen, ohne dass Kenntnisse in Solidity oder tiefgehende Blockchain-Expertise erforderlich sind. Die in San Diego ansässige Plattform, die derzeit über 10 Millionen Nodes

GateNews53M her

WeChat ermöglicht jetzt Ein-Klick-Weiterleitung von Nachrichten an Yuanbao AI für eine sofortige Zusammenfassung

Laut Beating hat WeChat die Integration mit Tencents KI-Assistent Yuanbao vorgenommen, um das Weiterleiten von Nachrichten zwischen Apps zu ermöglichen. Nutzer können nun Chatverläufe auswählen, diese an Yuanbao weiterleiten und sofort Zusammenfassungen von langen Gruppen- oder privaten Chats erhalten. Die Funktion unterstützt außerdem das Extrahieren von Ausgabendaten in Tabellen, das Erstellen von Reiseplänen aus Diskussionsthreads sowie das Bereitstellen von Chat-Vorschlägen. Nutzer müssen so

GateNews3Std her

Wu Jihan: 1万 GPU als Einsatz-Ziel; Bitcoin Xiaolu: AI-Cloud-Jahresumsatz im April um 60% gestiegen

Laut einer Erklärung von Wu Jihan, dem Vorsitzenden der Bitdeer-Gruppe, vom 12. Mai auf X, sagte Wu Jihan: „Das nächste Ziel für die GPU-Deployments sind 10.000 Einheiten, dann 100.000 Einheiten und danach 1 Million Einheiten.“ Am selben Tag veröffentlichte Bitdeer einen ungeprüften Update-Report zu Produktion und Betrieb im April: Der jährliche wiederkehrende Umsatz (ARR) der AI-Cloud-Geschäftssparte stieg im Monatsvergleich um 60% auf 69 Millionen US-Dollar. AI-Cloud-Geschäft: ARR im Monatsver

MarketWhisper5Std her

SAP investiert in n8n mit einer Bewertung von 5,2 Milliarden US-Dollar über einen Secondary-Share-Sale

Laut CEO Jan Oberhauser hat SAP in Deutschland über einen Verkauf von Bestandsanteilen in die in Berlin ansässige Workflow-Automatisierungs-Startup n8n investiert und das Unternehmen mit 5,2 Milliarden US-Dollar bewertet. SAP hat außerdem eine mehrjährige Vereinbarung unterzeichnet, um n8n-Tools in seinen Joule Studio-Builder für KI zu integrieren, während es sein Angebot an KI-Produkten ausbaut. n8n wurde 2019 gegründet und bietet Software, mit der Unternehmen Aufgaben mit minimalem Programmier

GateNews5Std her

The Graph startet die x402-Zahlungsfunktion, die den USDC-basierten, nutzungsabhängigen On-Chain-Datenzugriff unterstützt, am 12. Mai

Laut der offiziellen Ankündigung von The Graph vom 12. Mai unterstützt Graph Gateway jetzt x402-Zahlungen und ermöglicht Entwicklern und KI-Agents den Zugriff auf On-Chain-Daten über USDC im Abrechnungsmodus pro Anfrage, ohne dass API-Schlüssel, Konten oder Dashboards erforderlich sind. Nutzer erhalten eine HTTP-402-Antwort mit Preisinformationen und tätigen anschließend eine signaturbasierte Zahlung in USDC im Base-Netzwerk, um bei nachfolgenden Anfragen Daten abzurufen. Das Update umfasst eine

GateNews16Std her
Kommentieren
0/400
Keine Kommentare