Pesan Berita Gate, 15 April — Synapse Software telah mengintegrasikan TurboQuant, sebuah algoritma kuantisasi vektor yang dikembangkan oleh Google Research, ke dalam solusi Synap OCR IX miliknya untuk meningkatkan kemampuan AI dokumen sekaligus mengurangi biaya adopsi AI perusahaan.

TurboQuant mengompresi cache KV yang digunakan oleh model bahasa besar (LLMs) dan model bahasa penglihatan (VLMs), sehingga mengurangi konsumsi memori saat memproses dokumen panjang. Ini memungkinkan pemrosesan data yang lebih cepat pada infrastruktur GPU yang sama. Teknologi ini mengatasi hambatan memori yang sebelumnya memerlukan infrastruktur GPU yang mahal, terutama untuk menangani konteks yang diperpanjang dan pemrosesan batch besar tanpa penurunan kinerja.

Synapse Software juga mendukung lingkungan berbasis CPU bagi perusahaan yang tidak dapat menerapkan infrastruktur GPU. Melalui precision profiling, perusahaan tersebut mencapai pemrosesan inferensi hanya CPU untuk sekitar 100 dokumen per menit dengan penurunan kualitas dijaga di bawah 1%, sehingga menurunkan total biaya kepemilikan (TCO). Pendekatan infrastruktur yang fleksibel memungkinkan adopsi AI OCR di sektor yang sensitif terhadap keamanan seperti keuangan dan administrasi publik, di mana penerapan di lokasi (on-premises) dan keterbatasan infrastruktur sebelumnya menghambat implementasi AI.

Lihat Sumber

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Hut 8 Menerbitkan Obligasi Berkualitas Investasi untuk Membiayai Pusat Data AI yang Terkait Google

Saham Berita Industri AI AI Tools & Aplikasi

Berita Pintu, 27 April — Penambang Bitcoin Hut 8 Corp menerbitkan obligasi berjamin berkualitas investasi untuk membiayai pembangunan pusat data berkapasitas 245 megawatt di St. Francisville, Louisiana, bekerja sama dengan Alphabet Inc. (Google). Obligasi tersebut, jatuh tempo pada tahun 2042, memberikan panduan harga awal sekitar 213 basis poin di atas imbal hasil acuan.

GateNews6jam yang lalu

CEX Utama Meluncurkan Smart Money Signal Suite dengan Data 1.000+ Trader

Agen AI AI Tools & Aplikasi

Pesan Berita Gate, 27 April — Sebuah bursa terpusat besar telah meluncurkan "Smart Money Signal Suite" yang mengintegrasikan data kepemilikan real-time, tingkat kemenangan, serta data laba/rugi dari lebih dari 1.000 trader populer. Paket alat tersebut, yang dapat diakses melalui Agent Trade Kit di platform, merangkum sinyal trader sebagai

GateNews11jam yang lalu

Perusahaan Rintisan Perangkat Lunak Robotik Sereact Menggalang $110M Seri B Dipimpin oleh Headline

AI Tools & Aplikasi

Pengumuman Gate News, 27 April — Perusahaan rintisan perangkat lunak robotik Sereact mengumumkan pada 27 April bahwa pihaknya mengumpulkan $110 juta dalam putaran Seri B yang dipimpin oleh Headline untuk memperluas operasi dan mengembangkan model AI canggih untuk robot industri. Bullhound Capital, Felix Capital, dan Daphni juga turut berpartisipasi dalam

GateNews11jam yang lalu

DeepSeek V4 Pro di Ollama Cloud: Claude Code terhubung satu klik

Agen AI Berita Industri AI AI Tools & Aplikasi

Berdasarkan cuitan Ollama, DeepSeek V4 Pro dirilis pada 4/24, sudah masuk ke direktori Ollama dalam mode cloud, dan hanya dengan satu perintah saja dapat memanggil alat seperti Claude Code, Hermes, OpenClaw, OpenCode, Codex, dll. V4 Pro1.6T parameter, 1M context, Mixture-of-Experts; penalaran cloud tidak mengunduh bobot ke lokal. Jika ingin menjalankan secara lokal, perlu mengambil bobot sendiri dan menjalankannya dengan INT4/GGUF serta GPU multi-kartu. Pengujian kecepatan awal dipengaruhi oleh beban pada sisi cloud; kecepatan biasanya sekitar 30 tok/s, dengan puncak 1,1 tok/s; disarankan menggunakan prototipe cloud, dan setelah siap produksi massal barulah menjalankan inferensi sendiri atau menggunakan API komersial.

ChainNewsAbmedia13jam yang lalu

Komentar

0/400

Tidak ada komentar