Synapse Software Áp dụng Công nghệ TurboQuant để Giảm Chi phí Xử lý Tài liệu AI

Tin tức Cổng, ngày 15 tháng 4 — Synapse Software đã tích hợp TurboQuant, một thuật toán lượng tử hóa vectơ được phát triển bởi Google Research, vào giải pháp Synap OCR IX của họ để nâng cao năng lực AI cho tài liệu đồng thời giảm chi phí triển khai AI cho doanh nghiệp.

TurboQuant nén bộ nhớ đệm KV được sử dụng bởi các mô hình ngôn ngữ lớn (LLMs) và các mô hình ngôn ngữ đa phương thức (VLMs), làm giảm mức tiêu thụ bộ nhớ khi xử lý các tài liệu dài. Điều này cho phép xử lý dữ liệu nhanh hơn trên cùng hạ tầng GPU. Công nghệ này giải quyết các nút thắt về bộ nhớ trước đây đòi hỏi hạ tầng GPU đắt đỏ, đặc biệt khi xử lý ngữ cảnh mở rộng và xử lý theo lô lớn mà không làm suy giảm hiệu năng.

Synapse Software cũng hỗ trợ các môi trường dựa trên CPU cho các doanh nghiệp không thể triển khai hạ tầng GPU. Thông qua đo đạc hiệu năng chính xác, công ty đã đạt được xử lý suy luận chỉ bằng CPU với tốc độ khoảng 100 tài liệu mỗi phút trong khi mức suy giảm chất lượng được giữ dưới 1%, qua đó hạ thấp tổng chi phí sở hữu (TCO). Cách tiếp cận hạ tầng linh hoạt này cho phép triển khai AI OCR trong các lĩnh vực nhạy cảm về an ninh như tài chính và quản lý công, nơi trước đây việc triển khai tại chỗ và các ràng buộc về hạ tầng đã cản trở việc triển khai AI.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Hut 8 Phát Hành Trái Phiếu Đạt Chuẩn Đầu Tư Để Tài Trợ Trung Tâm Dữ Liệu AI Liên Kết Với Google

Tin Cổng, ngày 27 tháng 4 — Hãng khai thác Bitcoin Hut 8 Corp đang phát hành trái phiếu có bảo đảm đạt chuẩn đầu tư để tài trợ cho việc xây dựng một trung tâm dữ liệu 245 megawatt tại St. Francisville, Louisiana, hợp tác với Alphabet Inc. (Google). Các trái phiếu, đáo hạn vào năm 2042, có hướng dẫn giá ban đầu khoảng

GateNews6giờ trước

CEX lớn ra mắt Smart Money Signal Suite với dữ liệu từ hơn 1.000 nhà giao dịch

Tin tức Gate, ngày 27 tháng 4 — Một sàn giao dịch tập trung lớn đã ra mắt "Smart Money Signal Suite" tích hợp dữ liệu nắm giữ theo thời gian thực, tỷ lệ thắng và lãi/lỗ từ hơn 1.000 nhà giao dịch phổ biến. Bộ công cụ, có thể truy cập thông qua Agent Trade Kit của nền tảng, mã hóa các tín hiệu giao dịch dưới dạng các công cụ có thể gọi bởi AI Agent.

GateNews11giờ trước

Startup Phần Mềm Robotics Sereact Huy Động $110M Series B do Headline Dẫn Dắt

Tin tức Gate, ngày 27 tháng 4 — Startup phần mềm robot Sereact công bố vào ngày 27 tháng 4 rằng họ đã huy động $110 triệu trong một vòng Series B do Headline dẫn dắt nhằm mở rộng hoạt động và phát triển các mô hình AI tiên tiến cho robot công nghiệp. Bullhound Capital, Felix Capital và Daphni cũng tham gia vào

GateNews11giờ trước

DeepSeek V4 Pro trên Ollama Cloud: Claude Code kết nối một lần

Theo tweet của Ollama, DeepSeek V4 Pro được ra mắt vào 4/24, đã được tích hợp theo chế độ đám mây vào thư mục Ollama, chỉ với một lệnh duy nhất là có thể gọi các công cụ như Claude Code, Hermes, OpenClaw, OpenCode, Codex, v.v. V4 Pro có bộ tham số 1.6T, 1M context, Mixture-of-Experts; suy luận trên đám mây không tải trọng số về máy cục bộ. Nếu muốn chạy cục bộ thì cần tự tải trọng số và thực thi bằng INT4/GGUF với nhiều GPU. Tốc độ đo thử giai đoạn đầu bị ảnh hưởng bởi tải trọng của đám mây, thông thường khoảng 30 tok/s, đỉnh đạt 1.1 tok/s; khuyến nghị sử dụng nguyên mẫu trên đám mây, rồi khi sản xuất chính thức thì tự suy luận hoặc dùng API thương mại.

ChainNewsAbmedia13giờ trước
Bình luận
0/400
Không có bình luận