Mistral AI phát hành Leanstral: Agent mã nguồn mở Lean 4 đầu tiên, có thể tự động xuất bản chứng minh hình thức

Tin tức Gate News, ngày 17 tháng 3, Mistral AI đã chính thức ra mắt Leanstral, đây là mã nguồn mở đầu tiên dành riêng cho công cụ xác thực hình thức Lean 4. Mô hình này có điểm đột phá cốt lõi là khả năng sinh mã của AI đồng thời xuất ra các chứng minh hình thức có thể tự động kiểm tra bởi Lean 4, giúp vượt qua rào cản kiểm duyệt thủ công trong quá trình tạo mã AI truyền thống.

Leanstral sử dụng kiến trúc MoE thưa, có tổng cộng 120 tỷ tham số và 6 tỷ tham số kích hoạt, mở mã theo giấy phép Apache 2.0, và đã được tối ưu hóa huấn luyện đặc biệt cho lean-lsp-mcp. Người dùng có thể khởi động mà không cần cấu hình qua lệnh /leanstall trong Mistral Vibe hoặc gọi qua API miễn phí tại điểm cuối labs-leanstral-2603, đồng thời hỗ trợ tải trọng số để tự triển khai.

Mistral cũng đồng thời phát hành chuẩn đánh giá mới mang tên FLTEval, sử dụng dự án xác thực hình thức của định lý Fermat trong cộng đồng Lean 4 làm bối cảnh thử nghiệm. Kết quả so sánh hiệu suất cho thấy: Leanstral pass@2 với chi phí 36 USD đạt điểm 26.3, vượt xa Claude Sonnet 4.6 với chi phí 549 USD đạt 23.7 điểm; pass@16 với chi phí 290 USD đạt 31.9 điểm, dẫn trước Sonnet 8 điểm, trong khi Claude Opus 4.6 cần tới 1.650 USD mới đạt 39.6 điểm. Trong các mô hình mã nguồn mở, Qwen3.5-397B-A17B cần chạy 4 lần mới đạt 25.4 điểm, vẫn thấp hơn hiệu suất của Leanstral pass@2.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận