Cursor Tiết lộ Phương pháp Huấn luyện Tự Cài Đặt, Nâng Hiệu năng Composer 2 Lên 14 Điểm Phần Trăm

Theo tiết lộ gần đây của Cursor, công ty đã giới thiệu một kỹ thuật huấn luyện có tên autoinstall cho dòng mô hình Composer: sử dụng một mô hình thế hệ trước để tự động thiết lập môi trường thực thi cho mô hình thế hệ tiếp theo trong quá trình học tăng cường. Khi huấn luyện Composer 2, Cursor đã dùng Composer 1.5 để hoàn tất nhiệm vụ này. Phương pháp gồm 2 bước: trước tiên, một tác nhân đọc tài liệu và cấu hình của kho mã để tạo ra 10 lệnh xác minh kèm đầu ra kỳ vọng; sau đó, một tác nhân khác sử dụng 3 trong số các lệnh đó để thiết lập môi trường từ đầu cho đến khi các lệnh chạy thành công, với tối đa 5 lần thử lại. Composer 2 đạt 61,7% trên Terminal-Bench, một thước đo khả năng thiết lập môi trường, so với 47,9% của Composer 1.5, đánh dấu mức cải thiện 14 điểm phần trăm.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

EU cấm nội dung khiêu dâm deepfake do AI tạo ra vào ngày 7 tháng 5

Theo Hãng Thông tấn Xinhua, vào ngày 7/5, các nghị sĩ Nghị viện châu Âu và các quốc gia thành viên đã đạt được đồng thuận để cấm các hệ thống trí tuệ nhân tạo tạo ra nội dung khiêu dâm deepfake. Lệnh cấm này sẽ được đưa vào các sửa đổi của Đạo luật Trí tuệ nhân tạo năm 2024. Nghị viện châu Âu

GateNews9phút trước

Tether ra mắt mô hình AI y tế MedPsy QVAC, đạt điểm 62,62 trên phiên bản 17 tỷ tham số

Theo Odaily, Tether AI Research Group đã ra mắt QVAC MedPsy, một mô hình AI y tế được thiết kế để chạy cục bộ trên điện thoại thông minh và các thiết bị đeo mà không phụ thuộc vào đám mây. Phiên bản với 1,7 tỷ tham số đạt 62,62 trên bảy bộ tiêu chí y tế, vượt MedGemma-1.5-4B của Google thêm 11,42 điểm poi

GateNews29phút trước

B.AI ra mắt 4 mô hình mới, bao gồm GPT-5.5 Instant, trong vòng 48 giờ sau khi OpenAI phát hành

API B.AI đã ra mắt 4 mẫu mới: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 và GLM-5.1. GPT-5.5 Instant đã hoàn tất việc thích ứng nền tảng và tích hợp giao diện trong vòng 48 giờ sau khi OpenAI ra mắt, cho phép truy cập không độ trễ đến

GateNews34phút trước

Mô hình AI Y tế trị giá 1,7 tỷ USD của Tether vượt trội đối thủ lớn hơn 16 lần vào hôm nay

Theo nhóm nghiên cứu AI của Tether, hôm nay công ty đã ra mắt dòng mô hình ngôn ngữ y tế QVAC MedPsy, được thiết kế để triển khai cục bộ trên điện thoại thông minh và thiết bị đeo mà không cần phụ thuộc đám mây. Phiên bản 1,7B tham số đạt 62,62 trên bảy bộ đánh giá y tế, vượt qua Google MedGemma-4B

GateNews45phút trước

Định giá trước IPO của Anthropic đạt 1,2 nghìn tỷ USD, vượt OpenAI 20%

Theo Odaily, định giá ngụ ý của Anthropic trên thị trường tiền IPO theo blockchain đạt 1,2 nghìn tỷ USD, vượt OpenAI khoảng 20%. Nếu công ty lên sàn theo mức định giá này, công ty sẽ xếp thứ 11 trong số các công ty niêm yết công khai lớn nhất trên toàn cầu tính theo vốn hóa thị trường, sau Apple,

GateNews50phút trước

Sàn chứng khoán Hàn Quốc tăng tốc nhanh hơn các thị trường toàn cầu nhờ làn sóng AI

Thị trường chứng khoán Hàn Quốc đang ghi nhận mức tăng kỷ lục nhờ các cổ phiếu bán dẫn liên quan đến trí tuệ nhân tạo, với chỉ số KOSPI tăng 78% trong năm nay, vượt trội so với mọi thị trường lớn khác trên toàn cầu, theo dữ liệu Financial Modeling Prep được trích dẫn trong một phân tích của Axios. AI

CryptoFrontier58phút trước
Bình luận
0/400
Không có bình luận