Tin từ Gate News, ngày 22 tháng 4 — Hugging Face đã phát hành mã nguồn mở ml-intern, một tác nhân nghiên cứu ML có thể tự động hoàn thành toàn bộ quy trình gồm đọc bài báo, tổ chức tập dữ liệu, khởi chạy huấn luyện GPU, đánh giá kết quả và lặp lại để cải tiến. Dự án được xây dựng trên framework smolagents của Hugging Face và cung cấp cả giao diện dòng lệnh (CLI) lẫn giao diện dựa trên web, với mã nguồn được công khai trên GitHub.
Bộ công cụ của ml-intern được thiết kế xoay quanh hệ sinh thái Hugging Face. Nó truy xuất các bài báo từ arXiv và HF Papers đồng thời lần theo chuỗi trích dẫn để đọc sâu hơn; duyệt tập dữ liệu trên HF Hub, xác thực chất lượng và định dạng lại dữ liệu để huấn luyện; và khi không có tài nguyên GPU cục bộ, nó gọi HF Jobs để khởi chạy các tác vụ huấn luyện trên đám mây. Sau khi quá trình huấn luyện hoàn tất, tác nhân tự động đọc các đầu ra đánh giá, chẩn đoán nguyên nhân thất bại và chạy lại các thí nghiệm. Theo mặc định, nó sử dụng Claude Sonnet 4.5 để điều khiển vòng lặp ra quyết định, với tối đa 300 lần lặp cho mỗi lần chạy và nén ngữ cảnh tự động khi vượt quá 170k token.
Hugging Face đã trình diễn ba trường hợp sử dụng. Trong một tác vụ suy luận khoa học, tác nhân xác định các tập dữ liệu OpenScience và NemoTron-CrossThink từ chuỗi trích dẫn, lọc bảy biến thể từ ARC, SciQ và MMLU theo mức độ khó, rồi chạy 12 vòng tinh chỉnh giám sát trên Qwen3-1.7B, giúp cải thiện điểm GPQA từ 10% lên 32% trong dưới 10 giờ. Với một ứng dụng y tế, tác nhân kết luận rằng các tập dữ liệu hiện có là chưa đủ, viết các script để tạo ra 1.100 mẫu dữ liệu tổng hợp, và mở rộng chúng gấp 50 lần để huấn luyện, vượt hiệu năng Codex thêm 60% trên HealthBench. Trong một bối cảnh toán học cạnh tranh, tác nhân đã viết script huấn luyện GRPO và khởi chạy huấn luyện trên các GPU A100 thông qua HF Spaces, sau đó tiến hành các nghiên cứu ablation sau khi quan sát hiện tượng sụp đổ phần thưởng.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Microsoft Ra Mắt Hạ Tầng Thương Mại Cho Tác Nhân AI: Thị Trường Dành Cho Nhà Xuất Bản, Giao Thức Cho Thương Nhân và Công Cụ Quảng Cáo
Tin tức từ Gate, ngày 22 tháng 4 — Phó chủ tịch phụ trách thương mại hóa AI của Microsoft Tim Frank đã công bố một loạt cập nhật hạ tầng thương mại nhằm phục vụ kỷ nguyên “web tác nhân”, giúp các nhà xuất bản, thương nhân và nhà quảng cáo vẫn có thể được phát hiện và giao dịch khi các tác nhân AI đưa ra quyết định mua sắm thay mặt người dùng trên
GateNews27phút trước
NeoCognition Huy động $40M vốn hạt giống cho các tác nhân AI học ngay khi làm việc
Tin tức từ Gate, ngày 22 tháng 4 — Phòng thí nghiệm nghiên cứu AI NeoCognition thông báo hoàn tất một vòng gọi vốn hạt giống $40 triệu, xuất phát chế độ ẩn. Được thành lập bởi Phó giáo sư Đại học Bang Ohio Yu Su, cùng với Xiang Deng và Yu Gu, công ty có trụ sở tại Palo Alto, California. Vòng gọi vốn này
GateNews44phút trước
PicWe Ra Mắt Ví Tác Nhân AI với Quản Lý Khóa Trên Thiết Bị
PicWe thông báo ra mắt bản beta công khai của PicWe Wallet, một ví khóa cục bộ trên thiết bị được hỗ trợ bởi tác nhân AI, không có cụm khôi phục. Ví hỗ trợ tài sản đa chuỗi, giao dịch hoán đổi (swap), tự động hóa có thể truy cập bằng AI và nhằm thống nhất hạ tầng RWA.
PicWe đã ra mắt bản beta công khai của PicWe Wallet, một ví được bật tác nhân AI (AI Agent) lưu trữ khóa ngay trên thiết bị, loại bỏ cụm khôi phục và giữ các thao tác quan trọng ở cục bộ. Bản beta hỗ trợ quản lý tài sản đa chuỗi, giao dịch hoán đổi và phí dựa trên stablecoin, đồng thời cho phép các tương tác AI có thể lập trình. Các sáng kiến PicWe rộng hơn định vị nền tảng như một hạ tầng thống nhất cho tài sản thế giới thực, cho phép phát hành, lưu thông, thanh toán, thanh toán xuyên biên giới, token hóa và phối hợp chuỗi cung ứng cho các trường hợp sử dụng ở doanh nghiệp.
GateNews1giờ trước
Google Research Phát hành ReasoningBank: Các tác nhân AI Học các chiến lược suy luận từ Thành công và Thất bại
Tin cổng Gate News, ngày 22 tháng 4 — Google Research đã phát hành ReasoningBank, một khung bộ nhớ tác nhân cho phép các tác nhân điều khiển bởi mô hình ngôn ngữ lớn liên tục học hỏi sau khi triển khai. Khung này trích xuất các chiến lược suy luận phổ quát từ cả kinh nghiệm nhiệm vụ thành công và thất bại, lưu
GateNews2giờ trước
Giáo sư Dai Jifeng của Đại học Thanh Hoa ra mắt Naive.ai, huy động ~$300M với định giá $800M
Tin tức Gate, ngày 22 tháng 4 — Dai Jifeng, giảng viên liên kết tại Khoa Kỹ thuật Điện của Đại học Thanh Hoa, đã sáng lập Naive.ai, một công ty tập trung vào huấn luyện sau mô hình mã nguồn mở và các tác nhân AI. Startup này đã huy động khoảng $300 triệu USD với định giá ước tính là $80
GateNews2giờ trước
AWS mở rộng các quy trình AI nhiều tác nhân, hỗ trợ Claude Opus 4.7 trên Bedrock
Tin tức từ Gate, ngày 22 tháng 4 — Amazon Web Services đã công bố việc mở rộng các sáng kiến AI mang tính tác nhân thông qua các quy trình làm việc nhiều tác nhân, hỗ trợ Anthropic's Claude Opus 4.7 trên Amazon Bedrock để giúp khách hàng đi xa hơn các thử nghiệm AI sinh thành. Công ty đang mở rộng quan hệ đối tác khi khách hàng chuyển từ các công cụ AI đơn lẻ sang các hệ thống kết nối nhiều tác nhân chuyên biệt.
GateNews3giờ trước