Kết quả tìm kiếm cho "R1"
Hôm nay
00:21
1

DeepSeek Hoãn Ra Mắt V4 để Tối Ưu cho Chip Ascend của Huawei

Tin tức từ Gate, ngày 27 tháng 4 — DeepSeek đã hoãn việc ra mắt mô hình V4 của mình để tinh chỉnh ngăn xếp phần mềm của họ cho các chip Ascend của Huawei, phản ánh sáng kiến rộng hơn của Bắc Kinh nhằm phát triển một chuỗi cung ứng AI nội địa khi khả năng tiếp cận các chất bán dẫn tiên tiến từ nước ngoài ngày càng bị hạn chế. DeepSe
Xem thêm
23:01

DeepSeek tìm cách huy động $300M triệu USD ở mức định giá $10B tỷ USD như OpenAI, định giá của Anthropic khơi dậy tranh luận trên thị trường

DeepSeek tìm cách huy động $300 triệu USD với định giá $10 tỷ USD, thấp hơn đáng kể so với các công ty AI hàng đầu của Mỹ như OpenAI và Anthropic. Mô hình R1 của họ có chi phí huấn luyện thấp đã làm xáo trộn thị trường, dẫn đến lo ngại của nhà đầu tư về chênh lệch định giá và tiềm năng doanh thu.
Xem thêm
23:59

DeepSeek-R1 phát hành tròn 1 năm, tiết lộ mô hình mới 「MODEL1」

DeepSeek cùng với việc phát hành mô hình mới 「MODEL1」 đã cập nhật mã FlashMLA, đề cập đến 28 trong số 114 tệp, khác với V32. MODEL1 có thể là kiến trúc mới, với sự khác biệt chính tập trung vào tối ưu hóa bộ nhớ, bố cục bộ đệm KV, xử lý thưa và giải mã FP8.
Xem thêm
06:41

DeepSeek-V3.1 chính thức phát hành

DeepSeek chính thức phát hành phiên bản V3.1, bản nâng cấp bao gồm kiến trúc suy luận hỗn hợp, hiệu suất tư duy cải thiện và khả năng Agent mạnh mẽ hơn, người dùng có thể tự do chuyển đổi giữa chế độ tư duy và chế độ không tư duy thông qua nút "Độ sâu".
Xem thêm
DEEPSEEK-3,19%
07:36

Mô hình suy diễn đầu tiên Mã nguồn mở MiniMax: Đối thủ cạnh tranh với DeepSeek, Khả năng tính toán chi phí chỉ khoảng 53 triệu đô la.

Bot Gate News, MiniMax đã thông báo vào ngày 17 tháng 6 rằng họ sẽ phát hành các bản cập nhật quan trọng trong năm ngày liên tiếp. Gạch đầu dòng đầu tiên của ngày hôm nay là mô hình suy luận mã nguồn mở đầu tiên MiniMax-M1. Theo báo cáo chính thức, MiniMax-M1 có thể so sánh với các mẫu mã nguồn mở như DeepSeek-R1 và Qwen3 trong nhiều điểm chuẩn, và gần với các mẫu nước ngoài tiên tiến nhất. Blog chính thức cũng đề cập rằng dựa trên hai cải tiến công nghệ lớn, quá trình đào tạo MiniMax-M1 là "ngoài mong đợi", và chỉ mất 3 tuần và 512 GPU H800 để hoàn thành giai đoạn đào tạo học tăng cường, và chi phí thuê sức mạnh tính toán chỉ là 534.700 đô la Mỹ.
Xem thêm
DEEPSEEK-3,19%
04:37
1

Nhà nghiên cứu Apple: Mô hình AI chính thống vẫn không thể đạt được mức độ suy luận mong đợi của AGI.

Trong một bài báo được công bố vào tháng 6 có tựa đề "Ảo tưởng của tư duy", các nhà nghiên cứu của Apple chỉ ra rằng các mô hình (AGI) AI hàng đầu vẫn gặp khó khăn trong việc suy luận, và kết quả là sự phát triển của (AGI) AI nói chung là một kết quả Vẫn còn một chặng đường dài phía trước. Bài báo chỉ ra rằng các bản cập nhật mới nhất cho các mô hình ngôn ngữ lớn AI chính thống (LLM), chẳng hạn như ChatGPT của OpenAI và Claude của Anthropic, đã bao gồm các mô hình suy luận lớn (LRM), nhưng các tính năng cơ bản của chúng, Các tính năng và hạn chế mở rộng "vẫn chưa được hiểu đầy đủ". Đánh giá hiện tại tập trung chủ yếu vào các tiêu chuẩn toán học và mã hóa đã được thiết lập, "nhấn mạnh độ chính xác của câu trả lời cuối cùng". Tuy nhiên, các nhà nghiên cứu cho biết đánh giá không cung cấp cái nhìn sâu sắc về khả năng suy luận của các mô hình AI, trái ngược hoàn toàn với kỳ vọng rằng trí tuệ nhân tạo chung sẽ đạt được chỉ trong vài năm.
Xem thêm
AGI-3,19%
14:43

Ethereum R1: Dự án Rollup trung tính không Token chính thức khởi động

Tin tức Gate.io News bot, giải pháp mở rộng Ethereum R1 chính thức được công bố. Dự án này hoạt động theo mô hình tài trợ 100% từ thiện, không phát hành Token và không có hoạt động bán trước. R1 từ khi khởi động đã bước vào giai đoạn thứ hai, có cơ chế chứng minh không cần giấy phép, thời gian trì hoãn nâng cấp dài và đặc điểm ký nhiều từ cộng đồng rộng rãi. Dự án nhận được hỗ trợ tài chính từ lợi ích công cộng cho đến năm 2030, sau đó tất cả các khoản phí phát sinh sẽ bị tiêu hủy. Nguồn tin: wublock123
Xem thêm
ETH-3,1%