Báo cáo: Nvidia sẽ ra mắt "chip suy luận mới" tại hội nghị GTC tháng tới, tích hợp thiết kế LPU của Groq

robot
Đang tạo bản tóm tắt

NVIDIA có kế hoạch phát hành một chip suy luận mới tích hợp công nghệ “đơn vị xử lý ngôn ngữ” (LPU) của Groq tại hội nghị nhà phát triển GTC vào tháng tới, thể hiện rằng NVIDIA đang đẩy nhanh quá trình chuyển đổi sang lĩnh vực điện toán suy luận để đáp ứng nhu cầu cấp thiết của khách hàng về các giải pháp điện toán hiệu suất cao, chi phí thấp.

Theo Wall Street Journal, hệ thống mới, mà Giám đốc điều hành Nvidia Jensen Huang gọi là “thế giới chưa từng thấy trước đây”, được thiết kế để tăng tốc phản hồi truy vấn của các mô hình AI. Sự ra mắt của sản phẩm này dự kiến sẽ định hình lại bối cảnh thị trường điện toán AI hiện tại, tác động trực tiếp đến các nhà cung cấp dịch vụ đám mây và các nhà đầu tư cấp doanh nghiệp, những người đang tìm kiếm các giải pháp thay thế hiệu quả hơn về chi phí.

Là một dấu hiệu quan trọng cho sự công nhận ban đầu của thị trường đối với công nghệ, nhà phát triển ChatGPT OpenAI đã đồng ý trở thành một trong những khách hàng lớn nhất của bộ xử lý mới và thông báo rằng họ sẽ mua “dung lượng suy luận chuyên dụng” quy mô lớn từ Nvidia. Động thái này không chỉ ổn định thị trường khách hàng cốt lõi của Nvidia mà còn gửi tín hiệu rõ ràng đến thị trường:Cơ sở hạ tầng cơ bản hỗ trợ các tác nhân AI tự động đang chuyển từ đào tạo trước quy mô lớn sang suy luận hiệu quả.

Đối mặt với sự cạnh tranh khốc liệt từ Google, Amazon và nhiều công ty khởi nghiệp, Nvidia đang phá vỡ sự phụ thuộc duy nhất vào các đơn vị xử lý đồ họa (GPU) truyền thống. Bằng cách giới thiệu các kiến trúc kỹ thuật mới và khám phá các mô hình triển khai bộ xử lý trung tâm (CPU) thuần túy, công ty tìm cách tiếp tục củng cố sự thống trị thị trường của mình trong giai đoạn tiếp theo của sự phát triển của ngành công nghiệp AI.

Tích hợp thiết kế LPU để trực tiếp chạm vào nút cổ chai của suy luận mô hình lớn

Khi ngành công nghiệp AI chuyển từ đào tạo mô hình sang triển khai ứng dụng trong thế giới thực, điện toán suy luận đã trở thành trọng tâm cốt lõi. Suy luận AI chủ yếu được chia thành hai giai đoạn: điền trước và giải mã, với quá trình giải mã các mô hình AI lớn đặc biệt chậm. Để đối phó với nút thắt kỹ thuật này, NVIDIA đã chọn phá vỡ các giới hạn vật lý thông qua tích hợp công nghệ bên ngoài.

Theo Wall Street Journal, Nvidia đã chi 20 tỷ USD để cấp phép các công nghệ quan trọng từ công ty khởi nghiệp Groq vào cuối năm ngoái và đưa một nhóm giám đốc điều hành, bao gồm cả người sáng lập Jonathan Ross, trong một thỏa thuận “tuyển dụng cốt lõi” quy mô lớn.“Bộ xử lý ngôn ngữ” (LPU) của Groq sử dụng kiến trúc hoàn toàn khác so với GPU truyền thống và cho thấy hiệu quả tuyệt vời khi xử lý các chức năng suy luận.

Các nhà phân tích trong ngành tin rằng**, các sản phẩm mới sắp tới có thể liên quan đến thế hệ tiếp theo của kiến trúc Feynman.**Theo một bài báo trước của Wall Street News, kiến trúc Feynman có thể áp dụng sơ đồ tích hợp SRAM rộng hơn, hoặc thậm chí tích hợp sâu LPU thông qua công nghệ xếp chồng 3D, đặc biệt tối ưu hóa cho hai nút thắt suy luận chính về độ trễ và băng thông bộ nhớ, do đó giảm đáng kể mức tiêu thụ năng lượng và chi phí hoạt động của tác nhân AI.

Mở rộng triển khai chỉ CPU và cung cấp các tùy chọn điện toán đa dạng

Trong khi giới thiệu kiến trúc LPU, Nvidia cũng đang linh hoạt điều chỉnh việc sử dụng các bộ vi xử lý truyền thống của mình. Thực tiễn tiêu chuẩn của Nvidia trước đây là kết hợp CPU Vera với GPU Rubin mạnh mẽ trong các máy chủ trung tâm dữ liệu, nhưng cấu hình này tỏ ra quá tốn kém và không đủ khi xử lý một số khối lượng công việc tác nhân AI nhất định.

Một số khách hàng doanh nghiệp lớn nhận thấy rằng môi trường chỉ có CPU hiệu quả hơn khi chạy các tác vụ AI cụ thể. Để đáp ứng xu hướng này, Nvidia đã thông báo trong tháng này rằng họ đã mở rộng hợp tác với Meta Platforms để triển khai chỉ CPU quy mô lớn đầu tiên để hỗ trợ các tác nhân AI nhắm mục tiêu quảng cáo của Meta. Sự hợp tác này được thị trường coi là cửa sổ sớm cho sự điều chỉnh chiến lược của Nvidia.Nó cho thấy công ty đang vượt ra ngoài một mô hình bán hàng GPU duy nhất và cố gắng nhắm mục tiêu các phân khúc khác nhau của thị trường AI thông qua danh mục phần cứng đa dạng.

Nhu cầu thị trường thay đổi, tình hình cạnh tranh tiếp tục leo thang

Sự phát triển của thiết kế phần cứng cơ bản này trực tiếp bắt nguồn từ sự bùng nổ nhu cầu đối với các ứng dụng tác nhân AI trong ngành công nghệ.Nhiều công ty xây dựng và vận hành các tác nhân AI nhận thấy rằng GPU truyền thống quá đắt và không phải là lựa chọn tốt nhất để chạy các mô hình trong thực tế.

Các chuyển động của OpenAI làm nổi bật xu hướng này.**Ngoài việc cam kết mua các hệ thống mới của Nvidia để cải thiện các công cụ Codex đang phát triển nhanh chóng của mình, OpenAI cũng đã đạt được quan hệ đối tác điện toán trị giá hàng tỷ đô la với công ty khởi nghiệp Cerebras vào tháng trước.**Theo Giám đốc điều hành Cerebras Andrew Feldman, các chip tập trung vào suy luận của họ vượt qua GPU của Nvidia về tốc độ. Ngoài ra, OpenAI đã ký một thỏa thuận lớn để sử dụng chip Amazon Trainium.

**Không chỉ các công ty khởi nghiệp, mà các nhà cung cấp dịch vụ đám mây lớn cũng đang đẩy nhanh tốc độ của chip tự phát triển.**Anthropic Claude Code, được nhiều người coi là công ty dẫn đầu thị trường về mã hóa tự động, hiện chủ yếu dựa vào chip được thiết kế bởi Amazon AWS và Google Cloud của Alphabet, thay vì các sản phẩm của Nvidia. Đối mặt với sự bao vây và đàn áp của các đối thủ cạnh tranh, Huang nhấn mạnh trong một cuộc phỏng vấn với wccftech rằng Nvidia đang chuyển đổi từ một nhà cung cấp chip đơn giản thành một nhà xây dựng hệ sinh thái AI hoàn chỉnh bao gồm chất bán dẫn, trung tâm dữ liệu, đám mây và ứng dụng. Đối với các nhà đầu tư, hội nghị GTC vào tháng tới sẽ là một nút quan trọng để kiểm tra xem liệu Nvidia có thể tiếp tục huyền thoại 90% thị phần của mình trong thời đại lý luận hay không.

Cảnh báo rủi ro và tuyên bố từ chối trách nhiệm

        Thị trường có nhiều rủi ro và đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân và không tính đến các mục tiêu đầu tư cụ thể, tình hình tài chính hoặc nhu cầu của người dùng cá nhân. Người dùng nên xem xét liệu có bất kỳ ý kiến, ý kiến hoặc kết luận nào trong bài viết này phù hợp với hoàn cảnh cụ thể của họ hay không. Đầu tư phù hợp với rủi ro của riêng bạn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.38KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.38KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Ghim