Model OpenAI Akan Secara Bertahap Bermigrasi ke Chip Trainium Kustom Amazon, Kata Altman Ia 'Menanti' Hal Itu

Pesan Berita Gate, 29 April — Model OpenAI yang berjalan di Amazon Web Services’ Bedrock akan secara bertahap bermigrasi ke Trainium, chip AI khusus rancangan Amazon, demikian menurut pernyataan terbaru dari CEO OpenAI Sam Altman dan jajaran eksekutif AWS. Saat ini, model beroperasi dalam lingkungan campuran menggunakan baik GPU dan Trainium, dengan porsi yang semakin besar bergeser ke Trainium seiring waktu. Altman menyatakan perusahaan “menanti untuk memindahkan model ke Trainium.”

Eksekutif AWS Garman mengakui bahwa nama Trainium mungkin menyesatkan, karena chip tersebut dirancang untuk pelatihan dan inferensi, dengan inferensi diperkirakan menjadi kasus penggunaan utama ke depan. Namun, Garman menekankan bahwa penjenamaan chip sebagian besar tidak relevan bagi kebanyakan pelanggan, dengan catatan bahwa pengguna berinteraksi dengan OpenAI melalui antarmuka API-nya, bukan secara langsung dengan perangkat keras yang mendasarinya. Saat ditanya tentang integrasi masa depan model non-OpenAI ke Bedrock Managed Agents, Garman menolak memberikan rincian, hanya menyatakan bahwa AWS saat ini berfokus pada kemitraannya dengan OpenAI.

Kolaborasi tersebut menegaskan strategi AWS untuk memanfaatkan silikon kustomnya guna mendukung beban kerja AI utama di platform cloud-nya.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Google menandatangani perjanjian AI rahasia dengan Pentagon, surat terbuka karyawan menentang

Menurut The Information pada 28 April, Google telah menandatangani perjanjian untuk menyediakan model kecerdasan buatan (AI) yang digunakan untuk pekerjaan rahasia kepada Pentagon AS. The New York Times mengutip sumber yang mengetahui hal tersebut, dengan mengatakan bahwa perjanjian itu memungkinkan Departemen Pertahanan AS untuk menggunakan AI milik Google untuk keperluan pemerintah yang sah, dengan sifat yang sama seperti perjanjian penerapan AI rahasia yang ditandatangani Pentagon bulan lalu dengan OpenAI dan xAI.

MarketWhisper2menit yang lalu

Laporan Riset a16z Crypto: Tingkat Eksploitasi Kerentanan DeFi untuk Agen AI mencapai 70%

Berdasarkan laporan penelitian yang diterbitkan oleh a16z Crypto pada 29 April, ketika agen AI dilengkapi dengan pengetahuan domain yang terstruktur, tingkat keberhasilan dalam mereplikasi kerentanan manipulasi harga Ethereum mencapai 70%; dalam lingkungan sandbox tanpa pengetahuan domain apa pun, tingkat keberhasilan hanya 10%. Laporan tersebut juga mencatat contoh di mana agen AI secara independen berhasil menghindari batasan sandbox untuk mengakses informasi transaksi masa depan, serta pola kegagalan sistematis ketika agen menyusun rencana serangan yang dapat menghasilkan keuntungan secara bertahap.

MarketWhisper25menit yang lalu

Altman: Penetapan Harga Berbasis Token Mulai Usang karena GPT-5.5 Mengalihkan Fokus ke Penyelesaian Tugas, Bukan Jumlah Token

Pesan Berita Gate, 29 April — CEO OpenAI Sam Altman mengatakan dalam sebuah wawancara dengan Ben Thompson di Stratechery bahwa penetapan harga berbasis token bukanlah model yang layak untuk jangka panjang bagi layanan AI. Menggunakan GPT-5.5 sebagai contoh, Altman mencatat bahwa meskipun harga per token jauh lebih tinggi daripada GPT-5.4, model tersebut

GateNews1jam yang lalu

Model Ling-2.6-flash Ant Group Dijadikan Sumber Terbuka: 104B Parameter dengan 7,4B Aktif, Mencapai Berbagai Tolok Ukur SOTA

Pesan Berita Gate, 29 April — Bobot model flash Ling-2.6 milik Ant Group kini telah menjadi sumber terbuka, yang sebelumnya hanya tersedia melalui API. Model ini memiliki total 104 miliar parameter dengan 7,4 miliar yang aktif per inferensi, jendela konteks 256K, dan lisensi MIT. Versi presisi BF16, FP8, dan INT4

GateNews1jam yang lalu

Sam Altman merilis tangkapan layar dua mode Codex, fungsi kantor dan pemrograman resmi dipisahkan

Eksekutif OpenAI Sam Altman, pada 29 April, memposting tangkapan layar dan pernyataan di platform X: Codex sedang meluncurkan versi baru antarmuka panduan. Saat pengguna masuk untuk pertama kali, mereka harus memilih dari dua mode, yaitu Excelmogging dan Codemaxxing. Pengguna aktif mingguan Codex saat ini telah melampaui 4 juta, dan skenario penggunaannya telah berkembang dari pembuatan kode hingga penggunaan non-teknis.

MarketWhisper1jam yang lalu

Codex OpenAI Meluncurkan Antarmuka Dual-Mode: Excelmogging untuk Pekerjaan Kantor, Codemaxxing untuk Pemrograman

Pesan Gate News, 29 April — CEO OpenAI Sam Altman mengumumkan antarmuka Codex yang didesain ulang di X hari ini, memperkenalkan dua mode berbeda untuk pengguna. "Excelmogging" menargetkan tugas kantor sehari-hari dengan antarmuka yang disederhanakan dan slogan "Same tools, simpler interface," menampilkan contoh tugas seperti membuat spreadsheet.

GateNews2jam yang lalu
Komentar
0/400
Tidak ada komentar