OpenAI Truy Vết Vấn Đề “Goblin” Tới Tín Hiệu Phần Thưởng Nhân Cách “Nerdy”, Các Nhắc Đến “Goblin” Tăng 175% Trong GPT-5.1

Theo OpenAI, công ty đã xác định nguyên nhân gốc rễ của “vấn đề goblin” đã ảnh hưởng đến các mô hình GPT từ GPT-5.1 trở đi. Tín hiệu phần thưởng được dùng để củng cố đặc điểm tính cách “Nerdy” đã khuyến khích các đầu ra có nhắc đến các sinh vật thuộc thế giới giả tưởng, trong đó 76,2% tập dữ liệu huấn luyện thể hiện sự thiên lệch này. Tính cách Nerdy chỉ chiếm 2,5% phản hồi của ChatGPT nhưng lại đóng góp 66,7% các lần nhắc tới “goblin”, và số lần xuất hiện đã tăng vọt 3.881% từ GPT-5.2 lên GPT-5.4.

OpenAI đã loại bỏ tính cách Nerdy vào tháng 3, loại bỏ tín hiệu phần thưởng gây thiên lệch và lọc dữ liệu huấn luyện. Công ty cũng bổ sung các chỉ dẫn ức chế vào prompt dành cho nhà phát triển của GPT-5.5 trong Codex. Cuộc điều tra đã dẫn đến việc phát triển các công cụ kiểm toán hành vi mới cho mô hình.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenAI cho GPT-5.5-Cyber: Đấu tay đôi với Anthropic Mythos

OpenAI công bố ra mắt GPT-5.5-Cyber, được thiết kế riêng cho an ninh mạng, sẽ được triển khai trong “vài ngày tới” theo cơ chế truy cập đáng tin cậy hợp tác với chính phủ dành cho các đơn vị phòng thủ then chốt, không bán đại trà. Điều này tương phản với lộ trình mở của Anthropic Mythos, trong khi Nhà Trắng phản đối việc mở rộng lên 70 công ty. Khung Chuẩn Bị (Preparedness Framework) đánh giá ở mức High (chưa tới mức critical), đồng thời tăng cường các biện pháp bảo vệ an ninh mạng. Tiếp theo sẽ theo dõi danh sách triển khai, khả năng CISA được đưa vào, và sự khác biệt giữa các tiêu chuẩn an ninh của hai bên.

ChainNewsAbmedia17phút trước

Doanh thu Q1 của Schneider Electric đạt 9,8 tỷ EUR, tăng 11,2% nhờ nhu cầu trung tâm dữ liệu do AI thúc đẩy

Theo Reuters, Schneider Electric công bố doanh thu quý 1 đạt 9,8 tỷ euro (11,4 tỷ USD) vào ngày 30/4, với tăng trưởng hữu cơ được nâng lên 11,2% nhờ nhu cầu từ các trung tâm dữ liệu chạy AI. Nhà cung cấp thiết bị điện và làm mát của Pháp cho biết kết quả này cao hơn nhẹ so với kỳ vọng đồng thuận và

GateNews24phút trước

Protum huy động vòng Seed 2 triệu USD cho nền tảng quản trị AI, hướng tới mốc đóng vòng vào tháng 6 năm 2026

Theo TechCrunch Startup Spotlight, Protum, một startup về quản trị bằng AI, đang huy động vòng seed trị giá 2 triệu USD nhằm hoàn tất vào tháng 6 năm 2026. Được sáng lập bởi Sandeep J., người có 25 năm kinh nghiệm về chuyển đổi doanh nghiệp, Protum cung cấp một nền tảng được thiết kế để giúp doanh nghiệp liên tục

GateNews54phút trước

Làn sóng sa thải nhân sự có thể dẫn đến tình trạng “mất cả đôi bên” giữa lao động và doanh nghiệp; nghiên cứu khuyến nghị: cần áp thuế tự động hóa bằng AI

Nghiên cứu chỉ ra ngoại tác do AI cắt giảm nhân sự: chi phí sa thải doanh nghiệp tự gánh chịu, nhưng phần suy giảm sức mua lại do toàn bộ thị trường chịu trách nhiệm; cắt càng nhiều thì nhu cầu càng co lại, đôi bên đều thua thiệt. Đề xuất áp thuế tự động hóa từ AI, nhằm nội bộ hóa chi phí bên ngoài, và dùng nguồn thu từ thuế để tài trợ đào tạo lại, khôi phục nhu cầu và ổn định kinh tế.

ChainNewsAbmedia58phút trước

Claude có thu “thuế ngôn ngữ” không? Nghiên cứu tiết lộ nội dung dịch tiếng Trung, Nhật, Hàn tiêu tốn Token nhiều nhất, cao gần gấp 3 lần

Nhà nghiên cứu Komatsuzaki trên X cho biết tokenizer của các LLM chủ đạo tồn tại “thuế ngôn ngữ” đối với các ngôn ngữ không phải tiếng Anh. Thử nghiệm với bài dịch theo 《The Bitter Lesson》, mức tăng số token của Claude lần lượt trên tiếng Hindi, tiếng Ả Rập, tiếng Nga và tiếng Trung khoảng 3,24×, 2,86×, 2,04× và 1,71×, rõ ràng cao hơn OpenAI. Các mô hình bản địa Trung Quốc thân thiện hơn với tiếng Trung, cho thấy dữ liệu huấn luyện thiên về tiếng Anh gây ra bất bình đẳng về chi phí, trở thành rào cản để phổ cập.

ChainNewsAbmedia1giờ trước

Kinh doanh AI của Microsoft tăng gấp đôi lên $370B ARR; dự kiến $190B Capex cho năm 2026

Vào ngày 29 tháng 4, Microsoft đã công bố kết quả tài chính quý 3 năm tài khóa 2026 cho giai đoạn kết thúc vào ngày 31 tháng 3, vượt kỳ vọng của thị trường. Doanh thu Q3 đạt 82,886 tỷ USD, tăng 18% so với cùng kỳ năm ngoái và cao hơn mức kỳ vọng 81,4 tỷ USD; lợi nhuận ròng theo GAAP tăng 23% lên 31,778 tỷ USD; lợi nhuận trên mỗi cổ phiếu pha loãng theo không-GAAP

GateNews1giờ trước
Bình luận
0/400
Không có bình luận