🔥 WCTC S8 全球交易賽正式開賽!
8,000,000 USDT 超級獎池解鎖開啟
🏆 團隊賽:上半場正式開啟,預報名階段 5,500+ 戰隊現已集結
交易量收益額雙重比拼,解鎖上半場 1,800,000 USDT 獎池
🏆 個人賽:現貨、合約、TradFi、ETF、閃兌、跟單齊上陣
全場交易量比拼,瓜分 2,000,000 USDT 獎池
🏆 王者 PK 賽:零門檻參與,實時匹配享受戰鬥快感
收益率即時 PK,瓜分 1,600,000 USDT 獎池
活動時間:2026 年 4 月 23 日 16:00:00 - 2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即參與:https://www.gate.com/competition/wctc-s8
#WCTCS8
我剛剛在語音識別領域發現了一些有趣的事情。Sierra 剛剛將多語言的 ASR 基準測試 μ-Bench 開源,這個基準針對一個真正的問題:現有的大多數基準都集中在英語,這嚴重限制了在實際客戶環境中系統的評估。
與 μ-Bench 相關的一個特別之處是,它提出了一種比傳統方法更細緻的評估方式。除了傳統的單詞錯誤率 (WER),他們引入了話語錯誤率 (UER),用來區分那些真正改變訊息意義的錯誤與不影響理解的錯誤。這是一個在評估實際品質方面的重要進步。
這個資料集包含 250 個真實的客服錄音,以及 4,270 個標註的音頻片段,涵蓋五種語言:英語、西班牙語、土耳其語、越南語和普通話。這已經比之前的資料更具代表性。
在性能方面,Google Chirp-3 明顯在準確率上佔優,而 Deepgram Nova-3 則以速度見長,但在多語言準確率方面仍有差距。看到不同供應商根據不同標準的定位,令人感興趣。
完整的基準測試和排名現已在 Hugging Face 上提供,這為供應商的參與打開了大門。這種開源的倡議真正推動了行業的進步,尤其是在多語言實際應用中的語音識別改進方面。