一直默认用 GitHub Copilot 來 review PR,畢竟 GitHub 會自動跑,而且看起來也不收費。



但最近幾次 review,讓我開始懷疑它到底“看懂”了什麼。

比如一個很基礎的問題:它依然會把 1.82.0 認為比 1.91.1 高,完全是早期大模型常見的版本號判斷錯誤。

如果說這是模型問題,那它還會認為 rust 1.91.1 尚未發布,這又暴露了 agent 的檢索和現實狀態判斷能力也不太行。

另一個更大的問題是:Copilot 的 review 明顯是按單文件來的。

查代碼風格、邊界條件還行,但缺乏全局視角。比如有個 PR 裡,agent 因為相對路徑算錯,把同一個文件 copy 了多份,實際上只有一份生效——這種問題它完全沒發現,甚至也不關心 PR 對應的原始 issue 在要求什麼。

在我看來,一個合格的 code reviewer agent,首先應該從全局判斷:

PR 是否滿足 issue、是否符合項目目標、文件佈局和架構選擇是否合理,最後才是語法和細節問題。

最近準備給 holon 加一個 reviewer 模式了。
大家現在真的在用 reviewer agent 嗎?一般用什麼?
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)