前幾天買了Kimi Cli的年費會員,測了下常用場景的體感如下:1️⃣ 幫我安裝軟體,在Mac安裝,網易雲音樂這種軟體,能夠完整的下載DMG到執行安裝。完成度: 🌟🌟🌟2️⃣ 幫我整理Gmail郵件,這個案例中,由於我的郵件太多30000多,Kimi經常需要我中間確認是否繼續整理,而我已經跟他說了可以繼續,不要找我確認,這個說明長周期任務由於Token消耗或者RL引導的問題,這種長周期的固定任務,表現得有一些差強人意。完成度: 🌟3️⃣ 幫我找適合的工作,我給了他一份自己的簡歷,讓Kimi幫我在全網找適合的工作,這個推薦的非常不錯,但缺點是沒有具體的崗位信息,最多只到公司,然後崗位方差較大,牛逼的有World Labs,差的也有不知名的東歐公司,這裡面可能Tool use的能力有限限制了模型能力,作為方向性指引非常好,但是作為真正有引導性的話還不行。完成度: 🌟🌟4️⃣ 幫我做旅行行程規劃,在目的不明確的任務場景裡,我讓他在未來5天幫我根據情況在英國看球,老家休息和日本旅遊中給出建議,這塊的體驗其實不太如豆包,給的建議泛泛,且沒有追問我的過程。相比Claude Code在這種多目標模糊優化任務定義的情況下會不斷的多次給出3個選項收斂目的,Kimi Cli這點可以加強一下。完成度: 🌟🌟整體來看,我認為Kimi Cli是一個能力很強的打工人,給了工作任勞任怨,但是在固定任務下總是找我確認,在非固定任務卻又自由發揮,這點讓我有點迷,我認為@Kimi_Moonshot 急需Agentic RL的人來優化體驗。除此以外其他日常的部分很讓我驚喜,總結PDF,本地寫腳本,處理處理日程安排,這讓我覺得年費會員沒白買。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言