TheSmartApe🔥

vip
幣齡 2.8 年
最高等級 0
用戶暫無簡介
每個人都在談論 @karpathy autoresearch,但你們大多數人根本不知道它實際做了什麼。
有一個訓練腳本 (train(dot)py),用來訓練一個小型語言模型,基本上就是一個嬰兒GPT。而有一個指令文件 (program(dot)md),用來告訴AI代理該做什麼。
你按下開始。代理會調整訓練腳本,訓練5分鐘,檢查分數。更好?保持。更差?還原。重複100次,整夜讓你睡覺。
就這麼簡單。
它實際在優化的是:模型架構。不是預測。不是交易。也不是你的投資組合。
像這樣的問題:
→ 4層還是8層?
→ 最佳學習率?
→ AdamW還是Muon優化器?
→ 哪個批次大小在這台特定GPU上效果最好?
最佳架構取決於你的硬體。H100需要完全不同的模型,跟你的MacBook不一樣。autoresearch會自動找到最適合你機器的配置。
你可以用它做的事情:
> 建立一個寫程式的小型LLM,autoresearch找到最佳架構,你用你的資料集訓練
> 創建一個離線在手機上運行的輕量級聊天機器人
> 用你自己的寫作訓練一個模型,讓它聽起來像你
> 在一夜之內測試「RoPE是否比ALiBi更適合小模型?」100個變體,而不是花3週做博士研究
> 為樹莓派或邊緣設備優化模型
你不能做的事情:
> 預測股價
> 找交易優勢
> 分析試算表
> 預測體育比賽結果
autoresearch是一個
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
沒有人在科技界談論目前對AI投資最大的威脅。
這個威脅是水。
特別是波斯灣的海水淡化廠,以及伊朗摧毀它們的能力。
海灣國家依賴海水淡化水。
科威特:90%的飲用水來自海水淡化。
阿曼:86%。
沙特阿拉伯:70%。
數百座淡化廠沿著海灣沿岸建設。沒有它們,主要城市根本無法維持其人口。
一份2008年洩露的美國外交電報警告,如果朱拜爾海水淡化廠遭受嚴重破壞,利雅得“將在一週內被迫撤離”。
它們是生存基礎設施。
巴林指控伊朗襲擊其一座海水淡化廠。
伊朗的攻擊已經距離迪拜的Jebel Ali(世界最大之一的海水淡化廠)12英里。
伊朗自己則聲稱,美國首先襲擊了Qeshm島上的一座海水淡化廠。
伊朗無法匹敵美國/以色列的火力,但它可以威脅每個海灣國家的水資源供應。
現在有一個沒有人在連結的部分。
沙特阿拉伯、阿聯酋和卡塔爾在2025年僅在全球交易中就共同投資了$165 十億美元。全部都投向美國的科技和AI。
沙特的PIF成立了Humain,一家國家AI公司。阿聯酋擁有Stargate,這是世界上最大的數據中心項目之一。卡塔爾剛成立Qai,一家國家AI公司。這些國家正為OpenAI、微軟、谷歌的AI基礎設施提供資金。
對海灣國家來說,投資AI部分是為了美國的保護。
如果海灣國家成為美國與中國AI競賽中的關鍵夥伴,美國必須保證它們的安全。AI投資是一種保險。
現在,伊朗導彈正落在維持這些國家生
STG2.86%
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
最近我在使用Claude代幣的限制上,比以前更快地達到了上限。
相同的工作流程。相同的複雜度。我的端沒有任何變化。
所以我開始深入調查。結果發現解釋了很多事情。
@AnthropicAI 在Claude Code上一直在虧錢。
一個每月200美元的Claude Code訂閱,去年在計算成本上燒掉了約2,000美元。今天呢?同樣的$200 方案每月消耗的計算成本高達5,000美元。
這意味著每個用戶每月損失4,800美元。
但這是一個經典的策略,燒掉數十億美元來搶佔市場。補貼一切。讓產品看起來便宜。然後逐步收緊。
我們以前在@Uber看到過這種情況,搭乘費用曾經是5美元。DoorDash則提供免費送餐。
而且不僅僅是Anthropic,所有這些AI工具,像Claude Code、Cursor、Copilot、Codex,目前的定價都低於成本。每一個都是。整個市場都在補貼。
當補貼停止(,而它們一定會),會發生兩件事:
1. 價格大幅上漲
2. 功能被限制
或者兩者都會。很可能兩者都會。
這也是我覺得我的代幣限制感覺更緊的原因。
Anthropic 正在以一種安靜、逐步、"你可能不會注意到"的方式進行調整。每美元的計算用量更少。稍微更激進的速率限制。
我並不生氣。這是有商業邏輯的。你不可能永遠每個強用戶損失4,800美元。
但如果你在這些API之上構建,而我也是,你需要為一個AI計算成
查看原文
post-image
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
你不需要更好的AI設置,你需要更少的設置。
你們中的大多數花更多時間配置他們的代理堆棧,而不是實際構建,他們也因此想知道為什麼他們的代理會產生幻覺。
以下是在經過數月的生產使用後,真正有效的方法:
> 將研究與實現分開。
> 停止提出引導性問題。“找出一個錯誤”,它會為了取悅你而自己發明一個。改為讓它中立地分析邏輯。
> 代理知道如何開始任務,但不知道如何結束。給它一個契約:這些測試通過,這個截圖匹配,否則你還沒完成。
> 你今天安裝的每個有用的工具,六個月內都會成為Claude/Codex的原生功能。技能、記憶體、子代理,全部一開始都是插件,最後都被吸收了。
> 這個循環是:從基本開始。當某些事情讓你困擾時加入規則。性能下降時清理。重複這個過程。
只需閱讀更新日誌並反覆迭代即可。
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
大多數 AI 工具幫助你與 AI 交流,很少幫助你部署 AI。
本週嘗試了許多 AI 工具,並且很喜歡使用 @CreaoAI。
它是一種執行系統,你可以提示它,也可以直接構建基礎設施。
核心是超級代理,每次對話都可以轉變成一個永久的代理應用。
使用 ChatGPT 或 Claude:
你提問 → 你得到輸出 → 會話結束 → 上下文消失。
使用 CREAO:
你提問 → 它建立一個代理應用 → 它永遠運行。
代理應用是可執行且持久的。如果你願意,可以讓它一直開著。這意味著你不必每次都重新解釋或複製粘貼提示。我認為這些代理應用可以有許多有趣的用例。
但與其他工具相比,真正的附加價值在於它的 STUPIDLY 簡單。
1/ 聊天:用自然語言描述你想要的內容。
2/ 創建:超級代理根據你的邏輯構建代理應用。
3/ 自動化:手動運行、定時運行或在雲端 24/7 運行。
就這樣。
在我看來,這是它勝過 OpenClaw 的地方。OpenClaw 功能非常強大,但對 95% 以上的用戶來說過於複雜。
使用 Creao,你可以在 5 分鐘內開始,也可以根據需要構建複雜的多代理系統。
技術上令人感興趣的地方:
1/ 記憶系統:
大多數 AI 的主要問題是記憶。Creao 學習你的模式,存儲所有邏輯,並真正接續你未完成的工作。
記憶是 Creao 的基礎。
2/ 代理應用
這是以下兩者的區別:
“A
BTC3.35%
查看原文
post-image
post-image
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
如何在週末建立一個AI代理,每月賺取$2K
97%的消費者在選擇本地商家前會閱讀線上評論,但87%的商家從不回應負面評論。
在Google上提升一顆星,營收可增加5-9%。對於年營收$500K的餐廳來說,這意味著損失$25-45K的營收。
這是一個巨大的差距,而你可以用一個簡單的AI代理來填補它。
代理流程如下:
1/ 監控Google商家資料,取得新評論(每15分鐘輪詢)
2/ 對於正面評論(4-5顆星):生成個性化的感謝回覆並自動發布
3/ 對於負面評論(1-3顆星):生成草稿回覆,經由Slack/電子郵件送給店家審核,審核後再發布
4/ 將所有內容記錄到Google試算表,並標記情感
5/ 發送每週摘要:新評論、平均評分趨勢、回應時間、情感分析
魔法在於提示工程 -> 回覆內容不會像機器人,會引用評論中的具體細節,符合商家的語調,並以同理心處理投訴。
技術堆疊(總成本:約$30/月)
> n8n(自行托管) -> 工作流程自動化(免費)
> Google商家資料API -> 免費,提供n8n原生節點
> OpenAI API(gpt-4o-mini) -> 大多數用量約$5/月
> Google試算表 -> 記錄與儀表板,免費
> Slack或電子郵件 -> 通知,免費
> VPS -> $5-10/月(Hetzner或Railway托管n8n)
每個客戶的運營成本低於$15
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
AI 與戰爭部門 — 全面解析
在2025年7月,五角大廈向 Anthropic、OpenAI、Google DeepMind 和 xAI 分別授予最高$200M 的資金,用於原型前沿人工智慧,以保障國家安全。
五角大廈要求對 Claude 進行全面、無限制的存取,適用於所有合法用途。Anthropic 拒絕解除兩項特定限制:
1. 不得對美國公民進行國內大規模監控
2. 不得讓完全自主的武器 (AI 在沒有人工介入的情況下決定殺戮)
時間線
> 星期二 — 國防部長 Pete Hegseth 在五角大廈會見 Dario Amodei。給他直到星期五東部時間下午5:01簽署授予全面無限制存取的文件。最後通牒。
> 星期四 — Amodei 公開拒絕。
> 星期五下午5:00 — 截止日期過去。Anthropic 不讓步。
> 星期五 — 特朗普在 Truth Social 發帖,命令所有聯邦機構立即停止使用 Anthropic,為期6個月的逐步退出。
> 星期五 — Hegseth 將 Anthropic 指定為「對國家安全的供應鏈風險」。被列入黑名單,禁止參與所有軍事合同。與軍方有業務往來的承包商不得與 Anthropic 合作。
> 幾小時後 — Sam Altman 宣布 OpenAI 已與戰爭部門達成協議,將在機密網絡上部署。獲得合同。
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
你的AI代理現在可以在Solana上進行交易。方法如下。
@dflow剛剛推出了兩個改變一切的功能:
> 通用MCP伺服器:讓你的代理直接訪問Solana交易基礎設施
> 一個Claude Code技能(與Phantom):代理可以從單一提示構建完整的Solana應用
使用方法:
> 安裝DFlow MCP伺服器 → 將其添加到你的Claude配置或OpenClaw MCP配置中
> 設置Phantom連接 → 瀏覽器錢包、嵌入式錢包或移動深層鏈接
> 指定你的代理任務 → “幫我建立一個SOL/USDC交換界面”
> 部署 → 產生可用於生產的代碼
這很有趣,因為他們不是在構建一個AI代理,而是在建立讓任何代理都能交易的基礎設施。就像我們使用Polymarket的CLOB API來為我們的機器人提供服務一樣。
技能的方法也很聰明。它不僅僅是一個API,而是給代理提供了如何用它的上下文,讓代理理解整個流程。
SOL3.79%
USDC-0.01%
查看原文
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
Anthropic 開源了驅動 Claude 文件功能的技能,共16個技能。大多是範例,但其中4個,PDF、DOCX、PPTX、XLSX,是真正運行在 Claude 的「創建文件」功能背後的生產代碼。目前值得安裝的3個:→ MCP Builder。構建 Model Context Protocol 伺服器的逐步指南。API 研究、工具命名、認證模式、錯誤處理。→ Webapp Testing。基於 Playwright 的工具包,帶有決策樹。伺服器生命週期管理器。截圖、日誌等一應俱全。→ Skill Creator。用於構建技能的技能。草稿、測試、基準、優化觸發。如果你在自己開發,從這裡開始。它們不僅限於 Claude。這是一個開放標準:OpenClaw、Cursor、GitHub Copilot,以及你可以部署在任何代理上的相同 SKILL 格式。架構也很智能。代理只會將技能名稱和描述加載到上下文中。完整指令只在需要時加載。鏈接的文件只在極端情況下加載。你不會在未使用的技能上浪費代幣。如何安裝 (2分鐘):Claude 代碼:> /plugin install document-skills@anthropic-agent-skills OpenClaw:> git clone anthropics/skills → ~/.openclaw/skills/ > symlink 你
查看原文
post-image
  • 讚賞
  • 1
  • 轉發
  • 分享
cryptos talker vip:
2026 GOGOGO 👊
專業提示:如果您的OpenClaw代理突然停止,原因可能是由於不良操作或自殺…
請前往托管它的地方 (VPS或Mac Mini),並運行:
> openclaw gateway start
如果這不起作用,請先運行:
> openclaw gateway install
然後:
> openclaw gateway start
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享
我們最近看到一宗價值1.78百萬美元的漏洞事件,原因是一個由Claude Opus 4.6撰寫的漏洞。
cbETH的價格為$1 ,而非$2,000。
不久前,@OpenAI推出了EVMbench。簡單來說,它是一個評估AI代理與智能合約互動能力的基準測試。
它有三個主要評估模式:
> 檢測:分析代理檢測漏洞的能力
> 修補:分析代理修復漏洞的能力
> 利用:分析代理利用漏洞的能力
他們的分析顯示,近期的模型(Opus 4.6、GPT-5.3-Codex等)在利用漏洞方面表現非常出色,但在檢測和修補方面較為薄弱。
這正是我在用最新模型運行自己的代理時所觀察到的。在我的代理團隊中,我總是包含一個審核代理,能獲取完整上下文,主要目標是找出漏洞。
當它找到漏洞時,開發代理就能輕鬆修復。
但問題是,在10個漏洞中,它可能只找到3個。目前,我們還不能完全依賴代理來正確檢測漏洞。
推出這個基準測試是一個非常強力的舉措。我很期待用我的代理來測試它。
為了澄清,這不是一個安全掃描器或一個可用於生產的審計工具。它主要是用來衡量AI的能力、比較模型,並提供AI在這個領域的進展指標。
基本上,這是一個讓AI在這個領域被評估和改進的工具,說實話,我們真的很需要這個。
查看原文
post-image
post-image
post-image
post-image
  • 讚賞
  • 留言
  • 轉發
  • 分享
我建立了一個理論概率模型,用來估算 @Polymarket 上 BTC 15 分鐘市場的漲跌概率。
該模型僅使用目標價格、當前 BTC 價格以及距離回合結束的剩餘時間來計算概率。
我原本沒想到這個理論模型能如此接近實際市場概率。市場價格與模型概率之間的差距只有 1–5%,這意味著該模型與現實的吻合度非常高。
在這個市場中,概率是由交易者直接設定的。
這清楚地顯示出它是多麼由機器人主導,受到邏輯規則和算法的驅動。
如果市場主要由人類交易,實際概率不會與理論模型如此緊密地對齊。
BTC3.35%
查看原文
  • 讚賞
  • 留言
  • 轉發
  • 分享