OpenClaw開發團隊每月營運成本高達1018萬港元,而且這筆開銷幾乎全部來自AI模型的API費用。當外界還在討論AI創業如何降低成本,這組數字直接揭露了一個殘酷現實:高品質的AI Agent產品,背後需要的算力與模型成本遠超多數人的想像。更值得追問的是,為什麼OpenAI願意承擔這筆帳單? 這次流出的成本結構其實相當單純。OpenClaw作為一款以程式碼生成與自動化開發為核心的AI Agent工具,每一次用戶請求背後都涉及到大量模型推論。從理解自然語言指令、規劃執行步驟、生成程式碼片段到最終輸出完成,整個過程可能需要數十次甚至上百次的API調用。不像一般聊天機器人只做一次問答,Agent類產品消耗的Token數是幾何級數增長,這直接推高了營運成本。 1018萬港元這個數字之所以震撼,在於它讓圈外人看清楚一件關鍵的事:AI Agent本身的商業模式極度依賴底層模型的定價與補貼策略。如果你的產品每一次執行都要燒掉一定金額的API費用,那你的用戶定價策略就不是「競爭者訂多少我就訂多少」,而是「我能承受多少虧損」。OpenClaw在初期選擇不直接向用戶收取高額費用,顯然背後有更深的算盤。 真正值得關注的是OpenAI全額買單這件事。外界第一反應通常認為這是投資者支持自家生態系的做法,但從另一個角度看,這其實是OpenAI在收集極端情境下的應用數據。OpenClaw這樣的高強度使用者,每天產生大量長上下文、多輪複雜指令的真實用例,對OpenAI來說是最寶貴的模型優化素材。與其花錢請團隊寫測試用例,不如直接補貼一個真正在極限使用產品的開發者,實戰數據遠比實驗室數據有價值。 這種補貼模式其實不是先例。早期的雲端服務商、電商平台、甚至外送平台都用過類似手法——先燒錢讓頭部用戶把服務用熟、用透,從中提煉出產品改進方向,同時製造市場聲量。OpenClaw成為那個被選中的案例,既是因為它的使用場景夠極端,也是因為它在開發者社群裡的影響力夠大。 對一般開發者或AI產品創業者來說,這篇文章最該帶走的一個觀點是:不要看到別人燒錢補貼就跟著學。大多數團隊沒有這種談判籌碼。你們更應該關心的是——在不依賴補貼的情況下,你的產品能不能算出一個合理的邊際成本。如果每一次用戶操作的成本遠高於你能收取的費用,那補貼停的那一天,就是產品結束的那一天。 OpenClaw這次的核心啟示不在於1018萬港元有多貴,而在於它揭開了AI Agent真實營運成本的冰山一角。當所有人都專注在功能有多強、體驗有多順的時候,很少人意識到背後每一秒都在燒錢。這種成本結構會決定產品最終能長多大,也會決定哪些團隊能夠活到獲利的那天。 對OpenAI來說,這筆錢花得值。它拿到的是下一代模型進化的關鍵數據。對OpenClaw來說,這是一次風險極高的成長賭注。而對我們這些旁觀者來說,真正該理解的是:AI產品的最終護城河,永遠不在於功能多酷,而在於你有沒有能力把成本壓到一般人付得起的範圍。
OpenAI正在為ChatGPT免費版鋪設廣告系統,核心轉折在於:免費用戶的對話內容將被用於個人化廣告投放。這代表ChatGPT不再只是「附加廣告版位」的AI助手,而是正式成為以用戶對話數據為燃料的廣告平台。最值得留意的是這項改變如何重新劃分了免費與付費用戶之間的隱私邊界——前者成為數據貢獻者,後者才得以保留對話的封閉性。這表面上是多一個營收來源,本質卻是OpenAI對用戶信任底線的測試。 免費與付費的界線,從功能差異變成隱私等級 過去ChatGPT的免費與付費差異主要在功能:GPT-4o的使用次數、進階語音模式、檔案上傳上限。現在多了第三條軸線:數據是否被用於廣告個人化。付費用戶維持不將對話用於廣告定位的承諾,免費用戶則成為廣告系統的數據來源。 這種分層策略在科技業並不新鮮,但對一個以「對話」為核心產品的AI來說,這條界線特別敏感。因為人們在ChatGPT裡說的話,往往比在搜尋引擎輸入的關鍵字更私密、更長、更沒有防備。 具體情境是這樣的:一名免費用戶連續幾週詢問心理健康、職涯焦慮、親子教養等問題,這些對話軌跡足以描繪出精確的用戶輪廓。當這些數據被納入廣告定向系統,用戶在其他平台看到的廣告可能突然「過度貼心」——這種貼心正是來自他以為只在跟AI傾訴的內容。 廣告個人化的技術邏輯,比表面聲明更深入 OpenAI強調不會將原始對話「直接賣給」廣告主,而是透過主題提取、興趣標籤化、情境建模來建立用戶輪廓。聽起來安全,但技術上的緩衝並不等同於體驗上的隔離。系統不需要知道你昨晚十一點打了什麼字,只需要知道你近三十天反覆詢問「失眠怎麼辦」「褪黑激素劑量」「工作壓力大」,就能把你精準歸類為「高壓力上班族/睡眠保健受眾」。 這裡最容易被誤判的風險是:用戶以為「我沒有提供敏感資料」,卻忽略對話本身就是最豐富的行為數據。人們在ChatGPT的提問方式——追問的深度、修正的方向、滿意與否的回饋——比傳統瀏覽紀錄更能預測消費意圖。 當AI比你更清楚你接下來可能需要什麼商品,不是因為它聰明,是因為你把自己訓練成了它的數據集。 數據慣性:比單次對話更難察覺的風險 多數人的焦點會放在「會不會看到更多廣告」,但影響最深遠的並非廣告本身,而是長期的數據累積與行為塑形。當ChatGPT免費版的商業模式變成「用對話養廣告」,平台在產品設計上可能會出現微妙的傾斜:讓免費用戶維持更長的對話、鼓勵更多追問、甚至在不經意間強化某些話題的互動深度。 這不是陰謀論,而是廣告驅動平台的常見軌跡——當用戶行為數據成為收入來源,產品最佳化的目標就會從「幫助用戶解決問題」悄悄轉向「幫助系統更理解用戶」。 另一個具體情境:一位學生用免費版ChatGPT寫作業,隨著時間累積,系統不只知道他的學科興趣,還能推論他的消費水平(透過詢問的商品類型)、生活節奏(提問時間分佈)、甚至即將到來的支出(畢業、考試、留學準備)。這些數據沉澱後,會在他瀏覽其他網站時,透過廣告聯播網精準觸及。 哪些人現在就要重新評估使用方式? 如果你屬於以下幾類,這項改變與你直接相關。 仍在使用免費版的專業人士:律師、醫療人員、老師、心理諮商相關工作者。你以為「只是問問看」的專業問題,可能正在建立你的職業與個人興趣圖譜。 把ChatGPT當日記或情緒出口的用戶:這類對話的數據價值極高,因為情緒狀態與消費決策高度相關。不要假設AI會「忘記」,系統只會歸檔。 在免費版中處理商業機密的小企業主:你可能為了省二十美元月費,讓公司的產品定位、客訴內容、行銷策略成為廣告演算法的養分。 檢查路徑很簡單:進入設定中的「資料控制」,確認是否關閉了與模型改進相關的數據分享選項,並理解這些選項在新的廣告架構下是否仍然提供足夠的隔離。如果無法確定,將敏感對話轉移到付費版或其他不倚靠廣告變現的服務,會是更穩健的選擇。 OpenAI此舉不令人意外——燒錢訓練模型之後,總要找到獲利出口。但令人在意的是,它選擇了用「用戶最信任的對話介面」來交換廣告收入。對免費用戶來說,這個交換的代價不是螢幕上多一個廣告版位,而是從此之後,每一次傾訴、每一次腦力激盪、每一次深夜的疑問,都可能被轉譯成一個標籤,貼在你的數位身分上。如果你還沒為此調整使用習慣,現在就是分界點。
Google DeepMind 的 Gemini Omni Prompt Guide 顯示,AI 影片生成已不只是描述畫面,而是要用導演式提示詞控制鏡頭、風格、燈光、動作、文字、參考素材與修改流程。本文用教學方式拆解 Gemini Omni Prompt 的核心寫法。
OpenAI 近期宣稱,其內部與平台上已有高達八成的程式碼由 AI 生成。這個數字一出,立刻成為科技圈熱議焦點。但在一片「AI 即將取代工程師」的驚呼聲中,多位專家選擇踩下煞車——他們質疑的不是 AI 寫程式的能力,而是這個「八成」到底怎麼來的。 這篇文章的核心判斷很直接:問題不在於 AI 能不能輔助開發,而在於「AI 生成」這個詞在行銷話術裡,已經被無限上綱到近乎失真。 專家質疑什麼:是「補全三行」還是「寫完整支程式」? 很多人聽到「八成程式碼 AI 生成」,腦中浮現的畫面是 AI 獨立完成整個專案、工程師只在旁邊喝咖啡。但實際情況遠非如此。 想像一個普通的工作場景:一位工程師正在寫新功能,他先花了兩小時設計資料庫架構、規劃 API 邊界、處理非同步邏輯的競態條件。接著打開編輯器,Copilot 跳出來幫他補全了 import 語句、產生幾個 getter...
如果你最近打開 ChatGPT,可能會發現一件奇怪的事:那個讓你手動切換 GPT-5.5 或 GPT-Instant 的下拉選單,消失了。不是 bug,也不是你的帳號有問題,而是 OpenAI 真的把這個選擇權收回去了。 從現在開始,系統會根據你輸入的任務,自動判斷要使用哪個模型,如果遇到複雜任務,還會自動轉入 Thinking 模式。這項更新官方講得不算高調,但影響其實非常大。它直接改變了用戶與 ChatGPT 的互動方式——從「我來決定用哪個引擎」變成「AI 幫我決定用哪個引擎」。 這篇文章不會跟你談什麼 AGI 大方向,也不會聊企業如何導入 AI 治理。我們只聚焦一件事:這個自動切換機制到底改了什麼?對你日常使用 ChatGPT 有什麼實際影響?以及,這件事本質上到底是進步,還是另一種不透明的黑箱操作? 最大的改變:告別模型選擇器 過去用...
OpenAI 前技術長 Mira Murati 在離開一段時間後,近日帶著一個相當大膽的宣告回歸:下一代 AI 不再需要對話框。消息一出,許多人第一個反應是「那以後要怎麼用 AI?」這個問題本身就點出了重點——我們對 AI 的想像,仍然停留在「你問一句,它答一句」的框架裡。而這次的宣布,正是要打破這個框架。 對話框不是 AI 的本質,只是過渡工具 過去兩年,從 ChatGPT 到 Claude,對話框幾乎成了 AI 產品的標準介面。用戶打開一個白色輸入框,打一句話,AI 回一段文字。這很直覺,也很成功,但同時也限制了 AI 的應用方式。Mira 這次的核心論點很簡單:AI 不該只在你開口問的時候才做事,它應該在背景中持續理解你的工作、預測你的需求,甚至在你還沒意識到的時候,就把事情處理好。...
OpenAI Codex 不只是用來寫 Code。今次影片實測如何用一個 Prompt,配合 Project Files、Markdown Rules、Skills 和 Automation,生成 Email、Excel、PPT、網站,甚至讓 AI 接手整個工作流程。
ChatGPT 近期針對引用聊天歷史功能推出了一項重要改進,核心在於更可靠地從過往對話中提取細節。對多數長期使用者來說,這最值得先留意的是:AI 不再只是「大概記得」你上週提過的事,而是能在後續對話中準確召喚具體的數字、名稱與偏好。這次的改進不是介面調整,而是記憶機制底層的可靠性升級,直接影響你能否真正把 ChatGPT 當成一個長期協作夥伴。 以前的痛點:上下文斷裂與細節丟失 過去使用 ChatGPT 處理長期專案時,最常遇到的挫折是「上下文斷裂」。你可能在三天前詳細描述過品牌色碼、客戶名稱或程式架構,但開啟新對話後,AI 要麼完全遺漏,要麼給出近似但錯誤的版本。這種「善忘」迫使許多人不得不反覆複製貼上背景資料,甚至養成「每次開新對話都要先貼一千字前言」的習慣。 這次改進後,系統在引用歷史對話時,對細節的抓取明顯更精準。重點不在於它能記得更久,而是它終於開始區分「哪些資訊是後續對話的關鍵線索」,並在主動召喚時降低幻覺機率。長期使用 AI 的最大痛點從來不是它不懂,而是它記錯。 這次更新最值得注意的三個改進 第一,跨對話的意圖連貫性提升。以前 AI 容易把不同專案的細節搞混,現在在追問「照上次那個方案調整」時,它更能鎖定正確的對話脈絡,而不是隨機挑選一個相似關鍵字就胡亂拼接。 第二,主動喚起機制更聰明。當你輸入的問題與過往對話高度相關時,ChatGPT 會更積極地提示「你之前在討論 X 時提到 Y」,讓你可以一鍵接續,不用自己翻找聊天記錄。這減少了大量機械式的複製貼上動作。 第三,細節準確度改善最明顯。數字、日期、專有名詞這類容易被「柔和化」或「近似化」的資訊,現在在引用時的保真度高了不少。對需要精確資訊的工作者來說,這是實用價值最高的部分。以前 ChatGPT...
OpenAI 最近在美國 Pro 用戶中推出了 ChatGPT 個人理財功能的預覽版。簡單來說,你可以直接把銀行、信用卡或券商的帳戶連結到 ChatGPT,然後用自然語言問它「我上個月花最多在哪裡?」或「我的投資組合最近表現如何?」它就會像一個理財顧問一樣,給出分析、圖表甚至建議。這不是什麼第三方外掛,而是 ChatGPT 內建的新能力。 我認為這一步比很多人想像中更重要。之前 ChatGPT 多半是生產力工具或知識助手,但這次它直接碰觸到個人財務這個極度敏感且實用的領域。如果做得好,它會徹底改變一般人管理錢的方式:從「打開 APP 看報表」變成「開口問一句話」這麼直覺。 直接連接帳戶,分析支出與投資 這個功能的核心在於帳戶連結。用戶授權後,ChatGPT 可以透過 Plaid 等服務讀取交易記錄(唯讀權限),然後自動分類、統計。你不必手動匯出 CSV 或貼上明細,一切都在對話框裡完成。 支出分析:你可以問「我這個月餐飲花多少?」ChatGPT 會即時計算並顯示圓餅圖。它甚至能比較不同月份的變化,或提醒你某類開支超標。 投資組合檢視:連結券商帳戶後,你可以問「我的持股比例是否偏離目標?」它會列出各資產類別佔比,並根據你的風險偏好給出再平衡建議。...
Anthropic 最近做了一件事,值得每一個靠 AI 做事的人留意:他們開發出一種自然語言自編碼器,能夠把 Claude 的內部活動——也就是模型在想什麼、注意什麼——直接轉換成人類可讀的文字。 這不是那種「我們更透明了」的公關說法。這是第一次,我們有機會在模型回答之前,實際看到它的運作邏輯被「翻譯」出來。 這件事真正重要的地方,不是技術細節,而是它讓 AI 從一個「你只能相信輸出」的黑箱,開始往「你可以檢查過程」的方向移動。 它不是新的模型,而是一種新的觀察方式 首先要搞清楚一件事:Anthropic 這次不是推出 Claude 5 或什麼更強的模型。他們推出的是一種工具——或者說,一種方法——去拆解 Claude 內部運作。 傳統上,大型語言模型的神經網路對外行人來說是一團迷霧。你知道輸入什麼、得到什麼輸出,但中間發生的事沒人知道。研究人員過去用各種間接方法推測,但從未真正「讀到」模型內部的想法。 自然語言自編碼器改變了這件事。它把 Claude 內部那些高維度、抽象的神經活動,映射回自然語言。想像一下,你原本只能看到一堆亂碼,現在突然能看到「這一層正在確認使用者提到的日期是否與上下文一致」或者「這個注意力頭正在檢查來源的可信度」。 這不是魔法,但它確實是突破。 對一般使用者來說,這代表訊號,不是功能...
Higgsfield 最近推出了一個名為 Supercomputer 的 AI 代理,專為創意製作而設計。它不是又一個生成圖像或影片的模型,而是一個能夠從你的創作行為中自主學習、持續優化輸出的代理系統。最值得留意的是它的「自學」機制:你不需要反覆調整 prompt,它會觀察你的修改習慣、風格偏好,然後在下一次生成時自動套用。這篇文章要說的是:當 AI 開始學會你的審美,創意工具的本質正在從「指令執行」轉向「協作進化」。 自學機制:不是 prompt 工程,而是行為學習 多數 AI 生成工具依賴用戶精準描述需求,但 Higgsfield Supercomputer 的做法完全不同。它會記錄你每一次的編輯行為——你調整了哪些參數、保留了哪些生成結果、刪除了哪些失敗輸出。這些數據會被整合成一個內部風格模型,隨著使用次數增加,模型會愈來愈貼近你的個人美學。 舉例來說,如果你習慣在生成人物肖像時將膚色調暖、背景模糊,Higgsfield 會在幾次互動後自動將這些偏好納入預設參數。你不需要在每次新專案中重複設定,它已經學會了。 更重要的是,它具備自我評估能力。每次生成後,代理會比對輸出與你過去偏好的相似度,如果偏離太多,它會自動調整生成策略,而不是等你手動修正。這意味著你花在「試錯」上的時間會大幅減少。 兩個真實場景:動畫師與行銷團隊 第一個場景是獨立動畫師。假設你正在製作一部短片,主角是一個特定風格的機器人。傳統 workflow...
Google 新一代 AI 模型 Gemini 3.5 傳出提前曝光,其中最引人注目的不是模型本身,而是搭載的全時 AI Agent——「Spark」。不同於過往我們熟悉的語音助理必須由用戶主動喚醒,Spark 被設計為「永遠在線」的自主代理,能夠全天候代管電郵、排程任務,甚至直接替你完成線上購買。這不僅是一次功能升級,更可能從根本上改變我們對 AI 助理的想像。 Spark 到底新在哪裡? 傳統的 AI 助理(如 Siri、Google Assistant)本質上是「被動反應型」——你下指令,它才動作。Spark 則不同,它被賦予了「持續背景運作」的權限,可以自主掃描你的電郵、行事曆、瀏覽紀錄,並根據你的習慣與當下情境做出判斷。 例如:你早上進會議室前收到銀行的繳費提醒,過去你得自己記住或立刻處理。有了 Spark,它會自動比對你的帳戶餘額與繳費期限,直接在背景幫你轉帳完成,並在會議結束後用一則摘要通知你。 更值得留意的是 Spark...