OpenAI 最近在美國 Pro 用戶中推出了 ChatGPT 個人理財功能的預覽版。簡單來說,你可以直接把銀行、信用卡或券商的帳戶連結到 ChatGPT,然後用自然語言問它「我上個月花最多在哪裡?」或「我的投資組合最近表現如何?」它就會像一個理財顧問一樣,給出分析、圖表甚至建議。這不是什麼第三方外掛,而是 ChatGPT 內建的新能力。 我認為這一步比很多人想像中更重要。之前 ChatGPT 多半是生產力工具或知識助手,但這次它直接碰觸到個人財務這個極度敏感且實用的領域。如果做得好,它會徹底改變一般人管理錢的方式:從「打開 APP 看報表」變成「開口問一句話」這麼直覺。 直接連接帳戶,分析支出與投資 這個功能的核心在於帳戶連結。用戶授權後,ChatGPT 可以透過 Plaid 等服務讀取交易記錄(唯讀權限),然後自動分類、統計。你不必手動匯出 CSV 或貼上明細,一切都在對話框裡完成。 支出分析:你可以問「我這個月餐飲花多少?」ChatGPT 會即時計算並顯示圓餅圖。它甚至能比較不同月份的變化,或提醒你某類開支超標。 投資組合檢視:連結券商帳戶後,你可以問「我的持股比例是否偏離目標?」它會列出各資產類別佔比,並根據你的風險偏好給出再平衡建議。...
OpenAI 正式將 Codex 編碼工具帶入 ChatGPT 手機應用程式,iOS 與 Android 用戶現在可以直接在手機上監控與管理遠端編碼任務。這不是一個簡單的通知推送功能,而是讓開發者可以在離開電腦的時候,仍然掌握開發現場的真實狀態。 如果你已經在用 Codex 桌面版處理複雜的編碼任務,應該很清楚一件事:很多任務不是幾分鐘就結束的。重構一個模組、跑測試、反覆調整前端畫面、等待 CI 跑完——這些事情一旦啟動,開發者往往得守在電腦前面。OpenAI 這次把手機端補上,就是要打破這個限制。 手機端到底多了什麼 這次更新最直接的功能是:你可以在手機上查看 Codex 正在進行的任務進度、接收任務完成的推播通知、以及查看任務過程中的關鍵輸出。換句話說,當 Codex 在遠端伺服器上幫你跑一條耗時的測試流程,你可以關上筆電去開會,手機震動時就知道結果出來了。 更重要的是,這個手機端不只是一塊「顯示面板」。它允許你對正在進行的任務做基本的干預動作,例如暫停任務、查看執行中的 log、或是重新發送指令。對於那些需要長時間背景執行的編碼工作,這個操作彈性比單純收通知實用太多。 另一個值得注意的細節是,手機端的...
OpenAI 的 Codex 從一個編輯器助手,逐步變成可以操作電腦、讀取檔案、執行命令列的開發工具。但很多人可能沒注意到,Codex 最近推出的 Chrome 擴充功能,才真正把它的能力拉到一個更貼近日常開發的場景。 這次更新的核心,不是又一個 AI 聊天小工具,而是讓 Codex 可以直接在你的瀏覽器裡工作。它能看到你正在開的分頁、操作你登入後的網站、測試你正在開發的前端頁面。對開發者來說,這項擴充功能解決了一個很實際的問題:那些需要手動打開瀏覽器、登入、點擊、查看結果的工作流程,終於可以交給 AI 接手了。 這次擴充功能最有感的幾件事 Codex for Chrome 不是「在瀏覽器裡開一個 Codex 對話框」這麼簡單。它有幾個真正改變工作方式的能力: 直接讀取目前分頁的內容。 當你讓 Codex...
OpenAI 正在加速開發它的第一款手機,而且這不是一台「裝了 ChatGPT 的手機」,而是一台從底層為 AI Agent 設計的裝置。這件事比多數人想的更有意思,因為它不是在挑戰 iPhone 或 Android 的硬體,而是在挑戰「手機應該怎樣運作」這件事。 什麼是 AI Agent 手機?跟現在的手機有什麼不同? 現在你用手機叫外送,流程是:解鎖、滑到 Uber Eats、點餐、確認付款。AI Agent 手機的概念是,你直接說「幫我訂上次那間牛肉麵,半小時後送到」,然後手機自己完成一切。 這不是語音助理的升級版。Siri 或 Google Assistant...
OpenAI 最近做了一個不算轟動但很實際的調整:把 GPT-5.5 Instant 設為 ChatGPT 的預設模型。如果你有在留意,過去一兩週打開 ChatGPT,回覆速度明顯變快,而且回答變得更「乾脆」。這不是錯覺,而是底層模型換了。 這篇文章不是要講 benchmark 又破了多少,而是想討論一個更實際的問題:當一個模型變成「預設」,對日常使用的人來說,真正的改變在哪裡。 更快的回應,不只是快了一點 GPT-5.5 Instant 最快能感受到的差異是速度。過去 GPT-5.4 或更早版本,遇到複雜問題時,思考時間明顯較長。但 GPT-5.5 Instant 在同樣的問題上,思考時間縮短,而且不是犧牲品質來換速度。 舉個實際場景:寫一封英文商務郵件。過去你丟一段中文草稿給 ChatGPT,它可能要 5–8 秒才吐出完整版本。現在...
上週蘋果官方 App 更新後,被眼尖的開發者發現安裝包內竟藏了一份 Claude.md 文件。更耐人尋味的是,蘋果在 24 小時內緊急刪除了這份文件,甚至沒有在更新日誌中解釋原因。這個舉動引發了 AI 圈一連串猜測:蘋果的 AI 戰略,到底還藏了多少我們不知道的牌? 到底發生了什麼?文件裡寫了什麼? 事情很簡單:某個蘋果官方 App(例如 Apple Store 或 Apple Music)的版本包中,被發現多了一個名為 Claude.md 的 markdown 檔案。根據流出的截圖,文件內容疑似是給開發者或測試人員的內部指引,明確提到了使用 Claude...
OpenAI 近期推出 **Advanced Account Security**,把 ChatGPT 與 Codex 的「帳號安全門檻」往上抬,重點不是新增一個花俏開關,而是:**對高風險帳號加強登入驗證與帳號恢復(找回)機制**。我認為這是一個明確訊號——生成式 AI 平台開始把「帳號」視為高價值資產:一旦被盜,失去的不只是對話紀錄,而是工作能力、工具權限,甚至可能波及資料品質與訓練流程。 AI 帳號被盜,不是聊天紀錄外洩而已,而是你的工作流程被接管。 ## Advanced Account Security 的主角:把「高風險帳號」的兩個入口鎖更緊 這次更新的主線很清楚: 1. **登入(Login)更難被冒用**:當系統判定帳號風險較高或登入情境異常時,會提高通過門檻。 2. **帳號恢復(Recovery)更難被社工突破**:找回流程變得更謹慎,降低被釣魚、SIM 卡交換、客服社工等手法鑽漏洞的機會。...
近期社群流傳一個說法:有人在 OpenAI Codex 的 CLI 開源程式碼與相關檔案中,疑似挖到 GPT‑5.5 的系統提示詞片段,裡面甚至包含「嚴禁模型主動討論『哥布林』等特定幻想生物」這類看似荒謬、但非常具指標性的指令。最值得先看的不是這個生物名詞本身,而是它透露了兩件事:Codex/GPT‑5.5 正把「基礎安全」往更底層、更硬的規則層推;同時也把「防幻覺」從模型能力問題,改成可被工程化管理的行為約束。 我的判斷是:如果這類提示詞片段屬實,它不是八卦,而是一個產品路線宣告——OpenAI 正在把 Codex 從「會寫程式的模型」推向「可長時間執行任務的工作夥伴」,而這條路一定伴隨更嚴格的內容界線與主題防範。你會覺得它更可靠,也會覺得它更愛管。 ## 「禁談幻想生物」到底在防什麼? 表面上看,禁止某些幻想生物或虛構題材很奇怪:這些東西通常不涉個資、不涉暴力教學,也不必然敏感。但把它放在「防幻覺」脈絡就合理了: – **模型很容易把虛構題材講成真的**:尤其是世界觀設定、族群史、詞源考據、偽百科式描述。 – **越是可被編造、越像知識的內容,越容易讓使用者誤信**:這類回答讀起來自信、結構完整,反而更危險。 所以,「禁談」可能不是道德審查,而是一種產品風險控管:對某些高幻覺風險主題直接踩煞車,避免模型主動帶風向、自己加戲。 有兩句話可以記住: – 內容過濾不是為了讓模型更乖,是為了讓它更可交付。...
OpenAI 正式發表 GPT-5.5,主打在編碼、電腦操作與深度研究等能力再升級,並開始向付費方案用戶開放,API 也預告將跟進推出。值得你先看清楚的不是「又更聰明」這種空泛形容,而是:GPT-5.5 更像一個會自己推進流程的工程夥伴——你給它目標,它會自己拆步驟、動手做、驗證結果,再往下一步走。我的判斷是:這次 OpenAI 想搶回的,不是單點題目答對率,而是「把整段工作流吃下來」的主導權。 有些人會把這波更新解讀成「榜單換人坐」。但對實際使用者來說,更關鍵的一句話是:模型強不強,別只看能不能寫出程式,得看能不能把錯修到測試過。 GPT-5.5 最值得注意的 4 個升級點(都指向同一件事:更能獨立完成任務) 1) 代理式編碼更成熟:從寫片段到推進整個解題流程 OpenAI 對 GPT-5.5 的描述重心很明確:在較少指示下,能自己判斷下一步該做什麼,處理複雜問題的效率更高。這句話聽起來像行銷,但落在工程場景就是三件事: 會先問「要怎麼驗證成功」:先補測試、先定義輸出格式 會主動補上下文:追 log、看錯誤堆疊、回頭翻關聯模組 會自己迭代:修一次不過就再修,直到「可用」 當 AI...
當大家還把 Codex 當成「更懂程式碼的聊天機器人」時,產品方向其實已經轉向:它正在被做成能接手整段工作流程的開發代理人(agent)。近期社群熱議的三個升級關鍵字——「可操作 Mac、圖像生成、記憶功能」——如果落在同一個產品體驗裡,代表的不是多幾個按鈕,而是 工程工作分工與責任邊界會被重新切割。 值得注意的是,OpenAI 目前的技術敘事已把「電腦操控」與「Codex 能力」逐步合流。以 GPT-5.4 為例,外部整理指出它把 Codex 編程能力整合到統一旗艦模型,並強調原生電腦操控(Computer Use)與更長上下文等特性(例如 OSWorld-Verified 75%)。 下面用「你真的能拿來做什麼」的角度,拆解這三種升級各自的價值、適用對象與風險。 1) 可操作 Mac:從寫程式到「替你跑流程」 所謂可操作 Mac,本質上是讓 Codex 不只產出程式碼,還能 操作桌面應用與瀏覽器:點擊、輸入、切換視窗、下載檔案、執行指令,完成需要...
ChatGPT Images 2.0 這次最明確的升級,是「精準度」與「文字排版」一起變得可用:你不再只是在抽卡式地拿到一張好看但不能上線的圖,而是更容易拿到能放進簡報、廣告素材、產品頁的版本。我的判斷是:生成影像進入下一階段的門檻,不在更華麗的風格,而在「能不能穩定把文字放對、把指示做對」。而這次更新正好打到這個痛點。 以前卡住你的,往往不是美感,而是「可控性」 很多人對 AI 生成圖的失望,都不是因為畫不出「漂亮」,而是畫不出「可用」。最常見的兩種翻車: 文字一上去就崩壞:招牌、海報標題、按鈕文案,全都像亂碼或歪斜字。 指令越寫越長,畫面越不聽話:你要「左上角放 Logo、右側留白、標題兩行、字級層次清楚」,結果模型把重點全吞掉。 一句話:AI 影像最大的差距,從來不是風格,而是可控性。 這次更新最值得注意的 4 個升級點 以下四點,才是你會在工作場景裡立刻感覺到「比較能交付」的原因。 1) 文字渲染更可靠:短文字、標籤、標題更像真的 這次主打「文字排版全面進化」,最直接的體感是:短字串的成功率變高。像是「新品上市」「限時 48 小時」「NT$ 990」這種過往最容易變形的內容,現在更容易保持可讀、字形一致。 文字排版能不能用,決定了生成圖像能不能上線。...