當大家還把 Codex 當成「更懂程式碼的聊天機器人」時,產品方向其實已經轉向:它正在被做成能接手整段工作流程的開發代理人(agent)。近期社群熱議的三個升級關鍵字——「可操作 Mac、圖像生成、記憶功能」——如果落在同一個產品體驗裡,代表的不是多幾個按鈕,而是 工程工作分工與責任邊界會被重新切割。 值得注意的是,OpenAI 目前的技術敘事已把「電腦操控」與「Codex 能力」逐步合流。以 GPT-5.4 為例,外部整理指出它把 Codex 編程能力整合到統一旗艦模型,並強調原生電腦操控(Computer Use)與更長上下文等特性(例如 OSWorld-Verified 75%)。 下面用「你真的能拿來做什麼」的角度,拆解這三種升級各自的價值、適用對象與風險。 1) 可操作 Mac:從寫程式到「替你跑流程」 所謂可操作 Mac,本質上是讓 Codex 不只產出程式碼,還能 操作桌面應用與瀏覽器:點擊、輸入、切換視窗、下載檔案、執行指令,完成需要...
ChatGPT Images 2.0 這次最明確的升級,是「精準度」與「文字排版」一起變得可用:你不再只是在抽卡式地拿到一張好看但不能上線的圖,而是更容易拿到能放進簡報、廣告素材、產品頁的版本。我的判斷是:生成影像進入下一階段的門檻,不在更華麗的風格,而在「能不能穩定把文字放對、把指示做對」。而這次更新正好打到這個痛點。 以前卡住你的,往往不是美感,而是「可控性」 很多人對 AI 生成圖的失望,都不是因為畫不出「漂亮」,而是畫不出「可用」。最常見的兩種翻車: 文字一上去就崩壞:招牌、海報標題、按鈕文案,全都像亂碼或歪斜字。 指令越寫越長,畫面越不聽話:你要「左上角放 Logo、右側留白、標題兩行、字級層次清楚」,結果模型把重點全吞掉。 一句話:AI 影像最大的差距,從來不是風格,而是可控性。 這次更新最值得注意的 4 個升級點 以下四點,才是你會在工作場景裡立刻感覺到「比較能交付」的原因。 1) 文字渲染更可靠:短文字、標籤、標題更像真的 這次主打「文字排版全面進化」,最直接的體感是:短字串的成功率變高。像是「新品上市」「限時 48 小時」「NT$ 990」這種過往最容易變形的內容,現在更容易保持可讀、字形一致。 文字排版能不能用,決定了生成圖像能不能上線。...
近期 AI 圖像生成技術發展非常迅速,而 Nano Banana 2 可以說是近期 AI 圖像生成領域最受關注的新模型之一。相比上一代版本,Nano Banana 2 在 生成速度、圖像解析度以及生成成本 等方面都有顯著提升。 不少 AI 社群甚至認為,Nano Banana 2 有機會成為下一代主流 AI 圖像生成模型 (AI Image...