OpenAI 前技術長 Mira Murati 在離開一段時間後,近日帶著一個相當大膽的宣告回歸:下一代 AI 不再需要對話框。消息一出,許多人第一個反應是「那以後要怎麼用 AI?」這個問題本身就點出了重點——我們對 AI 的想像,仍然停留在「你問一句,它答一句」的框架裡。而這次的宣布,正是要打破這個框架。
對話框不是 AI 的本質,只是過渡工具
過去兩年,從 ChatGPT 到 Claude,對話框幾乎成了 AI 產品的標準介面。用戶打開一個白色輸入框,打一句話,AI 回一段文字。這很直覺,也很成功,但同時也限制了 AI 的應用方式。Mira 這次的核心論點很簡單:AI 不該只在你開口問的時候才做事,它應該在背景中持續理解你的工作、預測你的需求,甚至在你還沒意識到的時候,就把事情處理好。
她以一個全新產品代號「Unwind」來說明這個概念。這不是一個有對話框的聊天機器人,而是一個「環境智能」——它整合進你每天使用的應用程式、瀏覽器、郵件客戶端和檔案系統,用多模態的感知能力去理解上下文,然後以卡片、摘要、自動補完、即時建議等形式,直接嵌入你的工作流程中。換句話說,你不再需要「打開 AI」這件事,AI 自己就在那裡。
這次回歸最值得注意的三個升級點
1. 不再被動,而是主動推播
過去我們用 AI,永遠是我們發起對話。你輸入 prompt,它才回覆。Unwind 的做法反過來:它會根據你當前的行為,主動推播有用的資訊。例如你正在瀏覽一份長達 50 頁的產品規格文件,它會自動擷取重點、對比版本差異,並顯示在螢幕側邊;你準備寄出一封報價信,它會提前檢查信件中是否有模糊的用詞或潛在的法律風險。這種「被服務」的體驗,跟過去「叫它做才做」完全不同。
2. 沒有 prompt,只有需求
大多數人寫 prompt 的門檻其實比想像中高。很多人不是不會用 AI,而是不知道「該怎麼問」。Unwind 把這一層拿掉,讓 AI 直接用行為來推斷需求。例如你連續打開三個競品網站,它就知道你在做市場調研,自動生成一份對照表;你在程式碼編輯器裡反覆修改同一個函數,它會判斷你正在除錯,並主動給出可能的原因和修復建議。這不是預測未來的魔法,而是基於大量上下文的多模態推論——它的訓練材料涵蓋螢幕畫面、滑鼠點擊軌跡、鍵盤輸入內容和時間序列。
3. 隱私與自主權仍是關鍵問題
當然,這種「隨時看著你」的設計,立刻引發了隱私疑慮。Mira 在宣布時也強調,所有感知資料都在裝置端處理,只有模型推論需要連線,且用戶可以隨時關閉特定領域的感知權限。她甚至展示了一個「透明模式」:你可以在任何時候叫出一個覆蓋層,看清楚 AI 目前到底從你的螢幕上讀到了什麼。這個設計相當聰明,因為它讓用戶保有控制感,而不是覺得被監控。
這種設計到底適合誰?不適合誰?
先說結論:這套東西對重度工作者——資訊工作者、開發者、研究員、專案管理者——殺傷力最大。這些人每天要切換大量視窗、處理大量文件、做大量重複性決策,剛好是 Unwind 最擅長的場景。一台永遠在你背後幫你整理線索的 AI,對效率的提升是跳躍式的。
但如果你只是拿 AI 來寫寫短文、玩玩角色扮演、或偶爾翻譯一句話,那對話框其實已經夠用。Unwind 的硬體需求不低,至少需要一定的本地運算能力才能做到裝置端處理,而且它內建在特定作業系統層級,並非所有裝置都能跑。這不是一個「每個人都該立即轉換」的產品,而是一個對特定使用者極具殺傷力的工具。
值不值得立即關注?答案是肯定的
雖然產品尚未全面公測,但 mira 這次的歸來已經釋放一個明確訊號:AI 的下一個戰場不是更強的模型,而是更自然的互動介面。對話框只是開端,真正的顛覆來自於讓 AI 從工具變成環境。如果你正在做產品設計、用戶體驗研究,或是在為團隊選擇下一代生產力工具,現在就該開始關注「無對話框 AI」這個方向。
不要以為這只是另一個新創噱頭。主導過 GPT-4 開發的那個人,正在告訴你對話框是限制器——這件事本身就值得認真對待。
追蹤以下平台,獲得最新AI資訊:
Facebook: https://www.facebook.com/drjackeiwong/
Instagram: https://www.instagram.com/drjackeiwong/
Threads: https://www.threads.net/@drjackeiwong/
YouTube: https://www.youtube.com/@drjackeiwong/
Website: https://drjackeiwong.com/