ChatGPT 迎來正式版「工作空間代理(Workspace Agents)」:你不再只是跟 AI 對話,而是能在同一個工作空間裡,設計可重複執行的跨團隊任務,並用權限控管把「能做什麼、能看到什麼、做到哪一步要停下來等人核准」說清楚。最值得先留意的不是它會不會更聰明,而是它終於把代理最難落地的部分——邊界與責任——做成產品。我的判斷是:這次更新的主角不是自動化本身,而是「可被團隊信任的自動化」。 代理的價值不在於它能做多少事,而在於它知道哪些事不能做。 沒有權限邊界的 AI 代理,只是把人為失誤自動化。 Workspace Agents 到底新了什麼:把「個人助理」升級成「團隊可用的執行者」 過去多數人用 ChatGPT,是臨時問答、臨時產出;就算你寫了再漂亮的提示詞,也很難把它變成「團隊共同使用、可交接、可稽核」的流程。 Workspace Agents 的變化可以一句話講完:代理從你的聊天視窗走進工作空間,變成可被設計、可被授權、可被追蹤的工作單位。這跟近期香港來自 OpenAI 在 Codex 上推進「背景運作、多代理並行、記憶、外掛整合」的方向其實一致,只是這次把焦點放在團隊協作與控管上。 這次更新最值得注意的 3 個升級點(而且都跟「可控」有關)...
Claude Managed Agents 是什麼?為何 Anthropic 想替你「跑代理人」 近一年「AI 代理人(AI agents)」從概念走向實作:不只聊天,還會自己拆解任務、呼叫工具、查資料、寫程式、回報結果。然而真正讓代理人落地的,往往不是模型能力,而是營運層——排程、狀態管理、錯誤重試、權限與金鑰、日誌稽核、成本控管。 在這個背景下,Anthropic 推出 Claude Managed Agents 的方向很明確:不只賣模型 API,而是把「跑代理人所需的一整套」交由平台代管。對企業來說,這可能代表更快上線;但也意味著把更多控制權交給供應商。 從「呼叫模型」到「把代理人交給平台」的差別 過去你用 Claude API,通常是自己在應用端做: 任務隊列(Queue)與排程(Scheduler) 工具呼叫與回傳格式(Tools / Function...
Anthropic 推出新一代 AI 模型「Mythos」,但第一波僅對特定企業開放。對外界而言,這不只是「又一個更強的模型」——更像是 Anthropic 把產品路線從「能用」推向「能落地、能治理、能負責」的訊號。對企業買方、開發團隊與內容/客服單位來說,Mythos 的限制式上線本身,就值得被解讀。 Mythos 登場:重點不只在效能,而是「可用性」 在生成式 AI 逐漸走出展示期後,企業最在意的往往不是單點能力,而是整體可用性:穩定度、延遲、成本、權限控管、稽核紀錄、以及對敏感資料的處理方式。Mythos 先以企業為主要對象,常見含意有三個: 以高價值場景驗證:先從客服、文件處理、內部知識庫、研發助理等「能直接省工」的場域切入,容易量化成效。 以合規與風控建立信任:在更嚴格的資料與權限要求下,產品能否穩定運作,會比純 benchmark 更有說服力。 以合作夥伴打磨整合:企業導入通常會牽涉 SSO、權限分層、API 閘道、紀錄保存與安全稽核;先限定客戶能加速把「上線細節」磨出來。 為什麼不一開始就全面開放?限制式上線的商業與技術邏輯 從策略面看,限制式上線往往是「降低風險、提高成功率」: 控管運算成本與服務品質:新模型初期最怕流量暴增造成不穩定;企業白名單可讓資源配置更可預期。 降低錯誤輸出帶來的公關/法律風險:企業客戶多半有更明確的使用規範與內控流程,能把失誤影響圈在可管理範圍。...
微軟這次對 Copilot 的「重大升級」,關鍵不在於又多了幾個新按鈕,而是打破只依賴單一大型語言模型(LLM)的限制:在 Copilot 的能力版圖中,開始導入 Anthropic Claude 等不同模型,走向「多模型協作」的路線。對企業與知識工作者來說,這代表 Copilot 有機會從「一個很會寫字的助理」,進一步變成能依任務挑選最合適引擎的生產力平台。 從「一個模型打天下」到「任務導向選模型」 過去多數使用者對 Copilot 的印象,是它在 Microsoft 365(Word、Excel、PowerPoint、Outlook、Teams)內協助草擬、摘要、改寫、整理會議重點,核心體驗往往與單一模型的表現高度綁定: 模型擅長長文摘要,你就覺得 Copilot 很神 模型在表格推理或精準計算容易出錯,你就覺得 Copilot 不可靠 模型風格偏保守或偏發散,也直接影響你對 Copilot...
Perplexity 推出的 Perplexity Computer 主打「多模型 AI 代理(agent)」:不只回答問題,而是能像數位員工一樣,在目標導向下拆解任務、呼叫不同模型與工具、跨系統完成一段工作流程。對企業而言,這件事的重要性不在於又多了一個聊天機器人,而是它把 AI 從「知識查詢」推進到「可交付成果的流程執行者」。 這篇文章會用企業落地的視角,拆解 Perplexity Computer 的核心概念、適合的工作型態、導入方法,以及你必須正視的風險與治理。 為什麼「多模型代理」比單一聊天更像數位員工? 企業在導入生成式 AI 的第一階段,多半停在:寫文案、整理會議紀錄、回覆客服草稿、做摘要。但一旦進入真實流程,你會遇到幾個卡點: 任務不是一句提示就結束:例如「整理競品情報並寄給團隊」包含查資料、比對可信來源、產出表格、寫郵件、附上引用與連結、寄送並留存紀錄。 不同步驟需要不同能力:檢索要可信、寫作要符合品牌語氣、資料整理要可追溯、最後還要能呼叫內部工具(CRM、工單系統、文件庫)。 單一模型很難同時兼顧:有的模型強在推理、有的強在程式、有的強在文字風格;企業追求的是「整體交付」而非某一次對話的驚艷。 多模型代理的價值在於:它把「選模型」變成系統自動決策的一部分,並把工具使用(瀏覽、檔案、表格、內部 API)納入一條可控的任務鏈。 Perplexity Computer...