AI 開始學會「自己變強」了嗎? 近期一項來自史丹福大學博士生的研究展示,引起 AI 圈高度關注。原因不只是技術新穎,而是它碰到了一個長期被討論、卻始終難以真正落地的核心問題:AI 能否在沒有大量人工重新標註、頻繁人工介入的情況下,持續改善自己的能力? 這套被形容為「持續自我提升」的架構,吸引了包括 OpenAI 與 Meta 相關人士的注意。對外界而言,這不只是又一篇研究論文,而是可能改變未來模型訓練、部署與產品更新方式的一個方向訊號。 如果這條路走得通,AI 的成長模式可能不再只是「大公司蒐集更多資料、砸更多算力、定期推出更大模型」,而是朝向另一種更像學習系統的形態發展:在使用、反思、修正與再學習中逐步進步。 所謂「持續自我提升」,到底在講什麼? 一般人熟悉的 AI 升級方式,多半是團隊蒐集新資料、重新微調模型、做評測,再發佈新版本。這種模式有效,但有幾個明顯限制: 高度依賴人工標註與工程團隊 更新週期往往較長 很難針對真實使用中的新問題即時調整 模型上線後,學習能力通常是相對靜態的 所謂「持續自我提升」,重點就在於讓模型不只是回答問題,而是能夠在任務過程中產生回饋迴路。簡單來說,它可能會包含幾個關鍵步驟: 先執行任務或產出答案 檢查結果是否合理、是否出現錯誤...