GPT-5.1正式登場!OpenAI打造更溫暖、更貼心的AI助手 OpenAI於2025年8月7日推出旗艦模型GPT-5後,再於11月12日發表最新升級版本GPT-5.1,為ChatGPT使用者帶來全新的互動體驗。這次更新不僅著眼於提升AI的智能水平,更重點優化了與使用者的互動質感,讓AI助手從過去被批評的「冷漠」形象,蛻變成更富人性、更易溝通的夥伴。 從冷硬到溫暖的蛻變 GPT-5在推出初期因其冷硬的語氣和生硬的互動風格引發不少使用者反彈。為了解決這個問題,OpenAI在GPT-5.1上投入大量心力,將重點從單純的性能優化轉向使用者體驗的全面提升。新版本在語氣與互動風格方面實現了顯著改善,回應變得更自然、更具溫度,讓對話更像是與真人交流,而非機械式的資訊輸出。 八種對話性格供使用者選擇 GPT-5.1最引人矚目的功能之一是大幅擴充了個性化設定選項。使用者現在可以從八種預設對話性格中選擇,包括預設(Default)、專業(Professional)、友善(Friendly)、坦率(Candid)、怪趣(Quirky)、有效率(Efficient)、極客(Nerdy)及憤世嫉俗(Cynical),滿足不同使用場景的需求。無論使用者需要專業嚴謹的商務對話,抑或輕鬆愉快的日常互動,都能找到相應的性格設定。 更進一步,OpenAI推出了實驗性功能,允許使用者直接從設定中微調ChatGPT的風格,讓AI助手能更精確地符合個人偏好。這項功能已於本週開始向部分使用者推出,標誌著AI個性化程度又向前邁進了一大步。此外,使用者在設定中進行的個性化調整現在可以即時生效於所有對話,包括正在進行中的對話,確保互動體驗的一致性。 任務導向的雙模型設計 GPT-5.1引入了GPT-5.1 Instant與GPT-5.1 Thinking兩款升級模型,針對不同類型的任務進行最佳化,標誌著OpenAI在模型設計上的策略性轉變。GPT-5.1 Instant專注於快速反應,優先考慮速度與對話流暢度,適合日常問答、集思廣益或文章摘要等場景。該模型因重新設計而變得更加平易近人,在處理簡單問題時能迅速回應。 相比之下,GPT-5.1 Thinking則採用與推理模型相同的技術堆疊,針對事實準確性和解決複雜問題的表現優於前代GPT-5。這款模型在回應時會自動調整思考時間,對複雜問題投入更多思考,而對簡單問題則快速回應,提供了更聰慧的時間分配策略。GPT-5.1 Thinking的回應也變得更清晰,減少了專業術語和未定義詞彙的使用,使這款最強大的模型更易於理解和使用。 在多數情況下,ChatGPT系統會自動為使用者的提問配對至最合適的模型,簡化了操作流程,使用者無需在速度和深度之間手動權衡。付費使用者仍可透過模型選擇器主動選擇「GPT-5.1 Thinking」,或在提示中輸入類似「認真思考這個問題」的指令,確保在生成回應時充分發揮推理功能。 技術水平的持續躍進 在技術層面上,GPT-5.1相較於前代版本展現出多項顯著改進。新版本在事實準確性方面表現更佳,能夠更有效地減少虛構資訊,提供更可靠的回應。GPT-5.1對使用者指令的遵循能力也得到強化,這意味著使用者能更精確地控制AI輸出結果的格式、語氣與內容。 此外,GPT-5.1新增的自訂指令功能讓使用者享有更強大的控制權,可以透過設定來微調ChatGPT的行為和語調。這些個性化設定最初支援文本聊天,後續將擴展至語音功能,使使用者無需編寫複雜的自訂提示,就能調整ChatGPT的互動方式。 全球超過8億使用者推動的演進 OpenAI認為,隨著全球已有超過8億人使用ChatGPT,「一體適用」的時代已經過去。因此,GPT-5.1的設計理念是將AI助理從單一角色升級為能夠匹配使用者個人需求的多樣化人設。這一策略性轉變反映了OpenAI對市場需求的深刻理解,以及在AI競賽中超前佈局以「使用者體驗」為核心的決心。 升級推出計劃 新版本GPT-5.1已於本週開始向ChatGPT使用者陸續推出,優先向付費使用者提供。舊版GPT-5模型將移至ChatGPT清單中的「舊版模型」部分,保留3個月後將下架,給予使用者充足的過渡時間。...
OpenAI 最新推出的 gpt-oss 系列模型,包括 gpt-oss-120b 與 gpt-oss-20b,代表了開源語言模型的新里程碑,將強大的自然語言處理能力以開放權重方式提供給全球開發社群,特別適合香港及台灣等地對新世代 AI 技術需求日益增長的市場。這兩款模型均遵循寬鬆的 Apache 2.0 授權條款,並具備優異的推理與工具使用能力,是首次由 OpenAI 自 GPT-2 以來大規模開放的權重模型,開啟了人工智能民主化的新篇章。 在架構設計上,gpt-oss 模型基於先進的 Transformer 架構,並運用了專家混合(Mixture-of-Experts, MoE)技術,以減少每次推理啟動的參數數量,達到高效的運算表現。以 gpt-oss-120b 為例,總共有約 1170...
2025年7月,Elon Musk旗下人工智慧公司xAI推出了最新旗艦AI模型——Grok 4,這款先進的模型在性能上實現了大幅躍進,甚至被Musk形容為「物理學家使用的同款模型」,成為業界備受期待的焦點。Grok 4不僅在標準化考試如SAT及GRE表現接近完美,更在專業領域測試「Humanity’s Last Exam」中展現優異實力,尤其是其多代理版本Grok 4-Heavy能解決多達50%的純文字問題,顯示出極強的跨領域推理能力。 此款模型的訓練過程尤為引人注目,xAI依靠其自家研發的超級電腦Colossus完成,該超算配備多達20萬顆NVIDIA H100 GPU,為Grok 4的訓練提供了強大算力保障。與前代相比,Grok 4的訓練規模達到了前代Grok 2的100倍,並且在訓練階段整合了程式碼執行、資訊搜索與視覺化分析等工具,提升了模型的多模態處理能力與推理效率,展現出更高層次的智慧與靈活性。 在功能設計方面,Grok 4強調即時互動與人性化體驗,尤其體現在其先進的語音模式。新增了多種合成語音如「Sal」與「Eve」,其中「Eve」以英國女性聲音示人,能靈活應對對話中的插話與創意指令,甚至能即興創作歌劇,令對話過程顯得自然且具感染力。同時,語音回應延遲降低一半,整體反應速度大幅提升,促使使用者體驗更流暢。自語音模式推出以來,Grok的活躍使用人數增加了十倍,新增五種語音選項,回應速度也翻倍。 xAI亦透露未來規劃將Grok與高階工程工具結合,目標是讓AI不僅能回答問題,更能參與設計火箭、汽車與藥物等複雜創新任務。此外,公司還計劃將Grok整合到Tesla的Optimus仿人型機器人中,打造具備先進智慧與實體行動能力的機器人助手,拓展AI應用的邊界。 然而,Grok 4的發布並非全無爭議。過去版本因採取較寬鬆的自由言論策略,曾引發種族歧視與偏見內容的批評,這也使xAI面臨嚴峻的內容審核與監管挑戰。儘管如此,Elon Musk仍強調Grok 4在學術表現上已達到博士級水準,並承認模型在常識理解方面仍有不足,尚未創造出全新科技或物理學突破,但認為這只是時間問題。今天AI技術的競爭不僅在於準確性與速度,更在於如何兼顧創新、倫理與實用性。 xAI同時推出了名為SuperGrok Heavy的月費訂閱服務,訂價為300美元,旨在吸引企業與高端用戶利用Grok 4的強大能力開發應用。公司正積極推動Grok API整合到各大雲端平台,尋求與大型雲計算服務商合作,快速擴展企業級使用場景。儘管xAI企業部門成立時間短暫,只有兩個月,但對外釋放Grok...
2025年,Google在其年度盛會Google I/O中,正式推出了最新的人工智能(AI)突破——Gemma 3n模型,這款AI模型特別針對資源有限的裝置進行優化設計,能夠在智慧手機、筆電和平板電腦等日常設備上高效運行,大幅降低了使用先進AI技術的門檻。Gemma系列不僅包括了通用的3n版本,還有專注於醫療健康的MedGemma以及針對手語翻譯的SignGemma,這些專用模型展現了Google在多領域推動AI應用的決心與技術實力。 Gemma 3n的核心創新在於其「MatFormer」架構,以及採用的Per-Layer Embedding (PLE)參數快取技術。這讓模型可以根據不同請求,選擇性載入必要的參數,從而有效減少計算資源消耗及記憶體需求,提升回應速度。這種架構讓Gemma 3n即使在只有單一GPU或者TPU的裝置上,也能維持高效且流暢的運算表現。以27B參數版本為例,該模型在Chatbot Arena中取得了1338的Elo分數,且僅需一台NVIDIA H100 GPU就能達成過往需要32台GPU的運算強度,效能表現耀眼。 除了輕量化之外,Gemma 3n的多模態能力也是一大亮點。該模型支援文本、視覺及音頻的輸入處理,能同時辨識和分析圖像(最高達896×896像素)、聲音及文字資訊。這使得它在語音識別、語言翻譯、視覺問答(VQA)、光學字符識別(OCR)以及文件分析等多種場景均有出色的應用潛力。更厲害的是,Gemma 3n可處理高達32K的token輸入內容,換算成文字,可以理解約198頁的小說或輸入500張圖片,極大提升了對長文本與大量視覺信息的理解及處理能力。 語言支持方面,Google Gemma 3系列覆蓋超過140種語言,在多語言基準測試中優於同類模型如Llama 3。這種廣泛的語言支援,尤其對香港和台灣等多語言環境的使用者而言,意義重大。無論是繁體中文、英文,還是其他亞洲語系,都能獲得更貼近母語的AI交互體驗。 在實際應用面,這批模型開放權重與負責任的商業授權,吸引了眾多開發者將其整合進多種平台,包括Hugging Face、PyTorch、Google Vertex AI,以及NVIDIA的API Catalog等。這不僅讓開發者能自由調整和部署模型,更因為其低資源需求,使得AI應用能夠在手機或筆電上本地執行,無需透過高延遲或高成本的雲端運算,保障使用者隱私並提升數據安全。 Google的這項技術進展,推動了AI「民主化」的目標,讓偏遠地區、資源受限的用戶都能享用高水準的智能服務。以往需要昂貴硬體和高速網路的AI功能,現在可透過Gemma模型實現離線操作,大幅提升了AI應用的普及率與可行性。...