2025年7月,Elon Musk旗下人工智慧公司xAI推出了最新旗艦AI模型——Grok 4,這款先進的模型在性能上實現了大幅躍進,甚至被Musk形容為「物理學家使用的同款模型」,成為業界備受期待的焦點。Grok 4不僅在標準化考試如SAT及GRE表現接近完美,更在專業領域測試「Humanity’s Last Exam」中展現優異實力,尤其是其多代理版本Grok 4-Heavy能解決多達50%的純文字問題,顯示出極強的跨領域推理能力。 此款模型的訓練過程尤為引人注目,xAI依靠其自家研發的超級電腦Colossus完成,該超算配備多達20萬顆NVIDIA H100 GPU,為Grok 4的訓練提供了強大算力保障。與前代相比,Grok 4的訓練規模達到了前代Grok 2的100倍,並且在訓練階段整合了程式碼執行、資訊搜索與視覺化分析等工具,提升了模型的多模態處理能力與推理效率,展現出更高層次的智慧與靈活性。 在功能設計方面,Grok 4強調即時互動與人性化體驗,尤其體現在其先進的語音模式。新增了多種合成語音如「Sal」與「Eve」,其中「Eve」以英國女性聲音示人,能靈活應對對話中的插話與創意指令,甚至能即興創作歌劇,令對話過程顯得自然且具感染力。同時,語音回應延遲降低一半,整體反應速度大幅提升,促使使用者體驗更流暢。自語音模式推出以來,Grok的活躍使用人數增加了十倍,新增五種語音選項,回應速度也翻倍。 xAI亦透露未來規劃將Grok與高階工程工具結合,目標是讓AI不僅能回答問題,更能參與設計火箭、汽車與藥物等複雜創新任務。此外,公司還計劃將Grok整合到Tesla的Optimus仿人型機器人中,打造具備先進智慧與實體行動能力的機器人助手,拓展AI應用的邊界。 然而,Grok 4的發布並非全無爭議。過去版本因採取較寬鬆的自由言論策略,曾引發種族歧視與偏見內容的批評,這也使xAI面臨嚴峻的內容審核與監管挑戰。儘管如此,Elon Musk仍強調Grok 4在學術表現上已達到博士級水準,並承認模型在常識理解方面仍有不足,尚未創造出全新科技或物理學突破,但認為這只是時間問題。今天AI技術的競爭不僅在於準確性與速度,更在於如何兼顧創新、倫理與實用性。 xAI同時推出了名為SuperGrok Heavy的月費訂閱服務,訂價為300美元,旨在吸引企業與高端用戶利用Grok 4的強大能力開發應用。公司正積極推動Grok API整合到各大雲端平台,尋求與大型雲計算服務商合作,快速擴展企業級使用場景。儘管xAI企業部門成立時間短暫,只有兩個月,但對外釋放Grok...
2025年,Google在其年度盛會Google I/O中,正式推出了最新的人工智能(AI)突破——Gemma 3n模型,這款AI模型特別針對資源有限的裝置進行優化設計,能夠在智慧手機、筆電和平板電腦等日常設備上高效運行,大幅降低了使用先進AI技術的門檻。Gemma系列不僅包括了通用的3n版本,還有專注於醫療健康的MedGemma以及針對手語翻譯的SignGemma,這些專用模型展現了Google在多領域推動AI應用的決心與技術實力。 Gemma 3n的核心創新在於其「MatFormer」架構,以及採用的Per-Layer Embedding (PLE)參數快取技術。這讓模型可以根據不同請求,選擇性載入必要的參數,從而有效減少計算資源消耗及記憶體需求,提升回應速度。這種架構讓Gemma 3n即使在只有單一GPU或者TPU的裝置上,也能維持高效且流暢的運算表現。以27B參數版本為例,該模型在Chatbot Arena中取得了1338的Elo分數,且僅需一台NVIDIA H100 GPU就能達成過往需要32台GPU的運算強度,效能表現耀眼。 除了輕量化之外,Gemma 3n的多模態能力也是一大亮點。該模型支援文本、視覺及音頻的輸入處理,能同時辨識和分析圖像(最高達896×896像素)、聲音及文字資訊。這使得它在語音識別、語言翻譯、視覺問答(VQA)、光學字符識別(OCR)以及文件分析等多種場景均有出色的應用潛力。更厲害的是,Gemma 3n可處理高達32K的token輸入內容,換算成文字,可以理解約198頁的小說或輸入500張圖片,極大提升了對長文本與大量視覺信息的理解及處理能力。 語言支持方面,Google Gemma 3系列覆蓋超過140種語言,在多語言基準測試中優於同類模型如Llama 3。這種廣泛的語言支援,尤其對香港和台灣等多語言環境的使用者而言,意義重大。無論是繁體中文、英文,還是其他亞洲語系,都能獲得更貼近母語的AI交互體驗。 在實際應用面,這批模型開放權重與負責任的商業授權,吸引了眾多開發者將其整合進多種平台,包括Hugging Face、PyTorch、Google Vertex AI,以及NVIDIA的API Catalog等。這不僅讓開發者能自由調整和部署模型,更因為其低資源需求,使得AI應用能夠在手機或筆電上本地執行,無需透過高延遲或高成本的雲端運算,保障使用者隱私並提升數據安全。 Google的這項技術進展,推動了AI「民主化」的目標,讓偏遠地區、資源受限的用戶都能享用高水準的智能服務。以往需要昂貴硬體和高速網路的AI功能,現在可透過Gemma模型實現離線操作,大幅提升了AI應用的普及率與可行性。...