你知道GPT-4o的圖像生成功能可以不只畫吉卜力及宮崎駿動漫圖嗎?📷 本集完整示範10大應用場景,從商品Mockup、試穿、插畫升級、教學圖卡到AI室內設計,全由Dr. Jackei親測,免費用戶都能上手🔥 🎓 適合創作者、行銷人、設計師、老師、家長必看! #GPT-4o圖像生成 #GPT-4o10大應用 #AI繪圖 📌訂閱頻道學更多 AI 技巧 ▶ https://youtube.com/@DrJackeiWong?sub_confirmation=1 📌更多 AI 工具教學 ▶ https://www.youtube.com/watch?v=pEo9Ts6N7dQ&list=PLflMnjf8jBZeUtibH6JQQLkpdJfiFhnai&index=33 [AI學堂] 圖像生成文字 + 角色一致性 終於解決?貼圖 封面...
隨著 OpenAI 最新 GPT-4o 模型 發佈,支援圖像生成(Image Generation) 功能的 ChatGPT App 迅速爆紅,不少用戶紛紛湧入 App Store 或 Google Play 下載體驗。然而,就在「吉卜力風格圖片」瘋傳社交媒體之際,大量假冒的「ChatGPT App」亦乘勢而起,不但功能不完整,更可能涉及詐騙、強迫收費,甚至盜取個人資料。 📌 本文一次過教你: 🔥 一、為何近期 ChatGPT App...
近期,一本新書的摘錄引發了廣泛的關注,內容關於OpenAI CEO Sam Altman被解除職務的諸多細節。這本書講述了OpenAI創始人Ilya Sutskever和CTO Mira Murati如何向董事會提交了一系列證據,指控Sam Altman的行為有問題,並因此促成他的離職。然而,這一事件迅速引發了公司內部的強烈反彈,導致的是大多數員工聯署要求Sam Altman返回公司。最終Sam Altman重返OpenAI,並成立了一個新的董事會。 在探討這一事件之前,我們需要了解Sam Altman與OpenAI之間的特殊關係。OpenAI是一家在人工智慧領域取得重要成就的公司,而它成功的背後與Sam Altman在公司內的影響力息息相關。 詳述事件經過 2023年,OpenAI的董事會以一些問題為由決定解除Sam Altman的CEO職務。其中,最主要的原因是在審查OpenAI的企業管理時,發現Sam Altman涉及到「OpenAI Startup Fund」,該基金實際上是由Altman個人所有,而非公司的資產。同時,Ilya Sutskever和Mira Murati也在收集證據,以證明Sam Altman的行為不符合公司的價值觀和期望。 最為人所關注的一點是,Sam Altman曾聲稱公司的法律部門認為無需對GPT-4...
OpenAI 推出全新 GPT-4o 圖像生成功能🔥本片實測三大功能: ① 中文文字生成(揮春、書籍封面、infographic) ② 主角一致性控制 ③ 自訂貼圖+轉換風格(像素風、Spy X Family、Chiikawa) 還有 API 使用限制、loading 實況、成功與失敗示範,最真實呈現!#GPT4o #AI圖像生成 #吉卜力風格 📌訂閱頻道學更多 AI 技巧 ▶ https://youtube.com/@drjackeiwong?sub_confirmation=1 📌更多...
在當前人工智能(AI)的發展風潮中,OpenAI的ChatGPT引發了廣泛的興趣和討論,尤其是在其圖像生成能力的升級。由於ChatGPT此次的圖像生成功能基於GPT-4o模型,該功能不僅能夠精確生成圖片中的文字,還能維持圖像中的物件一致性和正確性,從而拓展了其在商業和教育領域的應用。然而,這項功能對於免費用戶的推出計劃被暫時延遲,主要原因是需求量超出了公司的預期。 背景 OpenAI於2022年底推出ChatGPT,最初僅提供文字對話功能。隨後不久,該平台開始整合圖像生成工具,但一直依賴獨立的DALL-E模型。這種生成圖像的能力雖然受到關注,但同樣面臨著很多技術瓶頸,尤其是對於圖像中的文字生成。圖像上的文字錯誤率相對較高,這阻礙了其在教育和商業中的廣泛應用。 升級功能 ChatGPT的新AI圖像生成功能是基於GPT-4o模型的重大升級。這項功能的亮點在於它能夠精確地生成圖片中的文字,減少錯誤,同時保證圖像中的物件一致性。這對於生成帶有文字的海報、科學教學圖表或漫畫等有著重要意義。GPT-4o模型通過更好的維持物件與屬性的關係,使得生成的圖像更具質量和真實感。此外,該模型能夠生成帶有透明背景的圖像,這對企業品牌設計等領域特別有用。 otraoff Müssten Münchenö Stap Trem århus以下為根據您的需求重新撰寫的內容: 在當前人工智能(AI)的發展潮流中,OpenAI的ChatGPT引發了廣泛的興趣和討論,尤其是在其圖像生成能力的升級。由於ChatGPT此次的圖像生成功能基於GPT-4o模型,該功能不僅能夠精確生成圖片中的文字,還能維持圖像中的物件一致性和正確性,從而拓展了其在商業和教育領域的應用。然而,這項功能對於免費用戶的推出計劃被暫時延遲,主要原因是需求量超出了公司的預期。 背景 OpenAI於2022年底推出ChatGPT,最初僅提供文字對話功能。隨後不久,該平台開始整合圖像生成工具,但一直依賴獨立的DALL-E模型。這種生成圖像的能力雖然受到關注,但同樣面臨著很多技術瓶頸,尤其是對於圖像中的文字生成。圖像上的文字錯誤率相對較高,這阻礙了其在教育和商業中的廣泛應用。 升級功能 ChatGPT的新AI圖像生成功能是基於GPT-4o模型的重大升級。這項功能的亮點在於它能夠精確地生成圖片中的文字,減少錯誤,同時保證圖像中的物件一致性。這對於生成帶有文字的海報、科學教學圖表或漫畫等有著重要意義。GPT-4o模型通過更好的維持物件與屬性的關係,使得生成的圖像更具質量和真實感。此外,該模型能夠生成帶有透明背景的圖像,這對企業品牌設計等領域特別有用。 需求延遲 面對免費用戶的需求,OpenAI在最初的計劃中打算將圖像生成功能推廣開來。然而,由於需求量遠遠超出了預期,OpenAI宣布延遲這項功能對免費用戶的推出。這項決定出於公司對服務質量和用戶體驗的考慮。付費用戶目前可以透過ChatGPT Plus、Pro和Team方案使用這項功能,未來幾周內,開發者也將能夠通過API調用這項功能。 安全考量 ChatGPT的新圖像生成功能不僅在技術上取得了進步,也注重了圖像生成的安全性。圖像生成過程中,系統會透過一定的機制防止刪除浮水印、防止情色深度偽造等內容的生成,並且拒絕CSAM(兒少性虐待內容)的生成請求。這些安全措施確保了用戶在使用圖像生成功能時能維持合法且安全的體驗。 未來前景 隨著技術的進一步發展和需求的不斷增長,OpenAI有望改善圖像生成功能的延遲和質量問題。這項功能將廣泛應用於各個領域,如教育、商業、創意設計等,它有助於提升相關應用場合的有效性。同時,對AI助力下的智慧生活和工作表示了高度
近期,科技巨頭Microsoft宣布將人工智能(AI)深度研究工具加入其Microsoft 365 Copilot平臺,進一步提升其在研究領域的競爭力。這一舉措對於OpenAI的ChatGPT和Google等公司而言無疑增加了競爭壓力。Microsoft 365 Copilot現在構建了兩款主要工具:Researcher和Analyst。這些工具旨在協助使用者進行深入的研究和分析,結合Microsoft的應用生態和互聯網資源。 Researcher工具結合了OpenAI的深度研究模型,並且擁有強大的搜索功能和資料整合能力。它可以協助用戶生成市場進入策略和季度報告等。另一方面,Analyst基於OpenAI的o3模型,專注於複雜資料分析,能夠運行Python程式來處理複雜的資料查詢,並允許用戶複查工具的思考過程。 這些工具的發展反映了近期對於AI驅動的研究助手的需求。隨著ChatGPT和Google Gemini等AI工具的出現,Microsoft也致力於開發類似的AI驅動工具,以滿足用戶的需求。然而,這些工具也面臨著一個挑戰——確保提供的信息正確且可靠。Microsoft推出的「Frontier」計畫將允許用戶提前體驗這些新功能,並在四月份率先接觸到Researcher和Analyst工具。 Microsoft Copilot作為AI一種平臺,不僅提供了深度研究工具,還可以幫助用戶搜索學術文章、創建引用、總結文章內容等。它允許用戶選擇不同的對話風格,例如更具創意、平衡或精確的方式,以適應不同使用者的需求。 值得注意的是,Microsoft Copilot與其他AI工具相比,能夠自由訪問互聯網資源,並提供來源鏈接以便用戶進行事實核查。這一特性使得Copilot在提供資訊的可靠性和時效性上頗具優勢。 雖然AI研究工具的出現為研究人員帶來了許多便利,但也需要用戶注意事實核查。這些工具雖然強大,但仍可能提供錯誤信息,因此使用者需要對其生成的內容進行仔細評估,以確保最終輸出的可靠性。 Microsoft在AI領域的進發,説明其在科技創新的不斷努力。隨著AI技術的進一步成熟,我們可以預見未來將會有更多激動人心的應用和功能推出。對於香港和台灣的用戶而言,Microsoft Copilot提供了一種便捷而有效的方式來提升設計流程和研究效率。 #MicrosoftCopilot #人工智慧 #深度研究 #AI工具 #科技創新
近期,一項名為ARC-AGI-2的新基準測試震撼了人工智能界。這項測試由知名AI研究者François Chollet聯合發起,旨在考察人工智能模型的通用智能水平。結果令人震驚,當前主流AI模型的平均得分僅為1%至1.3%,而人類的平均得分高達60%。這項測驗不僅考察AI的跨領域推理能力,還首次引入「效率」指標,強調在有限資源下快速掌握新技能的能力。 ARC-AGI-2測試通過多色方格組成的動態謎題,要求AI從未見過的模式中推導答案。為防止過度依賴記憶來解決問題,測試設置了嚴格的規則:禁止訓練數據複用和算力成本約束,每題不得超過$0.42的算力消耗。相比之下,OpenAI在ARC-AGI-1測試中每題的算力成本曾高達數千美元。 開發者們面臨的是一個挑戰賽:在每題$0.42的算力約束下,要求模型達到85%的準確率。這個低成本高難度的挑戰很可能推動小參數模型和新型訓練範式的突破。 OpenAI近期推出的o3模型雖然在某些基準測試中取得良好成績,例如在ARC-AGI中接近87.5%的分數,但在新版測試ARC-AGI-2中卻遇到重大挑戰。這一系列結果表明,當前AI模型仍遠未達到真正的通用智能。 業界領導者現在強調,以效率和創造力為核心的新型AI評估體系。這不僅將改變智能的衡量標準,也將推動AI技術的發展朝向更高效和可行的方向。 未來,人工智能的進步不僅在於能否克服當前的技術瓶頸,更要依靠創新思維來突破理論和實踐的界限。因此,這場向AGI進化的路上,需要更多實際行動和嚴謹的scientifc評估。 #人工智能 #AGI測試 #效率至上 #創造力革命 #智能未來
✨你分得出哪些聲音是AI嗎?✨ 本片深度實測 OpenAI 最新 GPT-4o mini TTS 語音模型:免費開放、無需VPN、支援廣東話+多國語言,還能控制語調、情緒、速度、聲線🎙️由 Dr. Jackei 親自示範,教你如何操作、玩出創意角色聲線,甚至結合 API 做語音開發🔥 📌立即試玩:https://openai.fm 📌訂閱 Dr. Jackei 頻道 ▶ https://www.youtube.com/@DrJackeiWong?sub_confirmation=1 📌更多 AI 工具教學 ▶...
近期,OpenAI推出了最新的AI模型,進一步提升了語音轉文字(transcription)和聲音生成(voice generation)的能力。這些升級不僅提高了模型的準確性和自然度,也為開發者提供了更多的自定義選擇。讓我們一起探索這些新模型的優勢和潛在應用。 首先,OpenAI的新模型是為了實現其「代理」(agentic)願景而設計的,這意味著AI系統將能夠獨立地代表用戶完成各種任務。OpenAI的產品負責人Olivier Godemont表示,未來幾個月內,我們將會看到更多這樣的AI代理出現。這些代理將會在各種情境中提供有用的、可靠的服務。 OpenAI的最新文本轉語音模型——gpt-4o-mini-tts,能夠生成更自然、更細膩的語音。開發者可以輕鬆地指導這個模型以不同的風格發音,例如「像瘋狂科學家」或「像一位平靜的正念教師」。這使得語音生成更加多樣化和可控。 此外,OpenAI還推出了兩個新的語音轉文字模型:gpt-4o-transcribe和gpt-4o-mini-transcribe。這些模型取代了之前的Whisper系統,能夠更準確地捕捉不同口音和語調,尤其是在嘈雜的環境中。Whisper系統曾經存在一個問題,即它有時會「幻覺」出不存在的詞彙或整段文字,而新的模型則大大減少了這種情況,提高了整體的可靠性。 然而,這些模型在不同語言上的表現仍有所不同。根據OpenAI的內部測試,gpt-4o-transcribe在印度和德拉維語系語言(如泰米爾語、泰盧固語、馬拉雅拉姆語和卡納達語)上的字錯誤率約為30%,意味著每10個字中有3個可能與人工轉錄有所不同。儘管如此,這仍然是相比Whisper的一大進步。 OpenAI的這些新模型不會像Whisper那樣以開源方式公開。這是因為新的模型體積更大,需要更強大的計算資源,因此不適合在個人設備上運行。OpenAI希望在開源模型的選擇上更加謹慎,以確保模型的實用性和可靠性。 這些AI模型的升級對於各個行業都具有深遠的影響。從客戶支持到內容創作,AI代理可以通過自然語言與用戶進行互動,提供更人性化的服務。未來,隨著AI技術的不斷進步,我們可以期待看到更多創新的應用和服務。 最後,讓我們期待這些AI技術如何改變我們的生活和工作方式。隨著AI代理的出現,我們將會看到更多智能化的解決方案出現在各個領域。 #AI技術 #語音轉文字 #聲音生成 #OpenAI #AI代理
隨著人工智慧(AI)技術的不斷進步,OpenAI的研究領導Noam Brown最近表示,某些AI「推理」模型本可以在二十年前就問世。這一觀點引發了廣泛的討論,讓我們來探索這個領域的發展和未來前景。 在近期的Nvidia GTC會議上,Noam Brown分享了他對AI推理模型的看法。他認為,早期的研究方向被忽視,導致這些模型的發展延遲了。Brown指出,人類在面臨艱難情況時會花費大量時間思考,這種「思考」過程對AI來說同樣重要。他提到的OpenAI o1模型正是基於這種理念,通過在執行時間進行額外的計算來模擬「思考」過程,從而提高模型的準確性和可靠性,特別是在數學和科學領域。 Brown強調,雖然傳統的預訓練方法(即使用越來越大的數據集和計算資源)仍然重要,但現在AI實驗室正將注意力轉向「執行時間推理」(test-time inference)。這兩種方法是互補的,前者提供基礎知識,後者則在使用時進行深入思考。這種轉變使得AI模型能夠更好地應對複雜問題。 OpenAI近期推出的o3-mini模型就是這一理念的延伸。這個模型在科學、數學和編程問題上表現出色,且保持了低成本和快速的特點。開發者可以通過API訪問這個模型,並根據問題的難度選擇不同的推理強度。這種設計讓使用者能夠根據具體需求調整模型的運行方式。 Noam Brown還提到,學術界在AI基準測試方面可以發揮重要作用。目前AI基準測試的狀態不佳,往往測試的是一些冷門知識,與實際應用關係不大。這導致了對AI模型能力的誤解和混淆。Brown認為,學術界可以在這方面做出貢獻,因為改進基準測試不需要大量的計算資源。 在AI技術快速發展的今天,推理模型的出現標誌著AI研究的新篇章。從2020年到2023年,AI實驗室主要通過增加數據和計算資源來提升模型性能。但隨著這種「蛮力」方法的回報逐漸減少,AI實驗室開始轉向在執行時間進行更多的推理。這種方法使得模型能夠在使用時生成多個思路,選擇最優解決方案,或者遵循邏輯推理並在遇到死胡同時迴溯。這需要大量的記憶和計算資源。 OpenAI的o1系列模型是這一方向的早期嘗試,但它們的運行成本高且需要較長時間才能得出答案。相比之下,o3系列模型在保持推理能力的同時,能夠更快地返回答案,並且使用較少的計算資源。這標誌著AI技術在效率和智能性方面的雙重提升。 未來,AI推理模型的發展將繼續推動AI技術的進步。隨著計算資源的不斷增加和成本的降低,AI模型將能夠解決更加複雜的問題。Noam Brown的觀點為我們提供了對AI未來發展的新視角,讓我們看到推理模型早期問世的可能性和未來的廣闊前景。 #AI智慧革命 #OpenAI #推理模型 #未來科技
在科技飛速發展的時代,人工智慧(AI)技術正以前所未有的速度改變我們的生活。然而,隨著AI的進步,潛在的風險也逐漸浮現。近日,OpenAI公開呼籲禁止一種名為DeepSeek的深度學習技術,並警告其可能被濫用,甚至對社會造成嚴重危害。這一聲明引發了全球科技界的廣泛討論,究竟DeepSeek是什麼?它為何被視為潛在威脅?讓我們深入探討這一技術的雙面性。 DeepSeek是一種基於深度學習的AI技術,能夠通過大量數據訓練,快速識別並解決複雜問題。其應用範圍廣泛,從醫療診斷到金融分析,再到自動駕駛,DeepSeek都展現出強大的潛力。然而,正是這種強大的能力,讓OpenAI對其潛在風險感到擔憂。OpenAI指出,DeepSeek的技術核心在於其高度的自主學習能力,這使得它能夠在極短時間內掌握並執行複雜任務。然而,這種能力也可能被惡意利用,例如用於開發更具破壞性的網路攻擊工具,甚至被用於操控輿論或進行大規模的社會操控。 OpenAI的聲明中提到,DeepSeek的技術一旦落入不法分子手中,可能會被用於製造假新聞、操縱金融市場,甚至開發出無法被現有安全系統檢測到的惡意軟體。這種技術的濫用不僅會對個人隱私造成威脅,還可能對國家安全構成嚴重挑戰。更令人擔憂的是,DeepSeek的自主學習能力可能使其在未來超越人類的控制範圍,進而引發不可預測的後果。 然而,並非所有人都對OpenAI的呼籲表示認同。一些科技專家認為,禁止DeepSeek技術可能會阻礙AI領域的創新與發展。他們指出,任何技術都有其雙面性,關鍵在於如何制定有效的監管措施,而不是一味禁止。例如,可以通過建立國際性的AI技術使用規範,限制DeepSeek在特定領域的應用,同時鼓勵其在醫療、教育等正面領域的發展。 此外,DeepSeek的支持者還強調,這項技術在解決全球性問題方面具有巨大潛力。例如,在應對氣候變化的過程中,DeepSeek可以通過分析大量氣象數據,幫助科學家更準確地預測自然災害,從而提前採取應對措施。在醫療領域,DeepSeek的快速診斷能力可以大幅提升疾病的早期檢測率,挽救無數生命。因此,如何在風險與機遇之間找到平衡,成為當前AI技術發展的核心議題。 OpenAI的呼籲無疑為全球科技界敲響了警鐘。隨著AI技術的不斷進步,如何確保其安全與可控性,已成為一個迫在眉睫的問題。無論是支持還是反對DeepSeek技術,各方都應正視其潛在風險,並積極尋求解決方案。只有這樣,我們才能在享受科技帶來便利的同時,避免其可能引發的災難性後果。 精選重點: 1. DeepSeek是一種強大的深度學習技術,具有廣泛的應用潛力,但也可能被惡意利用。 2. OpenAI呼籲禁止DeepSeek,擔心其可能被用於網路攻擊、輿論操控等危害社會的行為。 3. 科技界對於是否禁止DeepSeek存在分歧,部分專家認為應通過監管而非禁止來平衡風險與機遇。 #人工智慧 #深度學習 #科技風險 #AI監管 #DeepSeek
在科技飛速發展的時代,人工智慧(AI)已成為全球關注的焦點。近日,OpenAI 推出了一項名為「博士級AI」的計畫,每月收費高達2萬美元,這一消息迅速在科技圈引發熱烈討論。究竟什麼是「博士級AI」?它與現有的AI技術有何不同?這項計畫又將如何改變未來的生活與工作模式?讓我們一探究竟。 OpenAI 的這項計畫被視為AI技術的一次重大突破。所謂「博士級AI」,指的是具備高度專業知識與深度學習能力的AI系統,能夠處理複雜的科學研究、技術開發甚至戰略決策等任務。與現有的AI模型相比,這種AI不僅能提供更精確的分析與預測,還能根據特定領域的需求進行客製化調整,從而滿足高端用戶的需求。 這項計畫的收費標準也成為討論的焦點。每月2萬美元的價格,對於一般企業或個人來說無疑是一筆不小的開支。然而,OpenAI 強調,這項服務主要針對需要高度專業化AI支援的機構,例如大型科技公司、研究實驗室或政府部門。這些用戶通常需要處理海量數據、進行複雜的模擬實驗或制定長期的戰略規劃,而「博士級AI」正是為此而生。 從技術層面來看,「博士級AI」的核心優勢在於其強大的學習能力與適應性。它不僅能快速吸收大量專業知識,還能根據用戶的反饋不斷優化自身的表現。舉例來說,在醫學領域,這種AI可以協助研究人員分析病患數據,提出個性化的治療方案;在金融領域,它可以預測市場趨勢,幫助投資者做出更明智的決策。這種高度專業化的應用場景,正是「博士級AI」與普通AI的最大區別。 然而,這項計畫也引發了一些質疑與擔憂。首先,高昂的價格是否會讓這項技術成為少數人的專利,從而加劇科技資源分配的不平等?其次,AI的深度學習能力是否會對人類的工作機會造成威脅?這些問題都值得進一步探討。OpenAI 表示,他們將持續關注這些議題,並致力於推動AI技術的公平與透明應用。 無論如何,OpenAI 的「博士級AI」計畫無疑為AI技術的發展開闢了新的方向。隨著這項技術的普及,未來的生活與工作模式可能會發生翻天覆地的變化。從醫療到教育,從金融到製造,AI的應用將無處不在。而對於那些願意投資於這項技術的機構來說,這或許是一個不可多得的機會。 精選重點: 1. OpenAI 推出的「博士級AI」計畫每月收費2萬美元,主要針對需要高度專業化AI支援的機構。 2. 這種AI具備強大的學習能力與適應性,能夠處理複雜的科學研究、技術開發與戰略決策等任務。 3. 儘管這項計畫引發了資源分配與工作機會的擔憂,但它也為AI技術的未來發展提供了新的可能性。 #人工智慧 #OpenAI #博士級AI #科技趨勢 #AI應用