語音合成 Archives - Dr. Jackei 科技生活日誌

小米 MiMo‑V2‑TTS 登場：細粒度情感控制，讓 AI Agent 說話更有人味？

by Dr. Jackei Wong

March 23, 2026

科技新聞

小米 MiMo‑V2‑TTS 登場：細粒度情感控制，讓 AI Agent 說話更有人味？

MiMo‑V2‑TTS 在做什麼：把「會說話」提升到「會表達」語音合成（TTS）早已不稀奇，但多數產品仍停留在「字念得準、聲音夠順」；真正讓人感到自然的，往往是語氣、停頓、輕重音、情緒強度這些細節。小米推出的 AI 語音大模型 MiMo‑V2‑TTS，主打細粒度情感控制，目的就是讓語音不只像真人，更能在不同情境下「表達得像真人」。對正在發展 AI Agent（能自主執行任務的助理/代理）的人來說，這個方向很關鍵：Agent 若只會冷冰冰地回覆，互動體驗很難跨過「工具」門檻；而一旦語音能帶出安撫、提醒、關懷或緊迫感，使用者更容易把它當成可溝通的「服務角色」。情感控制為何重要：它影響的不只是好聽細粒度情感控制不只是把聲音調成「開心、難過」這種粗分類，而是更接近人類語音的連續光譜，例如：同一句話在不同任務下需要不同語氣意圖（提醒、道歉、鼓勵、警示）情緒不只種類，還有強度與變化曲線（先平靜、後堅定）更自然的韻律與停頓，能降低「機器感」與聽覺疲勞當語音被用在客服、醫療提醒、車載助理或兒童教育時，語氣的好壞會直接影響信任感、理解度與完成率。換句話說，TTS 從「聲音輸出」走向「互動品質控制」。對哪些人最有感：Agent、客服、內容與遊戲 1) AI Agent 與智慧助理能依情境調整語氣的 TTS，會讓...

小米 MiMo‑V2‑TTS 登場：細粒度情感控制，讓 AI Agent 說話更有人味？

立即訂閱Dr. Jackei AI電子報

Dr. Jackei

專業服務

科技內容

聯絡及其他