根據外媒semiengineering.com的報導,中國正積極投入生成式 AI 領域,預計未來五年內投資將以 86% 的複合年增長率快速成長。主要源於中國對技術自主的重視,從應用到晶片,都強調本土技術的開發。
報導指出,中國的自有實驗室為 AI 技術做出了大量的貢獻,尤其是在開源 AI 生態系統方面。在測試平台中,中國模型在特定子任務中表現出色,與全球頂級模型不相上下。此外,在中文理解等子領域中,中國的模型也具有強大的競爭力。另外在為邊緣設備開發高效模型方面,中國也取得進展,例如 MiniCPM3-4B。
中國的基礎模型在評測中表現良好,例如 Qwen2.5-72B-instruct 和 GLM-4-plus 等模型在指令遵循、長文本生成和結構化數據理解方面均有顯著提升。最新的 Qwen 2.5 包含多達 18 萬億個詞元,並且這些模型已被證明對不同的系統提示具有彈性,增強了它們在各種應用中的實用性。
以騰訊的 Hunyuan-Large為例,其擁有 3890 億個參數、520 億個激活參數,並且能夠容納多達 256,000 個詞元,是最大的開源 Transformer 混合專家模型,在語言理解、邏輯推理等基準測試中表現出色,甚至超過許多更大的模型。
另一方面,中國擁有活躍的開源 LLM 社區,例如 DeepSeek-V2,這是一款擁有 2360 億個參數的混合專家語言模型,以其經濟的訓練成本和高效的推理能力而備受讚譽。這些模型支持通用的會話功能、強大的代碼處理能力,並且更好地與人類偏好保持一致。