根据外媒semiengineering.com的报导,中国正积极投入生成式 AI 领域,预计未来五年内投资将以 86% 的复合年增长率快速成长。主要源於中国对技术自主的重视,从应用到晶片,都强调本土技术的开发。
报导指出,中国的自有实验室为 AI 技术做出了大量的贡献,尤其是在开源 AI 生态系统方面。在测试平台中,中国模型在特定子任务中表现出色,与全球顶级模型不相上下。此外,在中文理解等子领域中,中国的模型也具有强大的竞争力。另外在为边缘设备开发高效模型方面,中国也取得进展,例如 MiniCPM3-4B。
中国的基础模型在评测中表现良好,例如 Qwen2.5-72B-instruct 和 GLM-4-plus 等模型在指令遵循、长文本生成和结构化数据理解方面均有显着提升。最新的 Qwen 2.5 包含多达 18 万亿个词元,并且这些模型已被证明对不同的系统提示具有弹性,增强了它们在各种应用中的实用性。
以腾讯的 Hunyuan-Large为例,其拥有 3890 亿个叁数、520 亿个激活叁数,并且能够容纳多达 256,000 个词元,是最大的开源 Transformer 混合专家模型,在语言理解、逻辑推理等基准测试中表现出色,甚至超过许多更大的模型。
另一方面,中国拥有活跃的开源 LLM 社区,例如 DeepSeek-V2,这是一款拥有 2360 亿个叁数的混合专家语言模型,以其经济的训练成本和高效的推理能力而备受赞誉。这些模型支持通用的会话功能、强大的代码处理能力,并且更好地与人类偏好保持一致。