今年以来开源大模型赛道的发展成效,标志着我国在这一领域正处于从“追随者”到“引领者”的跨越式发展阶段。
近些年,我国在开源大模型领域的技术突飞猛进,生态规模迅速扩大,涌现出诸多优秀的开源项目,在应用性能方面逐渐赶上国际前沿大模型,全球影响力凸显。例如,深度求索的DeepSeek系列大模型的技术指标位居全球前列;阿里的Qwen系列大模型全球下载量已突破2亿次,衍生模型数量超过10万个,超越Meta的Llama成为全球最大开源模型族群。
面对全球人工智能行业激烈竞争,我国企业注重采取差异化发展战略,着重提升产品的性价比。主要体现为:一是低成本高效能。DeepSeek的R1模型预训练费用只有557.6万美元,不到OpenAI GPT-4o模型的十分之一,推理成本也大幅降低。二是开源发展策略。与其他AI巨头形成鲜明对比,我国企业坚持全球开源共享技术策略,大部分开源大模型支持免费商用和衍生开发,有利于降低企业的研发成本,吸引大量技术开发者加入其产业生态。三是多模态融合发展。我国开源大模型注重支持跨模态信息整合,有助于提升开源大模型与其他领域的融合程度。目前,我国开源大模型已经深入千行百业,在制造业、电力、医疗、教育、金融等领域都有应用,为各行业的智能化转型提供了支持,展现出强大的赋能潜力。
也要看到,我国在算力、芯片、数据、安全等方面仍面临一定风险与挑战。比较突出的问题是,我国算力规模亟待提高,高性能AI芯片过度依赖进口。尽管目前我国算力规模已居全球第二位,但是开源大模型的算力需求呈指数级增长,未来的算力缺口将会制约我国开源大模型产业高速发展。数据规范化程度亟待提升,大模型安全治理机制滞后。开源大模型训练需要使用海量数据,但是在数据获取的便利性、数据来源的合法性、数据质量的可靠性、数据使用的安全性等方面仍然面临不小挑战,开源大模型在数据泄露与滥用、数据版权等方面的风险凸显。尽管《生成式人工智能服务管理暂行办法》已出台,但在实操中缺乏统一标准和具体指南,亟待建立行业安全治理机制。