建设高质量数据集 夯实人工智能发展的“底座”——三论深入贯彻落实第九届数字中国建设峰会精神

人工智能的浪潮席卷全球,正以前所未有的速度重塑世界。在第九届数字中国建设峰会即将召开前夕,一个令人振奋的数据引起了广泛关注:截至2025年底,全国已建成的高质量数据集超过10万个,总体量超过890PB;今年3月,我国日均Token调用量超过140万亿,相比2024年初增长了1000多倍。这一惊人增长的背后,折射出中国人工智能产业已从“算力竞赛”迈向“数据决胜”的新阶段。刘烈宏局长在发布会上强调,要实施高质量数据集建设六大专项行动。这深刻启示我们:只有建设高质量的数据集,才能夯实人工智能创新发展的“底座”,赢得未来竞争的主动权。

高质量数据集是人工智能的“粮食”。算力是引擎,算法是方向盘,而数据则是燃料。没有高质量的“粮食”,人工智能这台“大脑”就无法高效运转,甚至会产生“幻觉”和偏差。当前,我国人工智能发展正处于从“大炼模型”向“炼大模型”再向“用大模型”转变的关键时期,对高质量数据的需求呈爆发式增长。面对数据供给“小而散”、标注能力不足等短板,国家数据局协同各方深入实施新一轮高质量数据集建设行动计划,正是抓住了问题的“牛鼻子”。我们要像重视粮食安全一样重视数据安全和数据质量,通过“强基扩容、标注攻坚、提质增效”等举措,打造技术可行、实用便捷、质量保障的AI-Ready高质量数据集,确保人工智能“吃得饱”、“吃得好”。

建设高质量数据集,必须坚持场景牵引。数据集不是空中楼阁,必须根植于实体经济的沃土。峰会透露,下一步将推动“人工智能+”行动到哪里,行业高质量数据集的建设和推广就要到哪里。这要求我们必须打破数据与行业的“玻璃门”,聚焦知识密集型和技术驱动型领域,推动数据与农业、工业、医疗等深度融合。例如,通过建设工业制造领域的高质量数据集,可以实现对生产流程的精准优化;通过建设医疗影像数据集,可以辅助医生进行更精准的诊断。我们要以场景需求为牵引,加快推进先行先试,让数据在解决行业痛点中实现价值变现,避免出现“数据泡沫”。

建设高质量数据集,必须构建繁荣的生态。高质量数据集的建设是一项复杂的系统工程,需要政府、企业、科研机构和社会各界的共同努力。国家数据局已遴选了72家“链主”单位,布局了多个数据标注产业创新试验区,并推动数据在交易所挂牌交易。这构建了一个多方参与、联合攻关、共建共享的生态体系。我们要继续发挥“链主”企业的带动作用,鼓励数据流通服务平台企业提供多样化服务,推动形成“为高质量数据付费”的市场共识。同时,要加强数据标注产业的人才培养,提升数据标注的标准化、规范化水平,为人工智能发展提供源源不断的“优质饲料”。

基础不牢,地动山摇。在人工智能发展的关键窗口期,我们要以第九届数字中国建设峰会为新起点,把高质量数据集建设作为一项基础性、战略性工程来抓。通过实施六大专项行动,推动数据要素供给实现量质双升,为人工智能创新发展提供坚实支撑,为数字中国建设注入强劲动力,让中国在新一轮科技革命和产业变革中勇立潮头!

展开阅读全文

更新时间:2026-03-26

标签:科技   夯实   人工智能   底座   峰会   中国   精神   数字   数据   模型   产业   精准   行业   玻璃门

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top