以高质量数据“喂养”AI,提升模型智能成行业新焦点
在人工智能领域,数据的质量正被视作决定模型“聪明”程度的关键。8月28日,一场以高质量数据集为主题的交流活动在贵阳举行。与会专家从学术界和企业界角度,就数据安全制度构建、技术防护手段升级与治理模式创新等议题展开讨论,为推动高质量数据集建设提供了思路与路径。
中国工程院院士吴世忠在发言中指出,我国在大模型训练方面拥有包括文献、方言、行业数据、民俗文化在内的多样化语料优势,资源总量位居国际前列。但他也强调,当前仍面临数据来源合规性与内容真实性等挑战。他提出应推进数据分级分类管理,强化脱敏公共数据的溯源能力,以保障大模型数据使用的安全可控。
中国移动数智化部副总经理陶涛则从实践角度指出,尽管数据是AI进化的重要基础,但目前仍存在私有数据开发利用不充分、质量差异大、相关技术尚未成熟等瓶颈。为支持高质量数据流动与运用,中国移动已建成集采集、传输、存储、计算与应用于一体的基础设施。目前每日采集数据量接近6PB,实时接入超2亿条/秒,涵盖50余类数据源。此外,公司还构建了覆盖全国的传输网络,以极高效率完成跨域数据调度——例如在5000公里距离传输1TB数据仅需两分钟。
活动同时公布了104个“高质量数据集典型案例”,覆盖农业、医疗、通信等多个垂直领域,显示出数据与行业深度融合的广泛前景。为进一步促进行业协作,中国信通院、中国移动等机构共同发起“高质量数据集领航计划”,旨在凝聚产业共识,构建开放生态,助推人工智能技术加速落地。
数据显示,截至2025年上半年,全国高质量数据集总量已突破3.5万个,累计交易额近40亿元。作为国家大数据综合试验区,贵州已发展200余家数据服务企业,发布金融、工业、医疗、商贸等领域的高质量数据集900余个,持续为AI训练提供优质“数据燃料”。
更多文章
-
高铁如何实现“自由呼吸”?车内空气舒适的科技真相
当我们步入高铁车厢,常常会感到空气清新、温湿宜人,既不会闷热也不干燥。在密闭无窗的车厢内,这样的舒适体验是如何实现的?其奥秘源于一套智能、高效的车内空气循环系统。位于每节车厢顶部的空调机组,堪称高铁的“呼吸中枢”。这套系统采用“新风+回风”混合调节机制,持续将外部新鲜空气引入车内,并与内部既有空气混合
-
中国科学家突破铁基超导线材性能极限,载流能力创世界纪录
近日,中国科学院电工研究所马衍伟研究员团队在材料科学领域取得重大进展。该团队开发出一种创新工艺策略,显著提升了采用低成本粉末装管法制备的铁基超导材料的载流性能,相关成果已在国际知名期刊《先进材料》上发表。铁基超导材料因其上临界磁场高、各向异性弱且制造成本相对较低,被视为下一代高场应用——如高能粒子加
-
联想展示近200项AI创新成果,全面推动“人工智能+”行业落地
8月27日,2025联想集团创新开放日正式拉开帷幕。本届活动以“创新ING 热AI进行时”为主题,联想集团集中呈现了近200项人工智能前沿技术及相关终端产品,系统展示其在“人工智能+”实践中的多项突破,标志着企业正式迈入AI技术的大规模“价值兑现”阶段。此次开放日凸显了联想构建的一套完整、可部署、并可灵活扩展的AI交付体
-
以高质量数据“喂养”AI,提升模型智能成行业新焦点
在人工智能领域,数据的质量正被视作决定模型“聪明”程度的关键。8月28日,一场以高质量数据集为主题的交流活动在贵阳举行。与会专家从学术界和企业界角度,就数据安全制度构建、技术防护手段升级与治理模式创新等议题展开讨论,为推动高质量数据集建设提供了思路与路径。中国工程院院士吴世忠在发言中指出,我国在大模型训
-
以人工智能驱动科研革新,构筑智能科学新生态
人工智能(AI)与科学研究的紧密结合,正引领一场影响深远的科技变革。我国在“AI for Science”领域积极布局并持续加大投入,其战略方向与发展蓝图正逐步明晰。近期,国务院发布《关于深入实施“人工智能+”行动的意见》,明确提出推进“人工智能+”科学技术计划,以加快科学发现节奏,率先构建以AI为核心的新型科研与研发