以高质量数据“喂养”AI,提升模型智能成行业新焦点
在人工智能领域,数据的质量正被视作决定模型“聪明”程度的关键。8月28日,一场以高质量数据集为主题的交流活动在贵阳举行。与会专家从学术界和企业界角度,就数据安全制度构建、技术防护手段升级与治理模式创新等议题展开讨论,为推动高质量数据集建设提供了思路与路径。
中国工程院院士吴世忠在发言中指出,我国在大模型训练方面拥有包括文献、方言、行业数据、民俗文化在内的多样化语料优势,资源总量位居国际前列。但他也强调,当前仍面临数据来源合规性与内容真实性等挑战。他提出应推进数据分级分类管理,强化脱敏公共数据的溯源能力,以保障大模型数据使用的安全可控。
中国移动数智化部副总经理陶涛则从实践角度指出,尽管数据是AI进化的重要基础,但目前仍存在私有数据开发利用不充分、质量差异大、相关技术尚未成熟等瓶颈。为支持高质量数据流动与运用,中国移动已建成集采集、传输、存储、计算与应用于一体的基础设施。目前每日采集数据量接近6PB,实时接入超2亿条/秒,涵盖50余类数据源。此外,公司还构建了覆盖全国的传输网络,以极高效率完成跨域数据调度——例如在5000公里距离传输1TB数据仅需两分钟。
活动同时公布了104个“高质量数据集典型案例”,覆盖农业、医疗、通信等多个垂直领域,显示出数据与行业深度融合的广泛前景。为进一步促进行业协作,中国信通院、中国移动等机构共同发起“高质量数据集领航计划”,旨在凝聚产业共识,构建开放生态,助推人工智能技术加速落地。
数据显示,截至2025年上半年,全国高质量数据集总量已突破3.5万个,累计交易额近40亿元。作为国家大数据综合试验区,贵州已发展200余家数据服务企业,发布金融、工业、医疗、商贸等领域的高质量数据集900余个,持续为AI训练提供优质“数据燃料”。
更多文章
-
科技力量重塑县域发展 苍南多领域革新显实效
在推动县域经济提质增效的过程中,强化科技创新是突破约束、激发潜能的核心路径。位于浙江省南端的苍南县,以实际探索提供了有力例证。过去,苍南的产业升级曾遇阻力:印刷包装业受制于技术升级缓慢与低水平竞争,农业生产方式亟待革新,加之沿海地带地理环境复杂、气象灾害多发,为基础设施的稳定运行带来考验。应对这些挑
-
鄱阳湖候鸟越冬迎来高峰 智能监测护航迁徙之路
冷空气频繁南袭之际,我国第一大淡水湖鄱阳湖迎来大批迁飞候鸟。白鹤、东方白鹳等多种珍稀物种已陆续抵达,将在此度过寒冬。江西省林业部门近日透露,当地正借助人工智能辨识鸟类等智能技术,保障候鸟平安越冬。作为全球重要湿地与候鸟栖息枢纽,鄱阳湖每年冬季吸引数以十万计的候鸟前来越冬。这里汇聚了世界上绝大多数的白
-
国产双模型亮相各展所长 推动开源生态与实用化进程
近日,深度求索公司正式推出两款全新模型:DeepSeek-V3.2 与其特别版本Speciale。评估显示,V3.2在多项推理测试中表现突出,已与国际顶尖闭源模型处于相近水准,再次展现了国产人工智能技术的突破。一、两款模型各有所长行业专家分析指出,新发布的标准版模型如同一位“高效务实”的助手。它侧重于综合性能与实用价值,拥有
-
沪上脑机交互盛会展现前沿突破 意念操控与视觉重建点亮希望
近日,“脑智天地”脑机接口产业集聚区迎来全国科研团队与企业代表,集中展示了该领域的最新进展。本次大会主题聚焦脑科学与智能技术的融合,依托本地医疗与科研资源,旨在构建具有国际影响力的研发与产业中心。一、用意念驱动外部装置脑机交互技术根据实施方式可分为植入式与非植入式。前者通过手术在脑内安置信号采集装置
-
警惕智能时代新骗局:五类AI诈骗手法深度拆解
伴随人工智能的广泛应用,一些不法分子借此编织出更具迷惑性的骗局,令公众防不胜防。这些诈骗手段隐蔽性强、危害性大,已在全国多地出现,不少人因此遭受财产损失。面对高度仿真的技术包装,仅靠传统警惕心已难以应对,必须认清其核心套路,才能有效防范。本文将揭示当前AI诈骗中五种典型的陷阱模式,帮助读者筑牢防线:一
