以高质量数据“喂养”AI,提升模型智能成行业新焦点
在人工智能领域,数据的质量正被视作决定模型“聪明”程度的关键。8月28日,一场以高质量数据集为主题的交流活动在贵阳举行。与会专家从学术界和企业界角度,就数据安全制度构建、技术防护手段升级与治理模式创新等议题展开讨论,为推动高质量数据集建设提供了思路与路径。
中国工程院院士吴世忠在发言中指出,我国在大模型训练方面拥有包括文献、方言、行业数据、民俗文化在内的多样化语料优势,资源总量位居国际前列。但他也强调,当前仍面临数据来源合规性与内容真实性等挑战。他提出应推进数据分级分类管理,强化脱敏公共数据的溯源能力,以保障大模型数据使用的安全可控。
中国移动数智化部副总经理陶涛则从实践角度指出,尽管数据是AI进化的重要基础,但目前仍存在私有数据开发利用不充分、质量差异大、相关技术尚未成熟等瓶颈。为支持高质量数据流动与运用,中国移动已建成集采集、传输、存储、计算与应用于一体的基础设施。目前每日采集数据量接近6PB,实时接入超2亿条/秒,涵盖50余类数据源。此外,公司还构建了覆盖全国的传输网络,以极高效率完成跨域数据调度——例如在5000公里距离传输1TB数据仅需两分钟。
活动同时公布了104个“高质量数据集典型案例”,覆盖农业、医疗、通信等多个垂直领域,显示出数据与行业深度融合的广泛前景。为进一步促进行业协作,中国信通院、中国移动等机构共同发起“高质量数据集领航计划”,旨在凝聚产业共识,构建开放生态,助推人工智能技术加速落地。
数据显示,截至2025年上半年,全国高质量数据集总量已突破3.5万个,累计交易额近40亿元。作为国家大数据综合试验区,贵州已发展200余家数据服务企业,发布金融、工业、医疗、商贸等领域的高质量数据集900余个,持续为AI训练提供优质“数据燃料”。
更多文章
-
浙江科创格局焕新:企业梯队成势 创新生态跃升
当时间的指针行至2025年末,浙江的创新图景正在经历一场深刻的演化。年初,一组被称为“杭州六小龙”的科技企业崭露头角,以其突破性的技术与市场表现,拉开了这一年的序幕。它们的集体涌现与稳健成长,不仅成为年度热词,更标志着一个以高潜力科技企业为主角的发展新篇章已然开启。然而,故事并未止步于此。在虚拟现实、智
-
沪举办智能教育研讨会 共话AI推动教学创新路径
近日,上海举办了一场围绕智能技术与教育融合发展的学术会议。与会专家与教师共同探讨了如何借助新兴科技推动教学创新,构建适应数字时代的教育新环境。本次活动由多家教育研究机构、学术团体及企业联合筹办。会上,上海市教育学会负责人指出,人工智能正在深刻改变传统教学形式,推动教育向个性化和均衡化的方向发展。来自
-
制造企业理性布局人工智能 技术扎根产业求实效
当前,人工智能正从概念探讨加速融入实体经济,成为驱动制造业革新的关键力量。在氟化工行业处于领先地位的多氟多公司,较早启动了智能化转型,构建了一套涵盖数据基础、场景应用与产业融合的完整实践体系。位于河南的氟基新材料研发基地内,一面醒目的元素周期表勾勒出企业的技术布局——其产品深度关联了表上前段多个关键
-
人工智能角逐推升资金投入,全球数据枢纽布局加速扩张
标普全球最新统计指出,本年首十一月,全球范围投向数据枢纽的资金累计已接近610亿美元,超越上年总额,刷新历史纪录。行业分析指出,科技领军企业及基建开发商正全力扩充数据处理能力,以应对由智能技术发展带来的庞大运算需求。一、“当前投入仅为开端”数据显示,数据枢纽建设正进入高速扩张阶段。今年前十一月达成的上百
-
技术赋能养殖业 松桃智能养鸡助农增收
在松桃太平营街道的一家禽苗培育场内,近期一批禽苗正装箱运往外地。养殖区里,设备自动运转,环境调控系统持续监测,确保孵化条件稳定。这座现代化养殖场目前有大量种蛋处于孵化阶段,雏禽不断破壳,展现着当地养殖业的活力。自引入重点企业后,松桃蛋鸡养殖逐步走向科技化与规范管理。通过采用自动喂养、光照调节、环境监
