以高质量数据“喂养”AI,提升模型智能成行业新焦点
在人工智能领域,数据的质量正被视作决定模型“聪明”程度的关键。8月28日,一场以高质量数据集为主题的交流活动在贵阳举行。与会专家从学术界和企业界角度,就数据安全制度构建、技术防护手段升级与治理模式创新等议题展开讨论,为推动高质量数据集建设提供了思路与路径。
中国工程院院士吴世忠在发言中指出,我国在大模型训练方面拥有包括文献、方言、行业数据、民俗文化在内的多样化语料优势,资源总量位居国际前列。但他也强调,当前仍面临数据来源合规性与内容真实性等挑战。他提出应推进数据分级分类管理,强化脱敏公共数据的溯源能力,以保障大模型数据使用的安全可控。
中国移动数智化部副总经理陶涛则从实践角度指出,尽管数据是AI进化的重要基础,但目前仍存在私有数据开发利用不充分、质量差异大、相关技术尚未成熟等瓶颈。为支持高质量数据流动与运用,中国移动已建成集采集、传输、存储、计算与应用于一体的基础设施。目前每日采集数据量接近6PB,实时接入超2亿条/秒,涵盖50余类数据源。此外,公司还构建了覆盖全国的传输网络,以极高效率完成跨域数据调度——例如在5000公里距离传输1TB数据仅需两分钟。
活动同时公布了104个“高质量数据集典型案例”,覆盖农业、医疗、通信等多个垂直领域,显示出数据与行业深度融合的广泛前景。为进一步促进行业协作,中国信通院、中国移动等机构共同发起“高质量数据集领航计划”,旨在凝聚产业共识,构建开放生态,助推人工智能技术加速落地。
数据显示,截至2025年上半年,全国高质量数据集总量已突破3.5万个,累计交易额近40亿元。作为国家大数据综合试验区,贵州已发展200余家数据服务企业,发布金融、工业、医疗、商贸等领域的高质量数据集900余个,持续为AI训练提供优质“数据燃料”。
更多文章
-
AI基建盛宴背后:云厂商陷入增收不增利困境
在全球AI浪潮的推动下,科技企业正以前所未有的力度投入算力基础设施建设。然而,在这片繁荣景象背后,一个关键问题逐渐浮出水面:云服务商是否真正从中获得了可观收益?近期美股市场上,芯片制造商与云服务商的股价表现形成鲜明对比。英伟达、AMD等芯片企业股价持续走高,而云服务商的盈利状况却引发担忧。据披露的内部文件
-
百年瑞金以科技破局:AI秒级识癌,无创精准测糖
在上海交通大学医学院附属瑞金医院建院118周年发布会上,一系列融合人工智能与数字化技术的医疗创新成果集中亮相。能够实时识别癌细胞的AI病理系统、无需采血即可监测血糖的新型设备等突破性技术,展现出这家百年名院正以科技创新引领医疗模式的深刻变革。一、AI赋能医疗创新直击临床“痛点”瑞金医院近日牵头组建医疗人工智
-
无人机搭载“电子鼻”:中国团队实现低空大气精准监测突破
在中国民航大学的实验场上,一架配备特殊传感设备的无人机正在进行飞行测试。它不仅能够采集常规的视觉信息,更能实时感知大气中浓度仅为百万分之一级别的一氧化碳变化,并生成精确的三维浓度分布图。这项创新技术的核心是由陈达教授团队研发的微型机载气体传感模块。这个尺寸仅如硬币的装置构成了无人机的“嗅觉系统”,基
-
瑞金医院发布多项医疗科技成果,AI赋能守护全民健康
值此建院118周年之际,上海交通大学医学院附属瑞金医院于10月13日举办了一场以“科创未来,智领前沿”为主题的科技创新成果发布会,集中展示了其在智慧医疗领域的前沿探索与系列突破。中国工程院院士、瑞金医院院长宁光在回顾医院从广慈到瑞金的百年传承时指出,当前医疗行业正处在固守传统与主动求变的关键十字路口。面对人
-
人工智能标准体系加速成型,深圳贡献核心力量
近日,我国人工智能标准化工作迎来重要进展。国家市场监管总局透露,当前已正式发布人工智能国家标准30项,另有84项标准正在紧锣密鼓制定中,构建起覆盖基础软硬件、关键技术、行业应用与安全治理的完整标准体系。在这一国家战略推进过程中,深圳市凭借前瞻布局、企业创新和国际化参与,成为推动标准体系建设的重要力量。一