保定市政府新闻办
“人工智能数据处理和质量测评中心能力矩阵”
新闻发布会实录
来源: 长城网  
2025-07-29 17:34:00
分享:

市政府新闻办 郭子召:

各位媒体记者朋友们:

大家下午好!欢迎参加保定市人民政府新闻办公室举行的新闻发布会。

今天我们很高兴邀请到市数据局党组成员、副局长郭卉女士,保定市高新区管委会科技创新局局长邸彦楠先生,中国信息通信研究院河北研究院院长夏骆辉先生,由他们介绍我市人工智能数据处理和质量测评中心能力矩阵建设情况。

首先请郭卉女士介绍我市人工智能数据处理和质量测评中心成立的背景和意义。

市数据局党组成员、副局长 郭卉:

尊敬的各位来宾、各位媒体朋友们:

大家好!很高兴与大家见面,首先,感谢大家长期以来对我市数据工作的关心、支持和帮助。

近年来,保定市数据局深入贯彻落实国家大数据战略,以建设“国家数据标注基地”为牵引,推动数据产业实现快速发展。2024年5月获批成为全国7个国家数据标注基地之一,为京津冀唯一入选城市。一年来,国家数据标注基地(保定)锚定京津冀协同发展战略,聚焦“京数保标、京模冀用”,着力打造具有北方特色的数据产业高质量发展新模式。目前,全市数据产业园区达百万平米,集聚了数据服务相关企业500余家,从业人员超3万,年标注能力超2000TB,构建了7个行业高质量数据集,发布了517套优质数据集,服务14个人工智能大模型产业赋能。这些成绩的取得,离不开市委市政府的坚强领导,离不开全市上下各级的辛勤付出,更离不开广大企业群众和媒体朋友的关心和支持。

在算法普及、算力普惠加速演进背景下,高质量数据集已成为提升大模型性能的核心要素,更是推动“人工智能+”“数据要素×”等重要战略落地的关键支撑。为加快推进保定国家数据标注基地建设和数据产业集聚发展,保定市数据局、保定高新区管委会联合中国信息通信研究院共建人工智能数据处理和质量测评中心,打造了中心能力矩阵,赋能高质量数据集建设和大模型开发应用。

中心提供多维度的数据集质量与管理能力评估服务,并建立了行业权威的数据集质量评估机制,实现大模型的全面能力评估,赋能大模型“建用管”全生命周期的多个阶段,助力人工智能大模型研发、应用和管理。

未来,我局将持续结合保定的区位、人才、特色产业优势,以数据要素价值化为引领,以数据标注为核心切入点,以区域协同发展为突破口,着力引育数据企业,推动行业数智赋能,深化“平台共享、企业共创、人才共长、产业共荣”的数据产业发展生态,谱写数字保定建设的崭新篇章!

下面,有请中国信息通信研究院河北研究院夏骆辉院长,就该中心的能力矩阵作专业解读。

谢谢大家!

市政府新闻办 郭子召:

谢谢郭卉女士的详细介绍。

下面请夏骆辉先生就“人工智能数据处理和质量测评中心能力矩阵”作专业解读。

中国信息通信研究院河北研究院院长 夏骆辉:

尊敬的各位来宾、媒体朋友们:

大家好!我是中国信息通信研究院的代表。今天,我将为大家详细介绍“中国信通院人工智能数据处理和质量测评中心能力矩阵”,这一成果既是中国信通院深耕人工智能领域的重要布局,更是立足京津冀协同发展战略,推动区域内人工智能数据产业标准化、规范化、高质量发展的关键支撑。

一、项目目标与愿景

中心致力于打造人工智能“数据加工处理-高质量数据集服务-数据质量评估-模型基准测试-产教融合实训”全链条贯通的人工智能评测服务能力矩阵,形成“源数据-高质量数据集-大模型应用”的完整评测服务体系,为京津冀政府和企业提供测试评估、人才实训、技术服务、平台建设、生态培育、氛围打造等创新发展服务,助力企业突破技术瓶颈,加速AI商业化落地。

二、四大战略支点

作为人工智能产业变革的核心引擎,中心着力打造四大战略支点:

一是数据要素价值转化引擎:依托保定国家数据标注基地资源优势,打造数据清洗、标注、质检等全流程标准化服务,释放数据要素乘数效应;

二是行业权威评测认证体系:建立覆盖数据集质量、模型性能的多维度评测基准,颁发行业权威认证,构建AI产业“质量标尺”;

三是产教融合创新孵化基地:联合高校、科研院所、龙头企业共建实训平台,培养“数据工匠+AI工程师”复合型人才,赋能京津冀AI数据人才发展;

四是区域协同发展数字中枢:以保定为支点辐射京津冀,构建“京数冀标、京模冀测”协同机制,打造人工智能产业集聚新高地。

三、全链条服务能力矩阵

人工智能数据处理和质量测评中心能力矩阵涵盖AI数据加工处理、数据质量评估、模型基准测试、高质量数据集服务、产教融合实训五大核心能力,旨在为行业提供覆盖“数据-模型-人才”的一站式人工智能创新服务:

一是打造人工智能数据加工处理能力,建立来源明确、格式规范、需求吻合、准确高效的数据处理加工体系,为企事业单位提供数据集构建咨询、智能数据治理、数据精标一体化服务:

在数据集构建咨询方面,提供从场景需求分析、数据标准与规范制定、技术选型指导、治理流程设计到数据产品开发的全生命周期咨询服务,为企业量身打造符合特定AI应用场景的高质量数据集建设解决方案。

在智能数据治理方面,面向特定行业领域,提供数据标准智能映射、质量规则自动校验、问题数据智能修复等自动化治理服务,并定制开发智能化治理工具,实现数据集质量持续优化。

在数据精标一体化服务方面,提供涵盖数据清洗、精准标注、多轮次质量检验与闭环修正的全流程标准化服务。利用智能标注平台与AI辅助质检工具,严格把控标注精度与一致性,为AI模型训练提供可靠数据基础。

二是构建人工智能数据质量评估能力,建成全国首个人工智能高质量数据集评测中心,为地方和企业提供涵盖完整性、准确性、规范性、及时性、一致性、稠密性等维度的全维度数据集质量评估服务。精准定位问题根源,精准提出优化建议,输出权威评估报告与详细优化方案,并为达标数据集颁发官方认证证书,助力构建符合行业应用需求的高质量数据集。

三是构建人工智能高质量数据集服务能力,搭建垂直行业领域的数据集供需平台,建设大规模、高质量通用中文语料库,精准匹配数据供给方与需求方,并提供需求发布、资源展示、智能推荐、交易撮合及配套咨询服务,有效盘活数据资源,促进数据集流通效率提升,降低企业数据采购成本,促进数据集高效流通与应用。

四是构建人工智能模型基准测试能力,为企事业单位提供行业模型训推服务和模型基准测试服务,反馈式驱动大模型能力不断提升,为大模型的技术研究方向提供科学指引,为实际行业应用提供可落地的实施路径。

在行业模型训推服务方面,提供面向政务服务、工业质检、智慧能源、智慧医疗、智慧教育等特定行业的专有模型微调、优化部署及场景化应用指导的全流程服务,助力企业快速将AI技术融入核心业务,缩短企业落地符合自身业务需求的智能解决方案周期。

在模型基准测试方面,面向多模态大模型、模型应用(代码、智能体等)和重点行业(金融、工业、能源、交通、科学等)提供模型基准测试服务,对大模型的基础、生成、推理等核心能力进行系统性基准测试与深度分析,精准定位性能瓶颈与风险点,输出权威评估报告及闭环优化方案,支撑模型选型决策,驱动模型能力迭代升级。

五是打造人工智能产教融合实训能力,联合高校、科研院所、职业技术学院等设计人工智能基础数据服务人才培养课程体系,为京津冀乃至全国输送高质量的“数据工匠+AI工程师”双轨制人才梯队。具体为京津冀企事业单位提供中小学AI启蒙研学、高校/企业项目制培训:

在中小学AI启蒙研学方面,面向中小学学生,在人工智能数据处理和质量测评中心开展AI研学。通过“参观认知”走进人工智能数据处理中心,在导师指导下完成图像标注、数据清洗等“数据小工匠”任务动手实践,最后通过“职业初探”了解数据标注师、AI工程师等新兴职业,拓宽未来视野,促进学业与未来科技应用的连接,全方位助力青少年科技素养提升与职业认知启蒙。

在高校/企业项目制培训方面,面向高校及企业人员,打造基于真实产业项目的实训课程,涵盖数据采集处理、AI模型应用、行业场景实践等核心技能。通过企业导师带教与真实项目演练,快速提升其在人工智能与数据融合领域的工程实践能力,输出企业所需复合型人才。

五、未来展望

展望未来,中心将加速构建人工智能数据产业集聚区,为京津冀人工智能产业发展注入“标准引领、质量为本”的新动能,助力实现“京数冀标、京模冀测”的区域协同创新示范标杆。

最后,我衷心感谢各位来宾、媒体朋友们的关注和支持。我们期待与各界朋友携手合作,共同推动人工智能数据产业的高质量发展,为构建人工智能新发展格局贡献力量!

市政府新闻办 郭子召:

谢谢大家!市政府新闻办 郭子召谢谢夏骆辉先生的权威解读。

下面进入记者提问环节,请各位媒体记者举手示意,叫到后,先通报一下所在的新闻机构和本人姓名,再提问,谢谢。

河北新闻出版网:请问人工智能数据处理和质量测评中心能力矩阵构建的战略背景是什么?又将如何助力保定及京津冀地区人工智能产业的生态建设?

市数据局党组成员、副局长 郭卉:各位媒体朋友,感谢大家对保定数据产业发展的关注。人工智能数据处理和质量测评中心能力矩阵的构建,是立足国家战略需求、区域产业升级需求和技术演进趋势,为京津冀人工智能产业生态建设打造的“质量基石”与“创新引擎”。

中心立足于三重战略背景深度布局。在国家战略层面,中心紧扣国家“人工智能+”行动对高质量数据集的迫切需求,通过构建标准化评估体系,推动高质量数据集的建设和推广。在区域发展层面,依托保定“国家数据标注基地”的产业基础,联合保定高新区、中国信通院及河北研究院多方力量,推动产业从“数据标注”向“数据治理+模型优化”升级。在技术演进层面,针对当前人工智能领域“算法趋同、算力普惠”的技术趋势,以数据质量为突破口,通过可信人工智能数据集评估体系和“方升”大模型基准测试体系,保障数据与模型双可靠性。

生态赋能数据产业及人工智能产业全面升级,首要是夯实产业基座,以数据治理为切入点,构建覆盖数据采集、清洗、标注、评估的全链条服务体系,为京津冀企业提供“端到端”可信数据解决方案。其次是强化质量标准输出,人工智能数据集评估体系落地保定,已助力招商局集团、中国物流集团、中国建筑集团等央企通过4级质量认证,同时推动多家央企数据质量评估工作,带动行业数据集质量整体提升,形成产业辐射效应。最后是打通人才-产业闭环,联合省内高校,开设数据工程、模型优化等专项课程,培养复合型人才,助力打造京津冀人工智能人才高地。

未来将持续深化“政产学研用”协同创新,以数据质量为支点,撬动京津冀人工智能产业集聚发展。保定欢迎各界伙伴携手,共筑人工智能及数据产业高质量发展新生态!

保定新闻传媒中心:人工智能数据处理和质量测评中心能力矩阵如何赋能高质量数据集建设?

中国信息通信研究院河北研究院院长 夏骆辉:人工智能每次阶段性的进步,数据都扮演着重要角色,尤其在大模型时代,大规模、高质量、多样化的训练数据集,成为拉开能力差距的关键要素,一定程度上印证了“以数据为中心的人工智能”。中心通过“全链条治理+权威认证”破解数据质量难题:

一是数据生产环节标准化。中心通过建立“来源可确认、用途可界定、训练可追溯”的数据加工体系,为企业提供一站式数据治理流程,确保标注一致性与合规性。

二是质量评估权威化。打造全国首个人工智能数据集评测中心,采用“三道关卡”评测模式:一是规则检测,通过自动化测试工具检查数据集各维度指标内容;二是人工抽样,行业专家差异化审查数据集各维度指标;三是模型效果,通过模型效能反向验证数据效用。

三是数据价值闭环化。建立“数据优化-模型迭代-效能提升”机制。其中,数据质量评估为模型训练提供高质量训练数据集,为模型测试提供高质量评测数据集;模型基准测试,为数据质量评估提供反馈信号服务于数据集质量提升与模型性能优化。

四是人才培养体系化。构建覆盖人工智能数据处理与模型训练等核心人工智能环节的课程体系,涵盖30余门基础课程、20余门行业专项培训课程,并建设线下标准化人工智能产教融合实训室,形成“课程体系+实训场地”的一体化实训载体,为区域构建高质量的人工智能数据人才梯队。

未来,人工智能数据处理和质量测评中心将持续深耕“以评促建、以用促优”的生态闭环,打造具有全国标杆意义的高质量数据集供给高地。我们坚信,通过标准化生产体系的规模效应、权威化评估体系的公信力沉淀以及价值闭环带来的持续迭代动能,必将为人工智能产业注入更精准、更可靠、更高效的数据燃料,为“数字中国”建设提供坚实支撑。在此,我们也诚邀各界伙伴携手共进,共同探索数据要素赋能千行百业的新路径,让高质量数据集成为驱动新质生产力发展的核心引擎!

保定新闻传媒中心:人工智能数据处理和质量测评中心在保定高新区成功落地,请问高新区将如何依托这一创新平台,进一步做强人工智能数据产业生态,赋能企业高质量发展?

保定市高新区管委会科技创新局局长 邸彦楠:人工智能数据处理和质量测评中心在保定高新区的落地,是区域抢抓人工智能产业发展机遇、构建数据产业生态的关键布局。高新区将围绕“技术赋能、生态共建、政策护航、区域协同”四大战略,依托中心能力矩阵,多维度赋能企业高质量发展:

一是夯实技术底座,打造全链条数据服务能力。中心依托中国信通院在人工智能领域的专业平台优势,为相关产业提供全生命周期服务。在数据加工与质量管控方面,通过数据清洗、标注、增强技术,为企业提供低成本、高效率的数据处理服务,解决数据孤岛、质量不均等痛点。在模型评测与迭代优化方面,建立多维度模型基准测试体系,覆盖计算机视觉、自然语言处理等主流赛道,为企业模型提供性能诊断报告,推动模型从“可用”向“好用”进化。

二是强化产业协同,构建数据要素生态圈。高新区将以中心为枢纽,打通数据要素“采集-加工-应用”链条,形成产业协同闭环:围绕保定高新区“3+N”产业布局,在电力装备、新一代信息技术、生命健康等领域打造标杆应用场景。同时吸引重点企业落地区域总部或研发中心,带动数据标注、算法开发、硬件适配等上下游企业集聚,形成“头部企业+配套企业”的产业雁阵。

三是优化政策保障,营造产业创新发展环境。一方面,谋划出台《人工智能和大数据产业支持办法》,对数据加工、模型评测、人才实训等环节给予奖励补贴。另一方面,在科创园、深圳湾、大学科技园、中关村等区域规划“人工智能数据产业园”,提供基础配套,降低企业创新成本。

四是深化区域联动,构建京津冀数据产业协同网络。高新区将发挥保定“京畿重地”区位优势,推动中心能力向京津冀辐射:联合中国信通院等人工智能领域专业机构,开展跨区域数据质量标准互认、模型评测结果共享。同时推动京津高校与中心共建“双导师制”实训基地,实现人才资源跨区域共享。

展望未来,我们将把中心打造为京津冀人工智能数据的“质量检验站”“技术策源地”“产业发动机”,让企业“带着技术来、带着成果走”,为保定国家数据标注基地建设注入新动能,助力保定成为具有全国影响力的“人工智能数据产业高地”!

市政府新闻办 郭子召:

由于时间关系,今天的新闻发布会到此结束,各位记者朋友还有什么关注的问题,欢迎会后到市数据局等相关单位进行采访。

谢谢大家。

关键词
新闻发布会实录
责任编辑:胡晓宁
TOP