自带“buff”的山东 正以“数据宝藏”炼就“发展动能”

今年2月工业和信息化部启动工业数据筑基行动,就在4月9日,一批先行先试联合体名单公布。包括山东潍柴动力股份有限公司牵头的动力装备高质量数据集建设联合体在内,全国制造业重点行业的14家联合体将聚焦关键环节关键场景“小切口”开展先行先试,为突破工业数据“采”“集”“用”瓶颈率先形成一批有效路径、创新机制和经验模式。

每天打开资讯平台,是不是总能刷到关于机器人的消息?“无处不在”的机器人,是新质生产力最直观的符号,而与固定场景中执行固定任务的机械臂等自动化设备不同,这个产业拼到最后,拼的是谁能让机器人的“大脑”更快进化——数据,是让机器人大脑变“聪明”必不可少的“教科书”;而工业数据,尤其是经过了结构化加工的工业语料,则是机器人理解制造、适配产线、服务产业的“专属教材”。

山东在全国较早启动工业领域重点行业数据的汇聚梳理。目前已在化工、钢铁、高端装备等形成20个重点行业语料库。起步早、场景全、数据厚,立足独特优势,山东加速抢占这场“最强大脑”竞赛的制高点。

深厚的制造业底蕴,让山东自带“数据buff”。机器人想“练脑子”,山东最不缺实战素材:坐拥规模化制造业场景,山东相当于有了一座天然的“数据富矿”,以青岛家电产业为例,规模超过3000亿元,占全国近六分之一份额,每分每秒都有来自一线的海量数据。过去一年,聚焦构建多元语料体系,山东开展工业领域重点行业语料库“揭榜挂帅”,让分散在车间、产线、企业的碎片化语料,变成标准化、可流通、能训练的“高质量燃料”,全省重点监测范围内大数据企业达到950家,其中数据采集、数据治理、数据要素类重点企业实现业务收入同比增长29.6%;打造90个高质量数据集,其中2个入选国家高质量数据集典型案例、4个入选国家行业高质量数据集建设先行先试名单。

以“数据宝藏”炼就“发展动能”,山东打出一套算力支撑、场景牵引的全生态支撑组合拳。工业数据开发,目的是赋能一批行业大模型、工业智能体等应用落地,赋能行业提质降本增效。山东在拿出专项资金为行业语料库重点项目进行奖补的同时,积极推进智能算力规模扩容、结构优化,全省234个算力中心“加持”数据训练,其中智能算力占比超51%;266个垂直专用大模型落地,105个典型应用案例铺开,持续从数据里提炼工业规律、优化生产流程。场景生数据、模型炼数据、数据强场景,这样一个“正向飞轮”越转越快。

人工智能等新产业的比拼,往往不是渐进式追赶,而是一旦突破某个瓶颈,将呈现断崖式领先、指数级超越。

硬件可标准化采购,但扎根产业的工业语料,是长期积累、难以复制的核心壁垒。若能借此先攻克一批数据关键技术、制定一批工业数据标准,形成一批高质量、标准化、可流通的行业数据集,或许就能一步快、步步快,抢先锁定机器人从“能用”走向“好用”的主动权。如今的山东,正站在这样一个历史性临界点上。

(记者 付玉婷)

责任编辑:单蓓蓓

分享到 分享