
加快推动数据标注产业发展
开栏的话
翰墨凝思,集智聚力。作为青岛日报社倾力打造的新型媒体智库,青报智库秉持专业视角,解码发展命题,剖析时代课题,助力城市能级提升。即日起,本报开设“青报智库·专家笔会”专栏,聚焦城市改革攻坚、产业升级、民生改善等核心议题,汇聚学界专家、行业精英的前瞻思考与独到见解,务实建言,精准献策。敬请关注。
数据标注是对未经处理的语音、图片、文本、视频等数据进行加工处理,从而转变成机器可识别信息的过程。数据标注产业是人工智能产业链中的基础性、关键性环节,高质量标注数据是人工智能模型训练、优化和迭代的根本支撑。
《数字青岛2026年行动方案》提出,“编制数据产业、数据标注和高质量数据集建设行动方案,推进数据产业集聚区等试点建设”。目前,青岛已形成以海洋科研、工业互联网和公共数据为重点的多元化数据资源体系,集聚了海尔、海信、国实、创新奇智、自然语义等一批人工智能优质企业,在提供行业解决方案和智能终端产品生产等领域具备较好基础。但也应看到,上游数据服务能力相对薄弱,数据标注产能与行业数据、场景需求增长不匹配,高质量数据集建设与先进城市相比仍有较大差距。通过加快发展数据标注产业,有利于系统补强数据采集、清洗、标注、训练等关键环节,打通产业链上下游,为人工智能技术研发和产业化应用提供稳定、优质的数据资源供给。
一方面,数据标注产业发展有助于打造数据经济新增长点。数据标注基地是推动数字经济产业高质量发展的重要抓手,如百度智能云(山西)人工智能基础数据产业基地,自2018年运营以来累计实现产值超7亿元、税收近4000万元,孵化培育数据标注企业40余家;百度智能云(泰山)人工智能基础数据产业基地,自2024年5月运营至2025年6月,一年多时间实现产值近8000万元,展现出良好的营收增长潜力。
另一方面,数据标注产业发展有助于丰富就业业态和岗位。数据标注产业是人工智能产业链中技能门槛相对适中、培训时长相对较短的环节,建设数据标注基地,有助于拓宽就业渠道、丰富就业类型。如,贵阳石操村“小兰山”数据标注基地,为高校毕业生和返乡就业青年提供150多个就业岗位;百鸟河数字小镇培育的数据标注产业年带动就业超千人。国家数据局统计数据显示,截至2025年3月,国家首批七个数据标注基地累计引进和培育标注企业223家,容纳标注从业人员5.8万人。
如何把握数字经济发展机遇,积极推动数据标注产业发展?
加快推进数据标注基地合作共建。坚持以龙头企业为引领,加大对百度、阿里、腾讯、京东、华为等人工智能龙头企业的招引和合作力度,加快导入龙头企业自有业务需求和先进标注技术。充分发挥本地政府、平台企业、标注企业、高校院所的优势,在数据资源供给、基地运营管理、企业集聚培育、专业人才输送等方面协同发力。
加快打造特色优势数据标注领域。发挥本地产业、数据资源的优势,重点布局海洋数据、工业数据、港口数据等垂直领域标注业务,与济南、泰安等省内基地形成差异化发展,将数据优势转化为产业优势,将数据资源转化为“数据矿产”。聚焦交通物流、工业制造、海洋、低空经济等重点领域,加快推进国家高质量数据集建设先行先试工作。
加快提升自主创新能力。鼓励数据标注企业与科研机构合作,加强数据标注研发投入,开展AI高质量数据合成、AI数据集质量评估、多模态数据标注等技术攻关,促进智能化、自动化的数据标注工具研发。鼓励标贝科技、浪潮等已拥有自研先进平台的企业,向中小微数据标注企业提供共性技术支持、标准测试数据集、大模型评测等服务。围绕数据标注关键环节,结合文本、图像、视频、语音等多模态数据标注需求,支持企业建立数据标注相关领域企业(团体)标准,鼓励企业参与国家标准、行业标准制定。(高阳 作者系青岛产业研究院产业研究首席代表、正高级经济师)
责任编辑:吕靖雯