数据,作为人工智能三大要素之一,是人工智能发展的重要动力,培育和壮大数据标注产业,对于提升数据供给质量、推动人工智能创新发展具有重要的推动作用。国家数据局印发《关于促进数据标注产业高质量发展的实施意见》(以下简称《实施意见》),明确了数据标注产业高质量发展的方向。高水平创新载体是推动数据标注产业发展的重要科技支撑,我们要充分把握机遇,统筹各方资源,建好高水平创新载体,全面助力数据标注产业高质量发展。
一、创新载体是助力数据标注产业高质量发展的重要科技支撑
高水平创新载体是数据标注产业发展的技术研发“原动力”。高水平的创新载体可以更好地聚合数据标注领域的科研、人才、资金、算力等资源,为科技创新和研发活动提供必要的物质保障、人才保障和技术保障,成为基础研究、原创研究和前沿创新的策源地,持续不断地为数据标注产业提供科技创新“原动力”和核心竞争力。
高水平创新载体是数据标注产业发展的产研融合“连接器”。高水平的创新载体可以有力促进产学研用融合发展,形成高效协同的产业链联动机制,高效实现产研对接、校企对接,助力科研成果快速实现落地转化和产业应用,助力产业急需的实践型人才培养,全面提升数据标注产业全产业链的专业化、协同化水平与科技创新能力。
高水平创新载体是数据标注产业发展的资源汇聚“蓄水池”。高水平的创新载体能够有效调动高校、企业和科研机构等各方积极性,构建多方共同参与的创新发展机制,打破机构壁垒、行业壁垒和区域壁垒,实现创新资源的共享共建共用,达到创新资源的最优配置,全面提高数据标注产业的科技创新效率。
二、统筹协调、积极应对我国数据标注领域高水平创新载体的机遇和挑战
我国数据标注领域创新载体建设已初步形成“四梁八柱”。我国数据标注领域创新载体建设初见成效。一是部分高校与科研机构已经成立了数据标注相关领域的学科实验室和研发中心,具备了一定的科研创新能力。二是近年来部分省市已出台涵盖科研创新载体建设在内的数据标注产业政策,一定程度上凝聚了产业共识。三是今年以来国家数据局与多地探索共建国家级数据标注基地,聚合了产业创新生态。四是经过多年发展,我国数据标注产业内涌现出多家具备创新能力和先进水平的行业领军企业,初步形成了产业联动创新机制。
数据标注领域创新载体建设还需破解系列难题。当前,我国数据标注领域的创新载体建设,依然面临三大难点需要解决。一是缺乏汇聚各方资源的重点创新平台,研究力量较为分散,保障措施不到位,基础研究、前沿研究相对薄弱。二是产学研用链路不畅通,科技创新成果转化难、落地难,人才能力与产业需求之间存在一定差距。三是相关机构间合作不够紧密,创新能力和资源缺乏统筹和共享,科技研发活动各自为战,科研和产业创新资源未能得到充分开发利用,创新平台建设效果相对有限。
三、以《实施意见》为引领培育建设高水平创新载体,助力数据标注产业高质量发展
扶持重点平台,聚焦基础研究和前沿技术。统筹各方资源,依托已有基础,汇聚资金、人才、研发等软硬件资源和基础设施,支持有实力的高校、科研机构和创新型企业建设一批高水平重点实验室、技术创新中心、工程研发中心等创新平台,聚焦数据标注领域安全自主可控的原研性、基础性研究,探索更加灵活的运行和考核机制,鼓励多模态、融合化的前沿性、前瞻性技术研发,夯实数据标注产业发展的科技创新基础。
畅通产研链路,加快科技成果转化和应用。推动行业龙头企业联合产业链上下游企业、科研机构和高校积极参与建设产教融合创新平台、协同创新基地、产业创新联盟等产学研用联动机制,发挥龙头企业作用,全面实现产教融合、产研融合,面向产业真实需求做好应用研究、前沿创新和人才培养,加速数据标注领域科技创新成果转化和产业化应用,持续培养数据标注产业急需的复合型、实践型人才。
打造开源社区,推动创新资源共享共建共用。鼓励数据标注企业、高校、科研机构打破壁垒,共同建设开放包容的开源社区、共享空间等合作机制和平台,通过多元化体制机制创新,持续推进技术、数据、算力、信息等创新资源实现跨机构、跨业态、跨行业、跨层级、跨区域的协同共享与开发利用,全面提升数据标注产业的研发效率和科技创新能力。(作者系北京市社会科学院副研究员)