当人工智能产业迈入高速发展新阶段,高质量专业数据成为AI大模型训练、智能体研发不可或缺的“养料”。而作为高质量专业数据的核心,大量知识产权数据却长期面临利用率低、获取难、转化难等困境。如今,这一僵局在苏州被率先打破。
随着近日苏州市“AI+知识产权数据”开发创新基地启用,并获得国家知识产权公共数据开发利用授权,这里成为全国首个国家知识产权公共数据授权开发利用先行先试区。自此,一座链接“数据富矿”与“产业应用”的桥梁在苏州加速架设。
多国数据资源汇聚
创新“原料库”提供更强赋能
知识产权数据是技术创新的“基因图谱”,专业化、标准化、结构化的特质,与AI研发数据需求高度契合,却因资源分散、授权受限,大量优质数据长期“沉睡”。来自世界知识产权组织的数据显示,全球90%以上的科技成果以专利形式呈现,然而其中仅有30%被有效利用。如何激活这座“沉睡的数据富矿”,成为加快发展新质生产力的关键。
此次苏州基地落地,率先解锁国家级知识产权数据资源,为AI产业发展攒足“创新底气”。
记者从苏州市市场监管局(知识产权局)了解到,依托国家知识产权局部署,基地联合知识产权出版社,向社会公众提供更多规范、专业的知识产权公共数据服务。目前,基地已汇聚中国、美国、日本、韩国、俄罗斯及欧洲专利局等6个国家和组织的86种知识产权数据,涵盖专利、商标、地理标志、集成电路布图设计等资源。
依托这个创新“原料库”,入驻基地的企业、科研机构等可快速、便捷地获取这些数据资源,广泛应用于AI模型训练、应用开发、产业研究等各类场景,有效解决AI产业发展的专业数据供给难题,为人工智能技术创新筑牢根基。
破解数据获取壁垒
“入驻即用”让服务更普惠
“申请周期长、审核流程繁、获取效率低”,曾是企业获取国家知识产权公共数据的痛点。以往企业想要获取这些数据,需向授权运营单位逐项提交申请,历经多环节审核、确认,还要通过硬盘邮寄获取数据,数周等待周期、较高技术门槛,让不少中小企业、科创团队望而却步,数据资源难以真正惠及产业一线。
“AI+知识产权数据”开发创新基地的设立,改变了这一局面。基地依托数据运营方的整体授权优势,重构数据获取模式,将原本高门槛、碎片化的知识产权公共数据,转化为可随取随用的数字基础设施。企业入驻基地后,无需繁琐申请、漫长等待,就能直接调用授权数据资源,实现数据“即取即用”。这一创新突破,彻底打通了数据供给“最后一公里”,让高质量知识产权数据不再是少数机构的“专属资源”,而是成为各类科创主体触手可及的“创新底座”,极大降低了企业研发成本,为AI产业创新创业释放满满活力。
深化数据价值转化
构建更优全链条产业生态
坐拥海量数据,更要深挖并释放数据价值。苏州基地并未止步于数据供给,而是聚焦“原始数据—精加工产品—市场化交易”全链条,推动知识产权数据从“资源”向“价值”跨越,走好特色化数据要素变现之路。
为了让数据“原始矿”变成适配产业需求的“精加工产品”,基地针对不同AI应用需求,对86种原始数据进行深度加工,提供标准化与定制化兼具的基础、专属数据集。既能通过文本清洗、去重、格式化,形成通用的大模型预训练高质量语料库;也能聚焦细分产业、特定场景,量身打造专题数据库,或针对某个具体应用场景形成垂直领域语料库,这些经过深度加工的数据,可大幅降低下游开发者的使用门槛。
为了更好地实现价值变现,将更多“精加工产品”打造成“市场化商品”,基地将于今年下半年建成规范化的数据产品交易流通平台,涵盖标准化数据集、专题数据库、微调模型、API服务等多类型产品的展示、定价、交易与交付,搭建供需对接桥梁,同时探索多方利益分配机制,让数据在流通中创造更多效益。
国家知识产权公共数据的授权开发利用从“数据供给”走向“价值共创”,在苏州,原本分散、异构、高门槛的知识产权公共数据,正经历华丽转身,成为驱动人工智能发展和产业转型升级的核心要素。放眼未来,苏州将以基地为核心,不断拓展“AI+知识产权”在政务服务、产业升级、科技研发、成果转化等更多场景应用,全力打造可复制、可推广的“AI+知识产权”融合发展“苏州样板”,让更多沉睡的知识产权数据变为“创新活水”,为加快培育新质生产力持续注入动能。
