记者20日从国家数据局了解到,我国七个数据标注基地数据标注规模再创新高,数据标注总规模达到17282TB,相当于中国国家图书馆数字资源总量的6倍左右。
数据标注是对数据进行添加标记、说明、解释、分类和编码的过程,是提升人工智能算法、模型核心能力的关键环节。我国七个数据标注基地分别位于四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同,目前已形成医疗、工业、教育等行业的高质量数据集335个;赋能121个国产人工智能大模型研发;引进和培育标注企业223家;标注从业人员达5.8万人;带动数据标注行业相关产值超过83亿元。
国家数据局有关负责人表示,未来将进一步畅通数据采集、标注、人工智能应用产业链,重点推动工业、金融、医疗、交通、教育等几大领域的高质量数据集建设,促进数据标注产业高质量发展。
编辑谢宇彤
一审陈朝晖
二审刘义
来源新华社
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com