T/SHLY 1005-2024 人工智能识别林长制巡查的影像数据样本库建设指南

免费下载
本平台标准仅供学习参考,使用请以正式出版的标准版本为准。

标准号:T/SHLY 1005-2024

标准名称:人工智能识别林长制巡查的影像数据样本库建设指南

团体名称:上海市林学会

发布日期:2024年06月22日

实施日期:2024年07月01日

在研制过程中,本标注标准主要参考了《标准化工作导则第1部分:标准化文件的结构和起草规则》、GB/T41867《信息技术人工智能术语》、GB/T17798《地理空间数据样本交换格式》、LY/T2930《林业数据样本采集标准规范》等文件。主要指标说明如下:

1.建设内容

主要提出了影像数据样本库的建设框架,主要包括确定需求、建立数据样本库、管理数据样本库3个部分。

确定需求部分主要包括3个部分:数据样本分类、数据样本采集和数据样本标注的内容,并分别规定其规范原则。数据样本分类主要由监管部门的实际需求决定,同时考虑计算机视觉算法的基本原理与算法5轮迭代成果,将数据样本按分类原则进行梳理,并根据具体工作场景进行分类内容划分;数据样本采集部分总结了不同季节、地域与方式的采集经验,包括采集的前期准备、数据样本类型、采集方法、元数据相关信息记录以及采集的数据样本格式;数据样本的标注则主要根据深度学习算法原理及实际算法模型训练与迭代经验,规范了数据标注基本流程和质量控制方法,并分别对标注角色、工具、对象、质量以及注意事项进行了归纳总结,以把控数据标注质量,提高模型训练精度上限。

建立数据样本库主要包括建立影像数据样本库、标签数据样本库以及元数据库,并分别包含其本身的数据样本描述;

管理数据样本库主要包括数据样本扩充、修改、删除、查询、统计和下载六个部分。

2.工作流程

对人工智能识别林长制巡查的影像数据样本库建设流程进行了步骤制定,其主要包含以下7个步骤:场景类型划分及标准制定、数据样本采集、影像数据样本检查、数据样本标注、标注数据样本质检、数据样本入库和数据样本库管理和维护。

3.数据样本类别与组织

明确了数据样本的内容组织,其中数据样本内容主要分为影像数据样本、标签数据样本、文档数据以及元数据;数据样本组织部分规范了其样本组织原则和方式;

4.数据样本处理

规定了数据样本处理的流程以及相应规则,主要包含数据样本质检、数据样本修改和数据样本复核。

5.数据样本入库

规定了数据样本准备材料、数据样本库的命名原则和方法、数据样本库的入库前检查、入库流程以及入库后检查方法。

6.质量控制

规定了质量控制包含的两个方面内容:数据样本的成果要求和文档类的成果要求。

7.建设成果

规定了建设成果两个部分的内容,其中数据样本成果主要指影像数据样本库、标签数据样本库和元数据库;成果文档主要包括建库过程中产生的质量控制文档、工作报告、技术报告等。

8.数据样本安全

规定了数据样本库的安全保障措施,主要包含建立相应的安全管理制度、指定安全目标和策略以及制定数据样本库安全工作流程。

起草单位:上海岩易科技有限公司、上海市林业总站

起草人:周俊峰、蒋含笑、韩玉洁、李琦、刘璐璐、吴尧

声明:资源收集自网络分享,所提供的电子版文档仅供学习参考,如侵犯您的权益,请联系我们处理。

不能下载?报告错误