视频数据标注是用机器自动生成或手工生成自然语言文字来描述视频内容的过程。它在视觉和文字之间起到非常重要的桥接作用
视频数据标注的目的是对场景中活动目标的位置、形状、动作、色彩等有关特征进行标注;提供大量数据供跟踪算法使用,从而实现对场景中活动目标的检测、跟踪、识别,以及进一步的行为分析和事件检测
今天小编就带大家一起了解一下关于数据标注的一些基础知识
视频标注中的两个主要方法
单一图像标注
在自动化工具面世之前,视频标注效率不高。各公司使用单一图像法提取视频中的所有帧,然后使用标准图像标注技术将它们作为图像来标注
在30fps的视频中,每分钟有1800帧。这个过程没有利用视频标注的优势,并且与标注大量图像一样既费时又昂贵。一个对象可能会在上一帧被归入一个类别,在下一帧又被归入另一个类别,错误率就会增加
连续帧标注
如今,我们可以使用自动化工具,通过连续帧法简化视频标注过程。计算机可以逐帧自动跟踪对象及其位置,从而保持所捕获信息的连续性和流畅性。计算机依靠诸如光学流之类的连续帧技术来分析前一帧和后一帧中的像素,并预测当前帧中像素的运动
通过这种背景级别,计算机可以准确地识别在视频开头出现,在几帧中消失,然后再次出现的对象。如果团队改用单一图像法,则会在该对象后来再次出现时将它错误地识别为另一个对象
但这种方法并非没有挑战。捕获的视频(例如监控中使用的素材)可能分辨率很低。为了解决这个问题,研发团队正在努力改进内插工具(例如光学流),以便更好地利用各帧的背景来识别对象
视频数据标注流程
视频数据标注流程主要包括标注、质检、初验、终验、返修和查看界面,确认无误后,保存和提交。这里以数据堂的视频数据标注工具为例,就标注流程进行一个分享
标注
标注是针对未标注的数据或者预识别处理后的数据进行标注工作,如图所示
质检
质检是质检人员对数据标注人员标注结果的核验。在质检模式,用户具有所有标注权限,可以新建对象或修改标注结果
质检包括单标注框质检,单帧质检两种方式
(1)单标注框质检
在单标注框质检过程中,标注框轮廓默认显示为白色,表示当前标注框未进行质检
质检合格时,标注框轮廓显示为绿色
质检不合格时,标注框轮廓显示为红色(标注框显示不合格原因)
返修后提交标注框,标注框轮廓显示为黄色
(2)单帧质检
单帧质检合格则在视频帧序号上显示绿色;不合格则在帧号上显示红色;返修后提交的视频帧序号显示为黄色
单帧数据不合格不影响帧内的框的颜色和质检结果
完成质检后单击提交按钮,提交质检结果至服务端(客户端版本将在本地生成质检结果文件mark._result.json,可以修改名称为task.json,在此作为质检模式或返修模式的输入)
返修
返修是指标注人员对不合格标注数据进行修改,提交的过程
返修过程包括以下步骤:
质检查看:返修过程中可以看到质检结果,也可以看到不合格原因,但是不能修改质检结果;
单标注框返修:根据不合格原因修改标注对象,修改后标注框会变为黄色,表示已修正;
在完成当前视频帧所有错误标注框修复后,视频帧序号也会同步变为黄色,表示当前帧已修正;
单视频帧不合格的,如果修改了这一帧的任何内容,视频帧序号会同步变为黄色,表示当前帧已修正;
返修时若修改了合格标注框或未质检标注框,标注框轮廓颜色不变;
提交时质检在是否修正全部不合格标注框以及视频帧,如果未全部修改则不允许提交(客户端版将在本地生成带返修结果文件mark result.json,可以改名称为task.json,以此作为质检模式的输入)
写在最后的话
我们拥有多年的数据标注经验,有包含文本标注、图像标注、音频标注、视频标注等在内的多类型标注项目,满足团队需求,并为有从业想法的人工智能训练师提供项目
因此您如果对于数据标注有想法,可以和我们联系哟
特别声明:文章来源用户上传并发布,本站只提供信息存储服务,不拥有所有权,内容仅供参考。