自动驾驶“落地战”,高质训练数据或成商业化最佳突破口

随着汽车四化的深入进行,自动驾驶能力已经成为了企业不可或缺的能力 。在自动驾驶技术实现的过程中,汽车需要通过感知、策划、决策、控制等一系列的过程,实现“人工智能” 。简单来说,自动驾驶系统根据从感知融合模块得到的环境信息,如其他车辆、红绿灯、行人等数据反馈,才可做出具体行为决策,如变道、超车、停车等等 。在具体商业化落地中,难就难在“感知-决策”这一过程,在道路环境复杂的城市道路上,不可控的车辆、行人、宠物等各方因素,给“感知-决策”的过程带来了极大的难度 。自动驾驶时代的关键——背后的高质量数据对于自动驾驶汽车来说,想要在瞬息万变的复杂真实驾驶场景中发挥感知作用,背后就需要有海量真实道路场景的数据通过专业人员进行标注和验证,从而转化为算法训练的数据支撑 。AI训练数据是整个人工智能行业的燃料,它在智能驾驶领域的重要性毋庸置疑 。作为AI技术的底层支撑,高质量的训练数据越来越受到业界的重视,成为智能驾驶真正落地的“幕后英雄” 。近期,云测数据在2021世界人工智能大会现场推出新一代自动驾驶数据解决方案 。该方案能满足智能驾驶领域不同落地场景下的高质量AI训练数据需求 。通过场景数据库、定制化数据采集标注、数据标注以及数据管理平台等服务,可一站式解决智能驾驶从研发初期到落地的训练高质量数据需求,助力智能驾驶技术的快速落地 。
自动驾驶“落地战”,高质训练数据或成商业化最佳突破口
文章图片

文章图片
云测数据总经理贾宇航在接受媒体采访中表示,“云测数据新一代智能驾驶数据解决方案在为智能驾驶相关企业提供大规模感知数据能力的同时,可减少数据采集周期、提升数据标注效率,并大幅降低AI模型训练成本,极大地加速智能驾驶相关应用的落地迭代周期,节省大量研发时间和成本” 。作为AI数据服务领域的头部企业,云测数据一直致力于为人工智能技术落地提供高质量的场景化AI数据 。聚焦到自动驾驶领域,云测数据则通过对视频、图像、音频、文本、LiDAR和传感器数据进行结构化处理,为AI模型提供海量、高质量和多元化的场景化训练数据 。事实上,现实交通场景复杂、安全威胁多,特别是国内路况的复杂性和国内智能驾驶起步相对较晚,更需要高质、更精准的数据来进行算法训练 。从宏观角度来看,现有算法、算力无法准确处理复杂环境下无限可能的长尾场景,这时候AI数据的覆盖就显得更加重要 。
自动驾驶“落地战”,高质训练数据或成商业化最佳突破口
文章图片

文章图片
而云测数据的业务优势首先就体现在相关场景数据库上 。云测数据拥有丰富的自动驾驶场景基础数据库 。贾宇航介绍,基于智能驾舱和车外环境感知落地发展需求,云测数据按主流传感器型号建立了智能驾驶场景数据库 。舱内基于智能驾舱行业发展,云测数据进行驾仓场景搭建、场景还原,场景库覆盖身份认证、活体验证、手势识别、视线追踪,动作识别等场景;驾舱外基于自动驾驶行业发展,云测数据进行车外环境相关场景数据库搭建,包含多场景、多天气、多环境状况,覆盖动态目标检测、标志牌、交通灯等场景 。其次,在质量上,云测数据拥有更高质量的驾驶场景数据采集标注服务 。据介绍,云测数据自主研发数据标注平台,覆盖所有自动驾驶所需要的2D/3D等不同类型的标注工具,可满足各种数据标注需求,累计在智能驾驶领域标注2D/3D数据已达数亿帧,最高数据标注准确率可达99.99% 。《互联网周刊》&eNet研究院、德本咨询联合发布《2021数据标注公司排行》,其中,云测数据凭借最高99.99%精准度数据标注能力和场景化训练数据方案等实力,蝉联“数据标注公司排行”TOP1 。在此基础上,云测数据自建了数据标注基地,配置有标注员、质检员、项目经理进行统一管理、规范生产 。如何在保证数据准确率的同时有效保证标注作业的信息流转,提升标注效率呢?云测数据也制定了一套作业流程,将流程流水线化、模块化,包含任务分配、需求分析、需求确认、数据清洗、试标确认、进度控制、质量保障等 。在自动驾驶AI数据标注过程中,面临“种类繁多、时间效率、数据质量”等众多难题 。云测数据自主研发的标注平台4.0版还能够有效解决AI落地场景多样性、丰富性的数据需求,帮助获取AI场景纯净数据,解决数据采集中95%的问题,并通过标注平台将全流程优化,可助力AI数据训练过程综合效率提升200%。据了解,云测数据基于行业场景基础数据集、定制化训练数据服务、数据处理平台工具等服务,助力自动驾驶商业化落地 。目前云测数据已与行内包括自主、合资车企,大型Tier1、Tier2以及无人出租车、自动驾驶等众多企业建立了良好持久的合作 。(责任编辑:郭健东 )