数据服务门槛再提升,澳鹏Appen,中国,凭何再度领军

  • 时间:
  • 浏览:0
  • 来源:开心文章网

在人工智能领域,数据的重要性正在迅速增长。根据吴恩达著名的28法则,80%的数据+20%的模型=更好的AI。他认为,机器学习团队80%的工作应该是数据准备,确保数据质量是最重要的工作。当我们专注于以数据为中心而不是以模型为中心时,机器学习的进步会更快。随着中国自动驾驶行业商业化的快速推进,数据市场的需求也在快速增长。公开数据显示,到2030年,中国将拥有3000万辆自动驾驶汽车,成为世界上最大的自动驾驶市场。总体而言,整个自动驾驶正处于从L2级向L3级发展的阶段,场景越来越复杂,同时也对3D等高维、高质量数据带来了巨大的需求。另一方面,自动驾驶全产业链的企业数量正在快速扩张,包括传统车企、汽车相关互联网公司、跨境互联网公司、新型自动驾驶相关企业等,数据需求也在不断增长。自动驾驶数据的重要性不断上升在智能1.0阶段,车企正在努力实现技术快速落地和先进能力的标杆效应,而2.0阶段则是大规模实施。根据高科技智能汽车研究院发布的《2023-2025智能网联产业趋势报告》显示,今年1-10月,前瞻ADAS(L2,含NOA)同比增长67.11%。NOA(导航辅助驾驶)同比增长116.25%。如今,软件和数据已成为智能汽车的核心。构建实用的智能驾驶系统并不难,但真正的挑战是开发和维护可扩展、可靠和完整的数据驱动解决方案。这意味着智能驾驶系统将实现一个全新的基于数据和软件定义的范式。如您所知,数据发生在人工智能的整个生命周期中,从数据采集、数据准备、模型训练和部署到人工模型评估。在中国市场,数据服务的价值也显而易见。高科技智能汽车研究院预测,未来2-3年仍是摄像头汽车市场的红利期,到2025年,中国市场自行车摄像头将增至7-8台。与此同时,前置双目、三眼、周视等摄像机配置已成为主流,基于数据认知的训练也成为必要。与此同时,4D毫米波雷达和激光雷达的部署也处于关键的部署阶段,这将创造一个全新的多传感器传感数据融合市场。此外,机舱内人机交互体验的升级也需要数据迭代支持。这再次表明,在自动驾驶和驾驶员辅助领域,对数据标签的需求将达到峰值。作为产业链的重要组成部分,澳鹏深刻感受到了自动驾驶市场的需求。特别是今年,自动驾驶数据标签的需求呈爆炸式增长。2020年,Appen(中国)实现了470万美元的收入增长,较2021年的2470万美元增长了421%。2021年上半年141%的增长中,大部分来自自动驾驶,目前占所有业务的60%以上,而澳本中国一半以上的客户来自自动驾驶。然而,随着行业数据标注需求的爆发,过去简单而粗糙的“人堆”已经无法满足当前行业对“高质量、海量”数据的痛点。在自动驾驶领域,数据标记几乎没有出错的余地,也不缺少关键用例。因此,自动驾驶汽车的数据收集和标记将是一个时间和资源密集型的过程。同时,这也是为什么无人驾驶企业面临上市延迟、产品性能问题、促销难度等问题的原因。Appen(中国)产品研发总监陈成表示,随着向L3级自动驾驶的高度升级,自动驾驶制造商对舱外数据服务的需求不断增加,包括数据需求的增加和更复杂的数据类型的变化。业界对Li DAR3D点云数据的需求使数据标记工作更加复杂,并显著增加了数据成本。对于下游企业来说,如何以低成本获取高质量的数据成为这个时代的唯一需求。Appen(中国)产品研发总监钱成认为,目前自动驾驶数据标记技术主要面临以下困难:1:随着自动驾驶市场的爆发式增长,整体数据量的增加将提高平台的业务吞吐量,对工作流的数据流效率和稳定性提出更高的要求。2:采集数据的准确性提高,数据密度提高,需要处理的单个数据量变大,贴标设备可能相对低端,需要加大研发力度,以支持各种高端设备的工具。3:由于采集设备的多样化和复杂性,数据种类越来越多,对4D传感器数据等多传感器数据融合标记的需求也越来越大。4:数据成本和企业需要降低成本和提高效率,对标签效率和管理能力的要求越来越高,需要不断完善和优化工具功能和项目管理功能。5:随着自动驾驶商业化进程的加快,客户的需求越来越精细和多变,需要加大对模型辅助标记的研发投入,以及针对不同项目的定制模型开发。为了解决上述难题,数据服务企业使用的数据注释技术已经从最初的独立注释工具发展到数据注释平台,现阶段已经升级为智能数据注释平台/企业AI数据注释平台。目前,行业内出现了许多高质量的“平台”。但当涉及到经验和深度积累时,Appen是第一层。作为一家成立于1996年的老牌人工智能培训数据服务公司,在智能驾驶春风席卷中国大陆之前,Appen已经为170个国家、7万个地区提供服务。2019年,中国智能驱动产业进入了全面发展阶段。当时,Appen已经在全球人工智能数据服务领域拥有行业第一的光环。同年10月,Appen以不到10人的原始团队进入中国市场。这支独立的团队凭借20多年的深厚技术积累,短短3年时间,完成了从“0”到“行业第一”的跨越。根据2022年的公开数据,Appen China在专注于人工智能的数据服务提供商中排名第一。尽管2021年爆发了疫情,但销售额仍以421%的爆炸式增长。近三年来,凭借优质高效的数据服务,澳本中国在自动驾驶领域积累了相当规模的客户群,包括知名互联网公司、汽车制造商的创新研发部门。因此,技术、服务、资格和经验是必不可少的。Appen明白,它需要一个成熟的技术系统,包括无缝的接口开发/API对接。因此,澳本中国将根据全球经验自主开发MatrixGo高精度AI数据标记平台,专门针对企业本地部署环境,帮助CIO以高度自动化、标准化、大规模化的方式构建AI标记数据供应链。该平台支持像素级语义分割、2D图像复合标记、3D点云框架和语义分割等功能。同时,标准化任务实现了采集-质检-标签-质检-客户验收的双向协同过程,可以无缝连接整个数据生产线的各个环节。内置的多轮质量检测模块可根据需要进行配置,以满足不同复杂度项目的需要。二维图像复合标记是一个完全结构化的模型训练工具,支持点、线、框、多边形融合标记(常见的工具有单模、点、线、多边形和多边形)和连续框架。总体而言,其喷漆工具能够实现99.9%的准确率,实现5分钟、每秒一帧的快速质量检测,在交互、大数据加载、实时切框渲染等方面均实现行业第一。示例表明,客户的成功部署效率提高了三倍。今年,模型辅助注释(自动注释)在自动驾驶领域取得了技术进步,如交互式语义分割、交通灯预注释、停车位自动识别等,经过不断迭代优化,大部分工具都能将注释效率提高30%-50%。还计划了点云检测和二维障碍物检测等工具,平台版本平均每两周迭代更新一次。

阿彭·阿彭