汽车导航 汽车导航
Ctrl+D收藏汽车导航
首页 > 汽车资讯 > 正文

?智能驾驶疆场,海天瑞声的「数据」纵横论

作者:

时间:1900/1/1 0:00:00

上海世博中心和世界人工智能大会的筹备工作正在紧锣密鼓地进行。

作为人工智能的重要应用之一,自动驾驶也将在本次年度全球顶级大会期间大放异彩——

官方消息称,展会期间将首次面向观众推出基于开放道路的载人应用体验。体验路线全长2.8公里,有12个路口穿过世博中心。此外,特定区域的自动驾驶应用展示也将同步进行。

自动驾驶动态体验电路

基于这些应用体验,可以展示国内自动驾驶产业链的成果和最高技术水平,也可以一窥自动驾驶技术对人们日常生活和出行方式的改变。

其实,自动驾驶系统顺利运行的背后,是一个大家都很熟悉的关键词——数据。

“数据已经成为生产要素,前提是将人类世界的信息转化为计算机可以识别的方式。”海天盛瑞副总裁李可告诉新智家。

为了打造真正安全可靠的量产自动驾驶产品,并支持数千辆自动驾驶车辆同时交互,企业必须了解如何高效收集和有效利用海量数据。

那么,我们到底应该怎么做呢?

智能驾驶的“幕后英雄”

虽然没有硬件那么有形,但无论是自动驾驶、辅助驾驶还是智能驾驶舱,这些被赋予智能属性的驾驶体验都离不开数据的驱动。

在李可看来,通过对数据生产的各个环节(设计、采集、处理、质检)进行训练,可以获得很多有利于智能驾驶算法模型迭代的规律和结论。

例如关于驾驶员踩刹车的图像数据。

这个动作通常代表判断和决定的结果,那么在这个动作之前发生了什么?这次行动之后发生了什么?有什么特别的事情发生吗?

再比如关于机舱内语音交互的数据。

语音交互过程中,哪些功能可能会干扰驾驶?麦克风如何布置才能更好的满足每个座位的交互需求?回声噪音是什么情况,如何解决?

对于自动驾驶公司和主机厂来说,这些数据值得特别关注,因为它们可能有助于加强拐角情况的处理能力,优化用户的乘坐体验。

计算机视觉和智能语音训练数据是海天盛瑞从事近20年的领域,已经为微软、亚马逊、阿里等500多家国内外知名企业提供了从方案设计、数据采集、处理到质检、交付的全流程数据服务。

其中,海天瑞声在智能驾驶舱的布局最早可以追溯到2005年。这些课程无疑积累了足够的数据级诀窍,使得海天日盛能够基于自身的技术研发实力和经验沉淀,从数据角度加速客户的算法模型训练和商业化,并相应地受到越来越多智能驾驶客户的青睐。

想得深,走得远。

事实上,一个有实力、有经验的数据合伙人,除了数据收集和标注服务,最重要的是帮助玩家准确预估投入产出比,找到契合整体商业目标的解决方案。

在这方面,李可也试图通过一个例子来帮助理解。

在训练算法模型时,玩家希望得到某个场景中所有可能出现的情况,以数据的形式交给机器学习。在智能驾驶业务中,这不仅包括常规的路况(拥堵、城市街道、高速公路路段)、大雾、暴风雨雪等天气条件、白天、夜晚、清晨、傍晚等不同的照明条件,还包括交通事故、违法行为等各种突发情况。

智能座舱外的采集环境多样而复杂。

这需要包括海天盛瑞在内的数据服务提供商深入了解客户的业务场景。在设计方案的过程中,应该考虑算法对样本划分的要求……sity,不同样本数据的比例应该是多少,同类型场景的数据至少要达到多少才能满足机器学习的需要,如何设计数据方案才能避免与模型过拟合、欠拟合等诸多问题。

帮助客户在数据准备阶段不走弯路,加速模型训练、产品落地和迭代,是海天盛瑞的初衷。

砖和瓦的技术壁垒

随着智能驾驶的进一步发展,在可预见的未来,玩家对底层数据处理能力的要求会越来越高,对长尾场景数据的需求会更大,对高质量训练数据的需求会更强烈。智能驾驶的发展已经成为不可逆转的趋势,并具备进一步应用的充分条件。

但该领域高质量的一站式数据服务较少,整体数据处理速度、精度和准确度仍有待提高,尤其是三维点云数据。

因为深谋远虑,海天盛瑞已经开始思考如何最大限度地发挥自己在数据处理方面的先发优势,帮助玩家解决痛点。据了解,海天AAC的技术已经能够支持3D点云标注、3D点云连续帧标注、3D连续帧和2D联合标注、3D语义分割等。

例如,对于同一物体在不同空间的数据处理,海天盛瑞前期会在多个坐标系中进行建模和配准,标定后再投影到同一个坐标系中,最终保证不同空间标注结果的统一。

对于3D &;通过2D的联合标注,海天盛瑞可以通过算法将3D标注结果自动投影到2D平面,进而自动生成相应目标的空间位置。

可以看出,得益于在数据服务领域强大的技术实力和艰苦的工作经验,即使在新兴的、高难度的三维点云数据处理方面,海天盛瑞也做得不错。

在客舱场景中,DMS数据由于涉及光线、多角度同步等不同需求,采集难度较大。海天AAC基于自主研发的多声道桌面车载录音工具,配合不同采集设备,从采集端实现多声道同步,支持灵活的参数设置和实时语音质量检测,可以提高采集效率,实时监控采集质量。

舱内多通道采集示例

这些都是海天盛瑞区别于行业内其他数据服务提供商的根本,也是他们通过多年的努力为自己构筑的深度壁垒,使他们能够引领智能驾驶数据服务。

数据安全是我们生活的基础。

随着行业的快速发展,多样化需求的背后,不变的是对数据合规性和安全性的要求。作为行业的领导者,海天盛瑞在稳步前进的同时,也在合规和安全方面持续加大建设力度。

在业内首创了科学的项目管理体系,从资源合规、数据存储安全、流转等方面制定了详细的措施:

比如,所有项目在采集前必须获得被采集人的书面授权,否则需要重新配置资源以确保合规;

同时,海天瑞声专门设立了数据保护官(以下简称“DPO”),进行数据安全和合规性审计;并通过完善的制度和法规,充分保障被征收人的权利。有一次,一个海外采集的人在项目结束后申请删除个人数据信息,撤回了相应的授权。收到请求后,DPO联系客户并协商操作,最终在24小时内完成了被收集人的要求。

2018年5月,被称为“史上最严数据保护法案”的欧盟颁布的《通用数据保护条例》,曾因英国航空公司在数据信息保护方面的失职,向其开出15.8亿元人民币的天价罚单。值得一提的是,该法案一经颁布,就被海天瑞声呐纳入项目和技术R&D人员的“必修课”,并组织学习和考核。

除了制度上的严格规范,一向以技术严谨著称的海天盛瑞自然也有相应的保障数据安全的“硬实力”,那就是一体化的数据处理平台:

该平台基于海天盛瑞近20年的数据服务经验,并经过数十项核心技术和专利的打磨。平台内数千个自主研发的标注工具联合开放,不仅可以用于处理复杂的跨业务场景数据,更重要的是保证数据从采集到脱敏、清洗、标注、质检的全流程不出平台即可完成。加上平台中严格的人员权限管理和实时监控功能,充分保证了数据的安全性和可控性。

此外,还支持私有部署、现场标注等一系列高层数据安全处理请求。

这些举措都让海天瑞声很早就通过了ISO/IEC 27001管理体系认证,最近又获得了“最严格资质审核”称号的ISO/IEC 27701隐私保护标准认证。

数据的合规性和安全性是客户的重要需求,也是海天盛瑞坚守的生命线。

走在未来的路上

纵观行业发展,智能驾驶已经成为世界上大多数国家和地区都在推进的主旋律,这个市场的规模将呈指数级增长。

对此,李可告诉新智家,

目前一些造车新势力发展迅速,将进一步带动舱外感知的数据需求。今年,我们在继续在舱内发力的同时,将重点放在舱外的布局上。

事实上,无论是舱内还是舱外,与这些场景相结合的技术大多离不开智能语音、计算机视觉、自然语言理解——这些都是海天盛瑞一直在培育并将继续培育的方向。正如李可介绍的,从2005年开始,海天瑞声就开始在AI全核心领域进行深入的数据布局。

16年后,海天瑞声已经站在了数据服务行业的山顶。

全球化的语言学家团队,160多种语言的方言服务能力,覆盖全球近半个国家和地区的本地化项目经验,760多项拥有自主知识产权的训练数据产品,这些都是海天盛瑞长期坚持创新和自主研发的成果——不仅能帮助其在火热的智能驾驶赛道上大显身手,更能加速自动驾驶和智能驾驶舱在国内外的应用;它也可以成为海地盛瑞发展的代名词,成为其自身业务延续和扩展的重要基础。

无论从什么角度来看,用户驱动、需求驱动、实战驱动都是推动海天盛瑞持续稳步前进的动能。只有这些方式做出来的产品,才能接地气,才有真正的生命力。

雷锋网(微信官方账号:雷锋网)雷锋网雷锋网

雷锋的原创文章。未经授权,禁止转载。详见转载说明。上海世博中心和世界人工智能大会的筹备工作正在紧锣密鼓地进行。

自动驾驶作为人工智能的重要应用之一,也将在本次年度全球顶级大会期间大放异彩——

官方消息称,展会期间将首次面向观众推出基于开放道路的载人应用体验。体验路线全长2.8公里,有12个路口穿过世博中心。此外,特定区域的自动驾驶应用展示也将同步进行。

自动驾驶动态体验电路

基于这些应用体验,可以展示国内自动驾驶产业链的成果和最高技术水平,也可以一窥自动驾驶技术对人们日常生活和出行方式的改变。

其实,自动驾驶系统顺利运行的背后,是一个大家都很熟悉的关键词——数据。

“数据已经成为生产要素,前提是将人类世界的信息转化为计算机可以识别的方式。”海天盛瑞副总裁李可告诉新智家。

为了打造真正安全可靠的量产自动驾驶产品,并支持数千辆自动驾驶车辆同时交互,企业必须了解如何高效收集和有效利用海量数据。

那么,我们到底应该怎么做呢?

智能驾驶的“幕后英雄”

虽然没有硬件那么有形,但无论是自动驾驶、辅助驾驶还是智能驾驶舱,这些被赋予智能属性的驾驶体验都离不开数据的驱动。

在李可看来,通过对数据生产的各个环节(设计、采集、处理、质检)进行训练,可以获得很多有利于智能驾驶算法模型迭代的规律和结论。

例如关于驾驶员踩刹车的图像数据。

这个动作通常代表判断和决定的结果,那么在这个动作之前发生了什么?这次行动之后发生了什么?有什么特别的事情发生吗?

再比如关于机舱内语音交互的数据。

语音交互过程中,哪些功能可能会干扰驾驶?麦克风如何布置才能更好的满足每个座位的交互需求?回声噪音是什么情况,如何解决?

对于自动驾驶公司和主机厂来说,这些数据值得特别关注,因为它们可能有助于加强拐角情况的处理能力,优化用户的乘坐体验。

计算机视觉和智能语音训练数据是海天盛瑞从事近20年的领域,已经为微软、亚马逊、阿里等500多家国内外知名企业提供了从方案设计、数据采集、处理到质检、交付的全流程数据服务。

其中,海天瑞声在智能驾驶舱的布局最早可以追溯到2005年。这些课程无疑积累了足够的数据级诀窍,使得海天日盛能够基于自身的技术研发实力和经验沉淀,从数据角度加速客户的算法模型训练和商业化,并相应地受到越来越多智能驾驶客户的青睐。

想得深,走得远。

事实上,一个有实力、有经验的数据合伙人,除了数据收集和标注服务,最重要的是帮助玩家准确预估投入产出比,找到契合整体商业目标的解决方案。

在这方面,李可也试图通过一个例子来帮助理解。

在训练算法模型时,玩家希望获得某个场景中所有可能的情况,并将其交给机器在……rm的数据。在智能驾驶业务中,这不仅包括常规的路况(拥堵、城市街道、高速公路路段)、大雾、暴风雨雪等天气条件、白天、夜晚、清晨、傍晚等不同的照明条件,还包括交通事故、违法行为等各种突发情况。

智能座舱外的采集环境多样而复杂。

这需要包括海天盛瑞在内的数据服务提供商深入了解客户的业务场景。在设计方案的过程中,他们要考虑到算法对样本多样性的需求,不同样本数据的比例应该是多少,同类型场景的数据至少要达到多少才能满足机器学习的需要,如何设计数据方案才能避免与模型过拟合、欠拟合等诸多问题。

帮助客户在数据准备阶段不走弯路,加速模型训练、产品落地和迭代,是海天盛瑞的初衷。

砖和瓦的技术壁垒

随着智能驾驶的进一步发展,在可预见的未来,玩家对底层数据处理能力的要求会越来越高,对长尾场景数据的需求会更大,对高质量训练数据的需求会更强烈。智能驾驶的发展已经成为不可逆转的趋势,并具备进一步应用的充分条件。

但该领域高质量的一站式数据服务较少,整体数据处理速度、精度和准确度仍有待提高,尤其是三维点云数据。

因为深谋远虑,海天盛瑞已经开始思考如何最大限度地发挥自己在数据处理方面的先发优势,帮助玩家解决痛点。据了解,海天AAC的技术已经能够支持3D点云标注、3D点云连续帧标注、3D连续帧和2D联合标注、3D语义分割等。

比如,对于同一物体在不同空间的数据处理,海天盛瑞前期会在多个坐标系中进行建模和配准,标定后再投影到同一个坐标系中,最终保证不同空间标注结果的统一。

对于3D &;通过2D的联合标注,海天盛瑞可以通过算法将3D标注结果自动投影到2D平面,进而自动生成相应目标的空间位置。

可以看出,得益于在数据服务领域强大的技术实力和艰苦的工作经验,即使在新兴的、高难度的三维点云数据处理方面,海天盛瑞也做得不错。

在客舱场景中,DMS数据由于涉及光线、多角度同步等不同需求,采集难度较大。海天AAC基于自主研发的多声道桌面车载录音工具,配合不同采集设备,从采集端实现多声道同步,支持灵活的参数设置和实时语音质量检测,可以提高采集效率,实时监控采集质量。

舱内多通道采集示例

这些都是海天盛瑞区别于行业内其他数据服务提供商的根本,也是他们通过多年的努力为自己构筑的深度壁垒,使他们能够引领智能驾驶数据服务。

数据安全是我们生活的基础。

随着行业的快速发展,多样化需求的背后,不变的是对数据合规性和安全性的要求。作为行业的领导者,海天盛瑞在稳步前进的同时,也在合规和安全方面持续加大建设力度。

在业内首创了科学的项目管理体系,从资源合规、数据存储安全、流转等方面制定了详细的措施:

比如,所有项目在采集前必须获得被采集人的书面授权,否则需要重新配置资源以确保合规;

同时,海天瑞声专门设立了数据保护官(以下简称“DPO”),进行数据安全和合规性审计;并通过完善的制度和法规,充分保障被征收人的权利。有一次,一个海外采集的人在项目结束后申请删除个人数据信息,撤回了相应的授权。收到请求后,DPO联系客户并协商操作,最终在24小时内完成了被收集人的要求。

2018年5月,被称为“史上最严数据保护法案”的欧盟颁布的《通用数据保护条例》,曾因英国航空公司在数据信息保护方面的失职,向其开出15.8亿元人民币的天价罚单。值得一提的是,该法案一经颁布,就被海天瑞声呐纳入项目和技术R&D人员的“必修课”,并组织学习和考核。

除了制度上的严格规范,一向以技术严谨著称的海天盛瑞自然也有相应的保障数据安全的“硬实力”,那就是一体化的数据处理平台:

该平台基于海天盛瑞近20年的数据服务经验,并经过数十项核心技术和专利的打磨。平台内数千个自主研发的标注工具联合开放,不仅可以用于处理复杂的跨业务场景数据,更重要的是保证数据从采集到脱敏、清洗、标注、质检的全流程不出平台即可完成。加上平台中严格的人员权限管理和实时监控功能,充分保证了数据的安全性和可控性。

此外,还支持私有部署、现场标注等一系列高层数据安全处理请求。

这些举措都让海天瑞声很早就通过了ISO/IEC 27001管理体系认证,最近又获得了“最严格资质审核”称号的ISO/IEC 27701隐私保护标准认证。

数据的合规性和安全性是客户的重要需求,也是海天盛瑞坚守的生命线。

走在未来的路上

纵观行业发展,智能驾驶已经成为世界上大多数国家和地区都在推进的主旋律,这个市场的规模将呈指数级增长。

对此,李可告诉新智家,

目前一些造车新势力发展迅速,将进一步带动舱外感知的数据需求。今年,我们在继续在舱内发力的同时,将重点放在舱外的布局上。

事实上,无论是舱内还是舱外,与这些场景相结合的技术大多离不开智能语音、计算机视觉、自然语言理解——这些都是海天盛瑞一直在培育并将继续培育的方向。正如李可介绍的,从2005年开始,海天瑞声就开始在AI全核心领域进行深入的数据布局。

16年后,海天瑞声已经站在了数据服务行业的山顶。

全球化的语言学家团队,160多种语言的方言服务能力,覆盖全球近半个国家和地区的本地化项目经验,760多项拥有自主知识产权的训练数据产品,这些都是海天盛瑞长期坚持创新和自主研发的成果——不仅能帮助其在火热的智能驾驶赛道上大显身手,更能加速自动驾驶和智能驾驶舱在国内外的应用;它也可以成为海地盛瑞发展的代名词,成为其自身业务延续和扩展的重要基础。

无论从什么角度来看,用户驱动、需求驱动、实战驱动都是推动海天盛瑞持续稳步前进的动能。只有这些方式做出来的产品,才能接地气,才有真正的生命力。

雷锋网(微信官方账号:雷锋网)雷锋网雷锋网

雷锋的原创文章。未经授权,禁止转载。详见转载说明。

标签:

汽车资讯热门资讯
投资4亿欧元 宝马为投产iX升级德国工厂

据海外媒体报道,宝马纯电动车iX即将在德国丁戈尔芬工厂下线,该工厂是宝马集团在欧洲最大的生产设施。为此,宝马已经向丁戈尔芬工厂投资超过4亿欧元。

1900/1/1 0:00:00
东风风行品牌焕新,全新劲狮启程

去年11月,新风行品牌之夜,东风风行展示了在风行T5EVO上率先搭载的全新劲狮车标,此举向市场透露了风行品牌全面焕新的意愿;

1900/1/1 0:00:00
原北汽新能源ARCFOX营销总经理俞晨加盟长安马自达

据相关媒体报道,原北汽新能源ARCFOX营销中心总经理俞晨已加入长安马自达,任新能源营销总经理一职。未来,俞晨将在长安马自达负责新能源产品营销战略制定、营销体系搭建、营销模式创新等工作。

1900/1/1 0:00:00
打造电动超跑 保时捷与Rimac合资敲定

7月5日,保时捷宣布,与克罗地亚跑车制造商Rimac成立合资企业,布加迪也将被包含其中。

1900/1/1 0:00:00
马斯克坦诚:没想到自动驾驶开发是如此困难

特斯拉CEO埃隆马斯克(ElonMusk)曾多次鼓吹其自动驾驶功能,不过,该功能目前并未实现真正的自动驾驶,还是处于辅助驾驶阶段。

1900/1/1 0:00:00
特斯拉将开始交付搭载国产电机的Model 3和Model Y车型,功率有所提升

近日,特斯拉将开始交付搭载国产电机的Model3和ModelY车型,新车的最大功率和最大扭矩有所上调。

1900/1/1 0:00:00