汽车导航 汽车导航
Ctrl+D收藏汽车导航
首页 > 汽车资讯 > 正文

解决科目二?对话威马自动泊车研发专家

作者:

时间:1900/1/1 0:00:00

每个考过驾照的老司机,或多或少都会回忆起被科目二支配的恐惧——看着车库线,总是力不从心,总是向左或向右压。如果是侧停车,那么方向盘的角度和时机就更难把握了。

但随着智能辅助驾驶的日益普及,这个困扰大部分司机的问题有望得到解决。一些汽车公司已经率先推出解决方案,利用车辆周围的传感器和无人驾驶停车技术来缓解司机的停车烦恼。

9月23日,威马、百度和科大讯飞联合举办了一场自动停车技术的展览。展会期间,威马W6(参数|询价)可以在车内无人的情况下,自动通过侧停车、倒车入库的测试。技术展结束后,汽车之家与威马、百度、科大讯飞进行了对话。

自动泊车的两代演变

无人停车技术,威马已经悄然升级了两代。

目前威马W6使用的是第一代无人泊车,名为HAVP(Home AVP),也叫“无人自学习泊车”。HAVP可以简单理解为使用固定路线进行无人驾驶停车。当用户引导威马W6学习一次泊车路线后,系统会通过一系列传感器自动记忆行驶轨迹和本地、云端预设的泊车位置,实现无人情况下的自动泊车。

当车主呼叫威马W6时,它也能避开障碍物,避开行人,自动接管。

HAVP最适合有固定起止路线的停车场景,比如家里或者公司。在威马即将推出的第二代无人驾驶停车技术上,命名为PAVP(公共AVP)。

PAVP的中文名字叫“无人驾驶高精地图停车”,可以在非固定停车位实现无人驾驶停车。相比HAPP要自由很多,但技术难度也更大,因为这项技术需要高清地图和云计算能力的辅助。

在大型商场、写字楼等非固定停车位的场景下,升级为PAVP的威马W6可以绕过障碍物,跨楼层巡航,在特定停车环境下自动泊车。威马表示,PAVP功能将在年内通过OTA升级推送给用户。

魏玛W6

PAVP的应用将进一步拓展停车场景,适应停车场,但这一功能也是行业挑战,因为它对停车场提出了更高的要求。陈旧的停车场,杂乱的灯光和标志可能会让PAVP难以应付。

针对这个问题,魏玛研究院的工程师表示,魏玛应该先稍微改造一些相对标准化的停车场,让它们逐一适应这种技术。此外,在技术和应用方面,威马将逐步拓展应用场景,包括商业停车场、政府和第三方停车场。

“整个路线就是不断拓展场景,应用更多场景。”魏玛工程师说。对于PAVP科技,百度计划在中国一线城市打开大门。今年底明年初,将有一批商业停车场的测试和运营计划。

第三代停车场正在开发中。

百度与威马合作开发自动泊车技术。截至目前,百度在国内的自动驾驶累计行驶里程已经超过1400万公里,在自动驾驶方面有一定的技术基础。

百度告诉汽车之家,第一代HAPP解决的是固定停车场景,第二代PAVP解决的是商业停车场景,比如商场停车场景。

"第三代被称为UAVP(AVP城市)."百度工程师表示,前两个在停车场,第三个UAVP可以在远离停车场的地方(比如1公里)实现,有天然的停车点,用户可以随意招还车。

“当然,这需要更多的技术辅助,比如车辆协调、高精地图和更强的感知能力。我们希望通过更深层次的技术改进,实现基本完全自主低速场景下的自动驾驶和泊车能力。”百度说。

中文:王亚丽,百度智能汽车事业部-功能安全解决方案高级经理。

目前,HAVP只需要车辆端的感知,而不是现场端。这就带来了一个问题——在未来,场的功能是否会终结……弱化了,而车端和场端应该如何融合?

对此,百度表示,开放PAVP需要一个弱场。“也就是说,可能会有一些转换,比如高精地图的转换。”

“当我们开放UAVP时,我们需要一些场端能力,因为我们将面对一些开放的道路。现在有两种技术方案,车端或者场端。我们觉得这两条通往停车场景最高境界的技术路线一定是相互融合的,需要完善。”

不过百度也表示,从安全角度来说,车端和场端并不是相互替代的,而是相互融合的。

什么是多模态语音交互?

在威马W6上,搭载了全新的WIMI语音助手。

WIMI语音助手支持自然唤醒、关键词唤醒、快速指令唤醒等多种交互模式,可实现120多种常用功能的语音控制。此外,还具备左右双区声源识别能力,支持15秒连续自然语音对话,一次唤醒后可自由中断多次。

据了解,这套系统是由魏玛和科大讯飞联合开发的,科大讯飞将“多模态语音交互技术”植入了这款语音助手中。科大讯飞对这项技术做出了解释。

科大讯飞智能汽车事业部-智能交互产品线总监孟醒。

科大讯飞说,在影响语音识别准确率的因素中,噪音占20%,其次是方言的12%。克服噪声一直是提高语音识别准确率的重要途径。

“有时候,嘈杂场景下的用户语音识别效果会受到目前技术瓶颈的影响。因为在嘈杂的场景下,语音信号受道路噪声的影响很大。在撞击的情况下,仅仅依靠语音信号的一个维度,很难识别和判断用户的指令。”科大讯飞工程师说。

如何解决这种场景下的识别准确率问题?科大讯飞将技术路线瞄准了图像识别技术。

“当用户说话时,不仅声音会发出来,嘴唇也会动。如果我看到他的嘴唇在动,我就开始接收他的声音信号,然后用嘴唇的动作来叠加声音。共同提高高噪声场景下的交互体验和识别准确率。”

所以在嘈杂的场景下,使用的核心技术是唇语。通过将唇动识别与语音信号相结合,提高了识别率。

车内的自然互动是科大讯飞想要征服的第二个场景。自然交互不需要唤醒词,所以一般情况下免唤醒功能会被干扰很多。比如用户不说话,有可能外面的喇叭也能触发汽车。

要解决这个问题,还需要将语音和图像与多模态语音技术相结合。科大讯飞工程师说,“我们会观察主人的嘴唇是否同步运动。当车载机发现一个声音,它会看到司机的嘴唇是否在动。如果嘴唇不动,有声音,大概可以判断声音可能是干扰,这样就可以区分干扰项。”

Weimar W6, found

通过多模态语音交互,可以大大提高语音识别的准确率,解决复杂场景的干扰,让免唤醒和交互功能获得更高的用户满意度。

同样,科大讯飞的工程师正在想象语音交互的未来。“如果未来通过自动驾驶释放驾驶员的能量,会不会出现驾驶舱办公场景,会不会有更多的协同办公,会不会有更多的外部连接,语音在这其中起到什么作用?我们也在进一步思考。”

随着智能化和网联化的日益普及,判断汽车是否智能的标准也在发生变化。从停车到语音交互场景,行业通过一点点的技术改进,不断提升汽车的驾驶体验,这才是推动行业发展的正确解决方案。

随着用户痛点的不断解决,一个真正属于智能汽车的时代或许就在我们眼前。(文/汽车之家程功)每个考过驾照的老司机,或多或少都会回忆起被科目二支配的恐惧——看着车库线,总是无力,总是向左或向右按。如果是侧面停车,那么角度和时机……方向盘甚至更难把握。

但随着智能辅助驾驶的日益普及,这个困扰大部分司机的问题有望得到解决。一些汽车公司已经率先推出解决方案,利用车辆周围的传感器和无人驾驶停车技术来缓解司机的停车烦恼。

9月23日,威马、百度和科大讯飞联合举办了一场自动停车技术的展览。展会期间,威马W6(参数|询价)可以在车内无人的情况下,自动通过侧停车、倒车入库的测试。技术展结束后,汽车之家与威马、百度、科大讯飞进行了对话。

自动泊车的两代演变

无人停车技术,威马已经悄然升级了两代。

目前威马W6使用的是第一代无人泊车,名为HAVP(Home AVP),也叫“无人自学习泊车”。HAVP可以简单理解为使用固定路线进行无人驾驶停车。当用户引导威马W6学习一次泊车路线后,系统会通过一系列传感器自动记忆行驶轨迹和本地、云端预设的泊车位置,实现无人情况下的自动泊车。

当车主呼叫威马W6时,它也能避开障碍物,避开行人,自动接管。

HAVP最适合有固定起止路线的停车场景,比如家里或者公司。在威马即将推出的第二代无人驾驶停车技术上,命名为PAVP(公共AVP)。

PAVP的中文名字叫“无人驾驶高精地图停车”,可以在非固定停车位实现无人驾驶停车。相比HAPP要自由很多,但技术难度也更大,因为这项技术需要高清地图和云计算能力的辅助。

在大型商场、写字楼等非固定停车位的场景下,升级为PAVP的威马W6可以绕过障碍物,跨楼层巡航,在特定停车环境下自动泊车。威马表示,PAVP功能将在年内通过OTA升级推送给用户。

魏玛W6

PAVP的应用将进一步拓展停车场景,适应停车场,但这一功能也是行业挑战,因为它对停车场提出了更高的要求。陈旧的停车场,杂乱的灯光和标志可能会让PAVP难以应付。

针对这个问题,魏玛研究院的工程师表示,魏玛应该先稍微改造一些相对标准化的停车场,让它们逐一适应这种技术。此外,在技术和应用方面,威马将逐步拓展应用场景,包括商业停车场、政府和第三方停车场。

“整个路线就是不断拓展场景,应用更多场景。”魏玛工程师说。对于PAVP科技,百度计划在中国一线城市打开大门。今年底明年初,将有一批商业停车场的测试和运营计划。

第三代停车场正在开发中。

百度与威马合作开发自动泊车技术。截至目前,百度在国内的自动驾驶累计行驶里程已经超过1400万公里,在自动驾驶方面有一定的技术基础。

百度告诉汽车之家,第一代HAPP解决的是固定停车场景,第二代PAVP解决的是商业停车场景,比如商场停车场景。

"第三代被称为UAVP(AVP城市)."百度工程师表示,前两个在停车场,第三个UAVP可以在远离停车场的地方(比如1公里)实现,有天然的停车点,用户可以随意招还车。

“当然,这需要更多的技术辅助,比如车辆协调、高精地图和更强的感知能力。我们希望通过更深层次的技术改进,实现基本完全自主低速场景下的自动驾驶和泊车能力。”百度说。

中文:王亚丽,百度智能汽车事业部-功能安全解决方案高级经理。

目前,HAVP只需要车辆端的感知,而不是现场端。这就带来了一个问题——未来,场端的功能会不会被削弱,车端和场端应该如何融合?

对此,百度表示,开放PAVP需要一个弱场。“也就是说,可能会有一些转换,比如高精地图的转换。”

“当我们打开U……p,我们需要一些野外能力,因为我们将面临一些开放的道路。现在有两种技术方案,车端或者场端。我们觉得这两条通往停车场景最高境界的技术路线一定是相互融合的,需要完善。"

不过百度也表示,从安全角度来说,车端和场端并不是相互替代的,而是相互融合的。

什么是多模态语音交互?

在威马W6上,搭载了全新的WIMI语音助手。

WIMI语音助手支持自然唤醒、关键词唤醒、快速指令唤醒等多种交互模式,可实现120多种常用功能的语音控制。此外,还具备左右双区声源识别能力,支持15秒连续自然语音对话,一次唤醒后可自由中断多次。

据了解,这套系统是由魏玛和科大讯飞联合开发的,科大讯飞将“多模态语音交互技术”植入了这款语音助手中。科大讯飞对这项技术做出了解释。

科大讯飞智能汽车事业部-智能交互产品线总监孟醒。

科大讯飞说,在影响语音识别准确率的因素中,噪音占20%,其次是方言的12%。克服噪声一直是提高语音识别准确率的重要途径。

“有时候,嘈杂场景下的用户语音识别效果会受到目前技术瓶颈的影响。因为在嘈杂的场景下,语音信号受道路噪声的影响很大。在撞击的情况下,仅仅依靠语音信号的一个维度,很难识别和判断用户的指令。”科大讯飞工程师说。

如何解决这种场景下的识别准确率问题?科大讯飞将技术路线瞄准了图像识别技术。

“当用户说话时,不仅声音会发出来,嘴唇也会动。如果我看到他的嘴唇在动,我就开始接收他的声音信号,然后用嘴唇的动作来叠加声音。共同提高高噪声场景下的交互体验和识别准确率。”

所以在嘈杂的场景下,使用的核心技术是唇语。通过将唇动识别与语音信号相结合,提高了识别率。

车内的自然互动是科大讯飞想要征服的第二个场景。自然交互不需要唤醒词,所以一般情况下免唤醒功能会被干扰很多。比如用户不说话,有可能外面的喇叭也能触发汽车。

要解决这个问题,还需要将语音和图像与多模态语音技术相结合。科大讯飞工程师说,“我们会观察主人的嘴唇是否同步运动。当车载机发现一个声音,它会看到司机的嘴唇是否在动。如果嘴唇不动,有声音,大概可以判断声音可能是干扰,这样就可以区分干扰项。”

Weimar W6, found

通过多模态语音交互,可以大大提高语音识别的准确率,解决复杂场景的干扰,让免唤醒和交互功能获得更高的用户满意度。

同样,科大讯飞的工程师正在想象语音交互的未来。“如果未来通过自动驾驶释放驾驶员的能量,会不会出现驾驶舱办公场景,会不会有更多的协同办公,会不会有更多的外部连接,语音在这其中起到什么作用?我们也在进一步思考。”

随着智能化和网联化的日益普及,判断汽车是否智能的标准也在发生变化。从停车到语音交互场景,行业通过一点点的技术改进,不断提升汽车的驾驶体验,这才是推动行业发展的正确解决方案。

随着用户痛点的不断解决,一个真正属于智能汽车的时代或许就在我们眼前。(文/汽车之家程功)

标签:威马W6发现

汽车资讯热门资讯
被特斯拉打脸!福特召回近5000辆野马Mach-E

曾经嘲笑特斯拉的福特,被直接打脸了近日,福特在加拿大召回近5000辆野马MachE,具体原因为玻璃车顶和挡风玻璃可能松动并脱落。本次福特共在加大拿发起两次召回。

1900/1/1 0:00:00
支持5G网络通讯 顺丰无人配送车亮相

日前我们获悉,顺丰无人配送车在苏州正式亮相。随着科技的发展,未来的快递配送服务或许也将迎来“新时代”,在诸多智能科技装备的加持下,“智慧物流”服务或将成为未来的主流发展趋势。

1900/1/1 0:00:00
国产电动车卖80万 看完工厂我彻底服了

每周一更,不见不散,新能源周刊汇集本周精彩内容,一次看过瘾本周探秘高合HiPhi工厂,高自动化高环保的绿色工厂太牛了;

1900/1/1 0:00:00
历时15个月 小鹏P7累计交付达到5万台

9月23日,小鹏汽车官方表示,旗下小鹏P7累计交付达到5万台。自2020年7月至2021年9月,仅历时15个月,小鹏P7完成了从0到50000台的交付里程碑。

1900/1/1 0:00:00
名爵首创“燃油新势力”!上汽祭出传统车企“双线”突围样本

一流的车企做标准当上海汽车集团股份有限公司数据业务部副总经理、上汽乘用车公司首席数字官(CDO)张亮祭出“燃油新势力”这个全新的概念时,可以预期,

1900/1/1 0:00:00
第一个向中国输出氢燃料电池的是谁?

在碳达峰、碳中和的目标下,氢能在各领域的新兴应用正经历“从0到1”的突破期,布局参与氢能的主体也快速增多。其中,现代汽车集团是全球氢能格局中不可或缺,甚至于说,是领先的一部分。

1900/1/1 0:00:00