汽车导航 汽车导航
Ctrl+D收藏汽车导航
首页 > 汽车资讯 > 正文

自动驾驶下的AI识别,数据标注赋能背后的自动化伪命题

作者:

时间:1900/1/1 0:00:00

在智能驾驶中,汽车需要通过感知、规划、决策和控制等方面的努力,使机器“智能化”。人们通常愿意将这一过程称为人工智能。事实上,所谓的智慧只是一个结果。为了使机械智能化,在这个过程中需要无数的人力。数据标注就是这样一项工作,它的意义在于让机器理解和了解世界。通常,数据注释包括语音、文本、图像等。工人需要对具有更多行业标准或客户要求的相应数据进行分类、框定、注释、标记等,然后将生成的数据反馈给客户。据此,客户训练机器了解上述特征,C端用户体验到的智能语音交互和视觉图像识别都来自于此。数据标注是一项手工工作,需要大量人员进行简单重复的工作,且成本较高。该行业也在寻找一种自动化的方式。

业内人士告诉高科智能汽车,自动数据标注在当前行业仍然是一个“遥远的梦想”,在可预见的时期内,数据标注将由人主导。数据标签的分类数据标签的对象通常包括图像、语音、文本、视频、雷达等。图像类别主要针对视觉识别公司,需要标记的图像内容包括肖像、建筑物、植物、道路、交通标志、车辆等。在每种内容下,会根据不同的特征标记不同的标签。以使用最广泛的肖像为例,标签公司可能需要标记目标的性别、年龄、肤色、着装、表情、发型和姿势,方法将是框定和标签。拼音标注也是一种常见的标注方式。该公司将对比编写音频文本,并可能在句子中标记主语、谓语和宾语,以便于机器学习。随着激光雷达在自动驾驶中的频繁应用,对雷达扫描和识别障碍物的需求越来越频繁,如何将激光雷达扫描到的物体以更直观的形式显示给用户成为一项有待完成的任务。数据标注公司将大致勾勒出激光雷达扫描到的物体,还将标记相应的障碍物,包括但不限于它们的名称和类别,并以不同的颜色显示。经过这种深度处理后,激光雷达也间接具备了识别障碍物的能力。无论是图像、语音还是雷达数据的标签,数据标签公司通常都有自己的标准来对数据进行分类,目标客户也会有自己的标签。业内人士表示,一般来说,客户会有自己的需求,公司会遵守规则。目前,在中国,阿里巴巴、腾讯、百度等大型互联网公司对数据标注的需求巨大,单笔订单量以亿元为单位。如此大的订单基本上是分包给不同的数据标注公司进行处理,国内外没有一家公司能够处理如此大的一笔订单。此外,还有自动驾驶公司和视觉图像处理公司,它们对数据标签也有很强的需求。他们需要用标注的数据来训练人工智能,而人工智能的成熟是永无止境的。面对巨大的数据标签需求,劳动密集型行业的技术水平如何?在回答这个问题之前,我先给你一组数据。ImageNet是一个计算机视觉系统识别项目的名称,该项目由美国斯坦福大学计算机科学家李飞飞教授领导的团队建立,旨在模拟人类识别系统。它是目前世界上最大的图像识别数据库,拥有1500万张图片。来自167个国家的48940名工作人员花了两年时间对通过互联网收集的近10亿张图片进行了清理、分类和标记。由于数据量巨大且开源,ImageNet很快成为研究图像识别的首选。然而,ImageNet也有自己的弱点:标记框太大,标记方法太少,错误不时出现,这使得它很难用于训练实用的算法模型。从上面可以看出,即使是业界最强大的图像识别数据库,数据注释也是手动完成的。因此,其他宣传数据的标注是自动的,可信度较低。据业内人士透露,数据实验室……

ing是一件简单而困难的事情。简单之处在于,筛选规则确定后,操作人员只需遵循规则,执行起来并不困难。难点在于,数据标注的本质是获得更准确、更精细的数据结果,行业急需高质量的数据。然而,数据注释本身是一项枯燥的工作,工作人员需要重复大量数据,因此很难确保数据的一致性。标记这些数据的工作本身就是为了提高机器学习的能力,所以这部分工作只能由人来完成,而人和机器之间的差距正是机器想要跨越的。数据标注公司目前的做法是雇佣一些专业的标注人员,然后雇佣一些兼职人员一起完成订单。由于劳动力成本高,大多数数据标签公司都在三线以下城市设立了公司。专业人员和兼职人员的工作能力仍有一定差距。为了确保数据标注的质量,数据标注公司通常会成立一个审计小组来检查标注的数据。数据收集和标记是一项高度专业的工作,必须对每种材料进行专业指导。培训过程包括理解目标、学习规则和在线培训&;视频学习实景实习标准考试工作纠错讲解&;

纠正错误(如果错误严重,输出不达标,则返回规则学习阶段)。在审计方面,公司将采用多种交叉审计审计机制进行标记和审计,并严格控制标记的每个过程。据业内人士透露,数据标注的人工成本仍然很高。以语音数据为例,客户通常会提供完整有效的数据音频,然后根据完成的有效时间段来衡量价格。音频通常包含方言、噪音等。标记者有时需要反复听音频才能完成将音频转换为文本的工作。一个小时的音频通常需要一天的时间才能完成,业内给出的价格通常在300元左右。这个市场是完全免费的。甲乙双方一方面要考虑成本、质量等因素,另一方面也要考虑劳动力成本。由于技术含量低,成长空间小,数据标注工作大多是短期的,员工积极性低,面临人才流失的问题。资本市场的博弈最终会找到一个平衡点,让工人愿意留下来继续工作。在众包下,半自动资本是逐利的。为了降低成本和提高效率,数据标签公司和客户都在努力提高数据标签的效率。人们更多地谈论数据标签自动化,但业内人士表示,数据标签自动化是一个伪命题。除了技术可行性之外,完成自动化所需的人才在业内是罕见的。本质上,大公司最有能力做这部分工作,但现实是,大公司的数据标签业务基本上外包给了小公司。另一方面,小公司仍沉浸在海上战术中。为了提高贴标效率和降低成本,数据贴标公司基本上都是众包和半自动化。所谓的众包,类似于国外高精度地图的采集,即公司在网上发布订单,让有空闲时间的网友一起完成数据标注的工作,这可能涉及到给予一些奖励,但与目前线下繁重的劳动模式相比,降低了很多成本。然而,众包形式对数据标注的工作流程有更高的要求。网络用户在完成数据标注时必须简单、快速、易用,才能普及。目前,数据标注过程需要人工框定、标注和后续人工审核,整个过程比较复杂。据业内人士介绍,现在可以提高效率的工作是开发一个在线系统,简化和规范贴标工作,最大限度地减少贴标人员的一些重复和简单的工作。开发这样的系统需要专业的研发人员,而大多数数据标签公司很少有多余的能力来进行这部分纯粹的投资和研发。因此,数据标签公司未来的目标是实现半自动数据标签,而这背后仍然依赖于众包。所谓的自动标注本身就是一个伪命题。如果数据可以自动标注,那么本质上就没有必要标注,因为人工智能已经具备了和人类一样的识别能力。这一天什么时候到来?大家所期待的~在智能驾驶中,汽车需要通过感知、规划、决策和控制等方面的努力,使机器“智能化”。人们通常愿意将这一过程称为人工智能。事实上,所谓的智慧只是一个结果。为了使机械智能化,在这个过程中需要无数的人力。数据标注就是这样一项工作,它的意义在于让机器理解和了解世界。通常,数据注释包括语音、文本、图像等。工人需要对具有更多行业标准或客户要求的相应数据进行分类、框定、注释、标记等,然后将生成的数据反馈给客户。据此,客户训练机器了解上述特征,C端用户体验到的智能语音交互和视觉图像识别都来自于此。数据标注是一项手工工作,需要大量人员进行简单重复的工作,且成本较高。该行业也在寻找一种自动化的方式。

业内人士告诉高科技智能汽车,自动数据标签仍然是一个“dis……”……

nt dream”在当前行业中,在可预见的时期内,数据标签将由人主导。数据标签的分类数据标签的对象通常包括图像、语音、文本、视频、雷达等。图像类别主要针对视觉识别公司,需要标记的图像内容包括肖像、建筑、植物、道路、交通标志、车辆等。在每个内容下,会根据不同的特征标记不同的标签。以使用最广泛的肖像为例,标签公司可能需要标记目标的性别、年龄、肤色、着装、表情、发型和姿势,方法将是框定和标签。拼音标注也是一种常见的标注方式。该公司将对比编写音频文本,并可能在句子中标记主语、谓语和宾语,以便于机器学习。随着激光雷达在自动驾驶中的频繁应用,对雷达扫描和识别障碍物的需求越来越频繁,如何将激光雷达扫描到的物体以更直观的形式显示给用户成为一项有待完成的任务。数据标注公司将大致勾勒出激光雷达扫描到的物体,还将标记相应的障碍物,包括但不限于它们的名称和类别,并以不同的颜色显示。经过这种深度处理后,激光雷达也间接具备了识别障碍物的能力。无论是图像、语音还是雷达数据的标签,数据标签公司通常都有自己的标准来对数据进行分类,目标客户也会有自己的标签。业内人士表示,一般来说,客户会有自己的需求,公司会遵守规则。目前,在中国,阿里巴巴、腾讯、百度等大型互联网公司对数据标注的需求巨大,单笔订单量以亿元为单位。如此大的订单基本上是分包给不同的数据标注公司进行处理,国内外没有一家公司能够处理如此大的一笔订单。此外,还有自动驾驶公司和视觉图像处理公司,它们对数据标签也有很强的需求。他们需要用标注的数据来训练人工智能,而人工智能的成熟是永无止境的。面对巨大的数据标签需求,劳动密集型行业的技术水平如何?在回答这个问题之前,我先给你一组数据。ImageNet是一个计算机视觉系统识别项目的名称,该项目由美国斯坦福大学计算机科学家李飞飞教授领导的团队建立,旨在模拟人类识别系统。它是目前世界上最大的图像识别数据库,拥有1500万张图片。来自167个国家的48940名工作人员花了两年时间对通过互联网收集的近10亿张图片进行了清理、分类和标记。由于数据量巨大且开源,ImageNet很快成为研究图像识别的首选。然而,ImageNet也有自己的弱点:标记框太大,标记方法太少,错误不时出现,这使得它很难用于训练实用的算法模型。从上面可以看出,即使是业界最强大的图像识别数据库,数据注释也是手动完成的。因此,其他宣传数据的标注是自动的,可信度较低。业内人士表示,数据标注是一件简单而困难的事情。简单之处在于,筛选规则确定后,操作人员只需遵循规则,执行起来并不困难。难点在于,数据标注的本质是获得更准确、更精细的数据结果,行业急需高质量的数据。然而,数据注释本身是一项枯燥的工作,工作人员需要重复大量数据,因此很难确保数据的一致性。标记这些数据的工作本身就是为了提高机器学习的能力,所以这部分工作只能由人来完成,而人和机器之间的差距正是机器想要跨越的。数据标注公司目前的做法是雇佣一些专业的标注人员,然后雇佣一些兼职人员一起完成订单。由于劳动力成本高,大多数数据标签公司都在三线以下城市设立了公司。专业人员和兼职人员的工作能力仍有一定差距。为了确保数据标注的质量,数据标注公司通常会成立一个审计小组来检查标注的数据。数据列……

操作和标记是高度专业的工作,必须对每种材料进行专业指导。培训过程包括理解目标、学习规则和在线培训&;视频学习实景实习标准考试工作纠错讲解&;纠正错误(如果错误严重,输出不达标,则返回规则学习阶段)。在审计方面,公司将采用多种交叉审计审计机制进行标记和审计,并严格控制标记的每个过程。据业内人士透露,数据标注的人工成本仍然很高。以语音数据为例,客户通常会提供完整有效的数据音频,然后根据完成的有效时间段来衡量价格。音频通常包含方言、噪音等。标记者有时需要反复听音频才能完成将音频转换为文本的工作。一个小时的音频通常需要一天的时间才能完成,业内给出的价格通常在300元左右。这个市场是完全免费的。甲乙双方一方面要考虑成本、质量等因素,另一方面也要考虑劳动力成本。由于技术含量低,成长空间小,数据标注工作大多是短期的,员工积极性低,面临人才流失的问题。资本市场的博弈最终会找到一个平衡点,让工人愿意留下来继续工作。在众包下,半自动资本是逐利的。为了降低成本和提高效率,数据标签公司和客户都在努力提高数据标签的效率。人们更多地谈论数据标签自动化,但业内人士表示,数据标签自动化是一个伪命题。除了技术可行性之外,完成自动化所需的人才在业内是罕见的。本质上,大公司最有能力做这部分工作,但现实是,大公司的数据标签业务基本上外包给了小公司。另一方面,小公司仍沉浸在海上战术中。为了提高贴标效率和降低成本,数据贴标公司基本上都是众包和半自动化。所谓的众包,类似于国外高精度地图的采集,即公司在网上发布订单,让有空闲时间的网友一起完成数据标注的工作,这可能涉及到给予一些奖励,但与目前线下繁重的劳动模式相比,降低了很多成本。然而,众包形式对数据标注的工作流程有更高的要求。网络用户在完成数据标注时必须简单、快速、易用,才能普及。目前,数据标注过程需要人工框定、标注和后续人工审核,整个过程比较复杂。据业内人士介绍,现在可以提高效率的工作是开发一个在线系统,简化和规范贴标工作,最大限度地减少贴标人员的一些重复和简单的工作。开发这样的系统需要专业的研发人员,而大多数数据标签公司很少有多余的能力来进行这部分纯粹的投资和研发。因此,数据标签公司未来的目标是实现半自动数据标签,而这背后仍然依赖于众包。所谓的自动标注本身就是一个伪命题。如果数据可以自动标注,那么本质上就没有必要标注,因为人工智能已经具备了和人类一样的识别能力。这一天什么时候到来?每个人的期望~

标签:

汽车资讯热门资讯
奇瑞汽车拟以不低于200亿元引入外部投资者

虽然此前奇瑞方面已单方否认了股权出售事宜,但奇瑞内部已经就此事达成共识。

1900/1/1 0:00:00
3年内L3级别量产,“自动驾驶”离我们的远与近

“自动驾驶”是一个热度颇高的词汇。再加上某些有意无意的渲染和夸大,人们对“自动驾驶”满满都是憧憬和膜拜,甚至有的是迫不及待。

1900/1/1 0:00:00
生产资质大门将重新打开 那些已获资质的“鲶鱼”们现状如何?

不到半年的时间,8家企业新建纯电动乘用车生产项目在2017年上半年获得发改委核准通过。

1900/1/1 0:00:00
2020年投入使用 MEB平台落户一汽-大众

日前,我们从招标网获得了大众MEB平台落户一汽大众的信息,从曝光的细节来看,由一汽大众佛山工厂生产的MEB平台产品或将于2020年正式发布上市。

1900/1/1 0:00:00
对于共享汽车的危局,这五位行业创业者这样说……

江湖上流行着一句话,天下武功,唯快不破。天下任何武功,都有自己的不足,防守的再好,也有破解方法,只要意识、攻、守、应激变化等速度远远高于对方,势必游刃有余。

1900/1/1 0:00:00
浙江合众获第七张新能源牌照,新能源“准生证之争”会再度开启吗?

5月17日,工信部发布了第308批《道路机动车辆生产企业及产品公告》,其中,浙江合众新能源汽车有限公司进入拟发布新增车辆生产企业清单。

1900/1/1 0:00:00