作者 马冀,澳鹏(Appen)中国区副总裁
自动驾驶——疫情危难中显身手
2020 年,一场突如其来的新冠肺炎肆虐全球, 导致不同国家的人们被迫隔离或保持社交距离,人与人之间的接触变得风险极高。一时间,人们对于人工智能机器人、自动驾驶等可有效解决人与人接触的“无人”技术的出现与应用翘首以待。疫情期间,从无接触测温到在线办公,云会议、在线教育、在线发布会、云逛街、云旅游等,人工智能在这场战役中大显神威,以前没有的模式在不断被创造,人工智能对众多行业的“赋能”作用也开始显现并迅速获得人们的青睐。
特别是一些物资运输和物流方已经采用无人车送货的方式,避免人与人直接接触的问题;有些医院采用了无人消毒、清洁车;有些在医院为患者进行无人送餐等。诸如这些鲜活的事例在这次疫情中可以说是不胜枚举。
据统计 ,我国这次采用自动驾驶的达到十几个地级市,北上广都涵盖在其中,同时此次使用的投入量也达到数百个。不仅在国内,国外也是如此,法国的 NAVYA 与美国的诊所合作,也开始进行无人车配送药品或者检测样本。
“自动驾驶”在这次疫情中实际的投入和使用,虽然是牛刀小试,但足以让人们对此有了全新的认识。由此我们看到了自动驾驶领域应用的广泛前景和巨大市场潜力。自动驾驶一直是人类对未来的幻想,而想要实现真正的无人驾驶仍然面临诸多挑战。如何快速实现商业化,是现在很多投资自动驾驶的公司所倍加关注的问题。以前更多的聚焦是在无人车是一种交通工具,主要用于解决运输人的问题;而现在,它更像是可以成为替代简单重复性工作的“助理”。
为了使汽车行业制造出最高效、最安全的无人驾驶汽车,汽车投资者必须采取消费者至上的思维方式才能居于领先。事实上对于大多数的驾驶员来说,当下的驾驶体验仍然事与愿违。原本用于导航、通信和娱乐的免提系统应该尽可能减少干扰,但是目前差强人意的语音识别功能每每让人沮丧,反而给驾驶员带来了更多不必要的干扰。新的无人驾驶和驾驶辅助功能虽然已经有所改善,可以提供一定帮助,但它们还远远不能达到理想状态。唯有那些致力于提升消费者体验的企业,才能最终在竞争中脱颖而出,无论是乘客或驾驶员在车内的内部体验,还是提升安全性和自主性的汽车外部体验。
目前疫情在国内已经受到一定程度的控制,疫情终会消散,但谁也不敢预言疫情会不会卷土重来?那么未来的驾驶又将会是什么样子?何时我们才能够抵达未来?
未来自动驾驶不仅仅是技术问题——问题和挑战
虽然 AI 技术正在迅速走向成熟,但 AI 的发展所涉及的不仅仅是技术,还包括监管、业务和产品挑战、社会认可和新技术发展方面的挑战。就自动驾驶来说主要涵盖复杂程度、安全性、本地化和再训练几个方面。
首先以接送孩子上下学为例。其中涉及的不仅仅是从 A 点到 B 点行驶的技术,还有由谁来负责巴士的安全?政府、巴士制造商、AI 软件工程师、还是由他们一起负责?一旦出了问题了,该怎么办?在旅途中如何监控孩子的行为,如何处理从巴士到学校的责任转移?这些恐怕都涉及到需要立法、法规和保险业的全面投入才能逐一获得很好、妥善的解决。
其次,供应商必须弄清楚如何收集和处理大量数据,才能支持成千上万辆同时交互的无人驾驶汽车。在投入生产之前,还必须能够证明产品足够安全可靠,并且足以抵御网络的恶意攻击。最后,他们必须开发一种能支持解决方案扩展的业务模式。
千人千面,并非每个人都对无人驾驶汽车感兴趣。因此,我们可能会遇到周围一些思想和行为上偏保守的人的强烈抗拒乃至强行抵制。也就是说自动驾驶必须首先解决的是观念和意识,也就是信任两个字。事实上凡是每当出现一项重大的新技术,我们都会面临这些问题。某种程度上讲,我们如何管理无人驾驶和自动驾驶汽车的这些问题,将影响人们对这种急剧的社会变革的接受程度,以及从长远来看,如何评估它对于社会发展的进程到底是利还是弊。
随着 5G+IOT+AI 等新技术的到来,物理世界的一切都会被映射到数字世界,无人驾驶领域也即将进入车驾智能感知时代,换句话说就是把道路也变成智能的。在道路部署很多的 RSU(Road Side Unit),配上激光雷达的扫描处理,让汽车和道路进行信息的即时传递,以此大幅提升无人车路径规划和决策的准确性。随着 5G 的商业化部署和其他新技术引入,势必也将给无人驾驶汽车行业和各国政府所选择的技术路线带来更多新的机遇和挑战。
复杂程度:与基本要素一样,企业可能没太关注复杂程度如何影响其项目。通过寻找可靠的数据合作伙伴,他们的专业知识可以为企业提供指导和见解。例如,本体越大,项目就越复杂。一个经验丰富的数据合作伙伴将帮助您确定这种情况如何导致您投入更多的时间和成本,并找到与您的整体业务目标契合的解决方案,这对于考虑图像和视频至关重要。
本地化:本地化在汽车行业中尤其重要。由于汽车企业在设计模型时需要考虑多个市场,因此,他们需要考虑不同的语言、文化和受众特征,从而妥善定制消费者体验。本地化项目非常适合作为您与数据合作伙伴的首个合作项目,他们可以利用资深的语言专家团队来开发风格指南和语音角色(正式,闲谈等),以及跨语种进行优化。
安全性:汽车行业收集的许多数据中都包含敏感数据,需要企业额外采取安全措施。理想的数据合作伙伴不仅会提供各种安全选项,甚至在最基本的级别上都具有严格的安全标准,以确保正确处理您的数据。寻找能提供以下选项的数据合作伙伴;安全数据访问(对 PII 和 PHI 至关重要);安全众包和现场服务选项;私有云部署;内部部署;以及基于 SAML 的单点登录等。
再训练:麦肯锡认为,1/3 的上线 AI 产品需要每月更新才能适应不断变化的形势,例如模型漂移或用例转换。许多企业跳过了这一关键步骤,或者完全将其搁置一旁。不过,如此一来,需要通过大规模部署且能够取得足够长期成功的 AI 项目来证明 ROI 会越来越限制更长期数据再训练的风险,却得到了避免。通过再训练,您可以迭代模型,使模型变得更加准确和成功——您最好利用数据合作伙伴来重新标记数据,并使用人工评估程序来分析低置信度预测,从而提供支持。
由 AI 驱动的智能座舱
由 AI 驱动的智能座舱已成为许多企业品牌的代名词。汽车制造商正在与相关的生态系统提供商合作或寻求合作,为客户创造更多价值。由 AI 驱动的智能座舱能带来诸多优势,包括改善驾驶员体验和安全性,以及提供直观的车内助手。这意味着可以在训练数据的帮助下,采用 AI 并实现可扩展的部署,改进车内和车外体验。
随着全自动驾驶汽车领域的竞争日益激烈,市场上已经建立了一个标准,该标准定义了六个自动驾驶级别,旨在让汽车制造商、供应商和政策制定者可以讨论和比较系统。这六个自动驾驶级别与不同的消费者体验挂钩,2 级 (L2) 和 3 级 (L3) 之间发生了重大变化。从 2 级过渡到 3 级,监控汽车的责任从驾驶员转移给了系统。由于自动驾驶级别不同,聚焦消费者体验能帮助您在车内和车外体验领域快速获得成功,使得这些体验极易受到成功可扩展性的影响。
车内体验通常被描述为由 AI 驱动的驾驶舱,涵盖了整个用户体验——包括驾驶员和所有乘客,旨在打造更智能、更愉悦的总体车内体验。它包括将 AI 应用于智能驾驶辅助程序,以改善安全性或信息娱乐系统,不仅可为驾驶员导航,同时为后排乘客推荐相关服务。
而谈到车外体验,尽管企业都在竭尽全力实现五级自动驾驶,由 AI 驱动的智能汽车仍然需要更高水平的计算机视觉和计算能力——雷达和摄像头的传感器每秒传输大量数据,以处理诸如危险的路况、道路上的物体和道路标志之类的状况。
得益于计算机视觉机器学习模型领域的最新研究,由 AI 驱动的无人驾驶机会主要聚焦如何利用 LiDAR、视频对象跟踪和传感器数据支持计算机视觉。这些技术能帮助汽车在从 A 点驶向 B 点的过程中拥有“视觉”和“思考”的能力。帮助训练模型执行任务的数据标注服务包括:
点云标记(LiDAR、雷达):通过识别和跟踪场景中的对象,了解汽车前后和周围的场景。将点云数据和视频流合并到一个要标注的场景中。点云数据可帮助您的模型了解汽车周围的情况。
包括语义分段的 2D 标记:帮助您的模型更好地理解可见光摄像机的输入。寻找一家数据合作伙伴,帮助您为自定义本体创建可扩展的边界框或高度详细的像素模板。
视频对象和事件跟踪:您的模型必须了解对象如何随时间移动,您的数据合作伙伴应该协助您标记时间事件。在视频和 LiDAR 场景的多个帧里,在本体中的对象(如其他汽车和行人)进入和离开您感兴趣的区域时,跟踪这些对象。不管对象出现和消失多少次,在整个视频中都要对对象的身份保持一致的理解,这一点很关键。
过去,为了有效训练 AI 模型,企业不得不依靠多个供应商和应用来收集、准备和整合所有数据。但是现在不同了。无论您是在构建 1 级或 5 级自动驾驶解决方案,改善驾驶辅助功能,还是介于两者之间,可靠的收集和标注合作伙伴都可以提供统一的产品,在一个平台训练和测试您的 AI 系统。
抵达车驾智能时代的关键——背后的高质量数据
澳鹏(Appen)的研究和经验发现,要想让 AI 试验项目进入能带来切实利润的大规模部署阶段,企业应该专注于一个关键目标,这是最简单的方法之一。大多数企业都通过构建对消费者体验产生积极影响的 AI 取得了早期成功——无论是坐在车里的乘客或驾驶员,还是站在车外的人,都能获得更高的安全性和自主权。尽管我们已经在这一领域取得了长足的进步,但未来几年无人驾驶汽车并不会大范围普及,我们也不能一蹴而就。人工智能正在推动着汽车行业的深刻变革,随着无人驾驶时代越来越现实化,人工智能和汽车技术也越来越紧密地交织在一起。目前我们已经拥有了无人驾驶汽车所需的所有基本技术——甚至我们也知道该怎么做。但这与大规模运行整个无人驾驶汽车系统截然不同。
对于大量在无人驾驶技术和互联汽车的未来进行投资的公司而言,通常必须借助多个供应商和应用,一同收集、标注、准备和聚合所有数据,以便有效地训练其 AI 模型。无人驾驶汽车相当复杂,属于由复杂的机器学习算法驱动的机器。随着汽车的前进,机器学习算法模型会处理多种类型的数据,就像驾驶员透过挡风玻璃观察或监视车内外的情况一样。为了使汽车具备“看”、“听”、“理解”、“交谈”和“思考”能力,需要以适当的方式收集视频、图像、音频、文本、LiDAR 和传感器数据,对这些数据进行结构化处理,并使其为机器学习模型所理解。汽车需要为大量的图像包含 2D/3D 数据赋予含义,例如,识别树木或行人,识别动态的路况,听取命令,了解环境的外部变化,将这些信息反馈到汽车的 AI 中,为决策提供信息支撑,并改善算法,从而实现五级自动驾驶。同样,智慧驾驶-智能驾舱:随着语音识别技术、LiDAR 和能跟踪驾驶员情绪的摄像机的发展,人机界面的下一步重要举措就是融合这些技术,让汽车能够识别说话者的情绪和话语,从而分辨出用户是高兴还是沮丧,并给出相应的回应。通过此类车内舆情监控,了解并预测行为,实现卓越的人车互动。
对于无人驾驶汽车来说,就像在医疗保健或其他风险管理至关重要的场景一样,为了在瞬息万变的复杂真实的驾驶场景中发挥作用,训练数据需要由人员进行大规模标注和验证。机器学习系统需要大量经过专门调整的训练数据,这些数据来自不同的驾驶环境。要创建这种高质量的训练数据,就必须从人工标注入手。例如,在训练计算机视觉解决方案时,人们需要标注和标记由传感器收集的 LiDAR 数据,概述图像中包含树木、交通标志等的所有像素。通过这种方式,系统将学会识别这些对象,但它需要大量示例。幸运的是,现在市场上有一些工具包括澳鹏由机器学习提供辅助的 LiDAR、视频、事件和像素级标记、以及语音和自然语言,都可以帮助我们加快完成这些任务,并满足日益增长的对结构化数据的需求。通过这些工具与工作流互联,能帮助加速开发无人驾驶能力,提高生产力,成为市场赢家。
随着无人驾驶汽车市场的竞争愈演愈烈,大规模的高质量训练数据仍然是汽车行业正在努力解决的主要挑战。再加上汽车不仅需要遵守严格的国家和地区法规,而且还必须了解数百种语言和方言,这些都构成了巨大的挑战。显然,我们无法规避这其中的偏见和挑战。例如一位母语为英语的男士驾驶一辆美国市场生产的汽车,他的语音识别成功率要比母语不是英语的女性驾驶员高。简而言之,主要依赖基于英语为母语的男性语音所收集和标注数据的语音识别系统,在处理其他语音时很容易出问题。用于事故规避和自动驾驶的视觉数据同样如此。如果训练数据是白天天气晴朗时收集的数据,则该系统在雨天的夜晚响应较差。
携手数据合作伙伴,将 AI 加速从试验阶段推向生产阶段
在真正采用试验模型战略并提供 ROI 时,许多项目都无法提供有意义的结果。这会导致企业高层退缩,无法给 CIO 留下深刻印象,并因为无法实现价值而导致试验被终止。结果就是,管理人员将很难证明项目的价值,并且通常不愿意投资扩大未来的试验。为确保您的 AI 试验不只是看上去好看,直接投资训练数据而不是耗费 80% 的时间准备训练数据显然事半功倍。
许多 AI 项目从收集立即可用的数据入手,然后尝试了解如何使用这些数据。通过采用适当的方法成功将模型扩展到项目之外,您能够避免使用常规数据(从公共资源和 Web 收集的数据以及脏/暗数据),而将重点放在收集与切实的目标和用例相关的特定数据。为了获得成功,这些数据必须是可靠、干净且有足够标注的数据,并且团队将致力于数据维护工作,将更多专业的工作外包出去。
为了启动世界一流的 AI 计划,您应该寻求数据合作伙伴为您提供可靠、高质量的训练数据,让您能够扩展至以下五个关键的阶段:
试验:在大型试验中为您提供可靠的训练数据,以确保模型可以快速实现扩展。同时还可以帮助您标注置信度低的数据或标注边缘用例场景的数据。
数据标注:小规模试验之后,通常需要大量训练数据。在这种情况下可使用海量数据集训练模型,以确保模型可以适用于每个场景,没有偏见,并且按照预期方式运行。此外,这些数据必须准确无误,否则您的模型不仅无法进行正确的训练,亟待解决的业务问题也被耽搁,还可能导致利益相关者不同意扩展部署规模。寻求数据标注和收集领域专家的帮助。有助于企业大大减少在获取数据上所花费的时间,并确保尽可能高的准确性。
测试和验证:训练模型后,需要使用一组未用于训练模型的数据进行验证,以调优模型。在验证阶段,企业可以更好地测试数据是否妥善标记了正确的意图,并确保模型不会由于极端例子而出现任何偏差或失败。从而无偏见地预估最终调优模型的技能。
扩展部署至生产环境:如果模型在测试和验证阶段都成功了,就该扩展部署了。企业可以进一步评估和验证置信度低的答案,但无论如何,企业都应该自信地扩展试验。
再训练:顺利完成了扩展——但是在全面部署时您的模型可以准确执行多长时间?定期对模型进行再训练,这一点对于避免模型漂移和解决用例转换至关重要。
展望未来,澳鹏汇集了所有必要的要素,帮助企业走向成功
未来的交通运输将以世界一流的 AI、超快的连接和对环境的影响为基础。因此,AI 的潜在使用场景范围非常广泛。而且,尽管企业 AI 和机器学习用例变得越来越多样化(从供应链和制造到无人驾驶汽车和移动即服务),但以消费者体验为中心的应用仍然是最普遍也最成功的大规模部署的应用。这是因为车内和车外体验都与明确的 KPI 直接关联,并且很多汽车企业拥有大量未挖掘的数据,他们可以利用这些数据来改善这些体验。
因此为了确保为多模式和多媒体视觉和语音识别系统能够提供足够的无偏见训练数据,就需要大量代表不同地理、文化、性别和语言的标注人员。所有这些数据必须由这一领域的专家进行标注和收集,并用于快速、高效地大规模训练和改进机器学习模型。澳鹏(Appen)在无人驾驶汽车领域是超过 15 年以上的行业经验专家,享有与世界前十大整车厂丰富的合作经验及深邃的行业洞察能力,为无人驾驶及智能座舱等商业场景训练数据提供多传感器融合的 LiDar 点云数据标注,PLSS,计算机视觉机器学习辅助标注工具,以及车内数据采集,语言覆盖全球 180 多种语种。
“汽车和交通运输相关数据的收集、管理和基于 AI 的开发将决定谁能成为下一代移动出行领域的赢家。要成为赢家,企业需要战略愿景、商业头脑和技术实力。澳鹏(Appen)汇集了所有必要的要素,以帮助企业走向成功。” Evangelos Simoudis Synapse Partners 董事总经理如是说。在新基建的春风之下,人工智能作为新一轮产业变革的核心驱动力将释放历次科技革命和产业变革积蓄的巨大能量。任何实施 AI 战略的企业都应使用高质量的数据来最大程度地提高成功机会,与经验丰富的合作伙伴合作并借助可靠的流程,对提高成功几率并提供无缝的汽车和驾驶员体验而言至关重要。
最新评论