当前位置: 主页 > 资讯中心 > 综合新闻 >

科学家拥有会不断学习的机器人,就真的无敌了吗?

2020-10-12 | 编辑:中机教育网 | 来源:未知 | 浏览量:

  现今,机器能通过不断优化与分析资料持续学习进步,看似能够直接取代“人”在一切流程其中的所有功能,但传统人力是否真已逐渐失去其不可取代之处?本文作者孙民是Appier的首席人工智能科学家,同时也是清华大学电机工程学系副教授,在多年研究人工智能技术与产业落地执行后,对于自动化机器人的经验与观察有自己的一番解释。

  作者Appier首席人工智能科学家 孙民博士

  近年来,机器学习在优化资料收集和分析工具的技术不断进步,甚至在各个产业都能看到相关的应用。而现在,一股新的趋势又趁势兴起,那就是自动化机器学习(Auto Machine Learning),简称AutoML。

  一名优秀的资料科学家需同时具备高度的专业知识与技能,是台湾大多数企业常年求之而不得的极度稀缺人才,而AutoML的出现能适时的降低企业对资料科学家的依赖。话虽如此,许多人对AutoML仍然存在一些误解,其中最大的误解就是认为AutoML的训练完全不需要资料科学家参与其中。

  AutoML即是AI技术的落地实行

  机器学习是一项非常强大的通用技术,能做到的相关应用领域十分广泛且功能数量惊人,但想了解AutoML的能耐到底在哪,首先就要先了解机器学习是如何运行的。

  机器学习包含了以下几个步骤。首先第一步需要搜集相关资料数据并进行资料清理,才能厘清这些资料中能归纳出来的消息。下一步则是定义资料的特征描述,并把资料定义放入模型,接着就需要开始训练模型以达到优化精确度。由于整体训练学习流程极为复杂,需要大量的人力参与,为了让机器学习发挥最大效益,需要一个训练有素的资料科学家团队来协助创建、应用和优化模型,全程参与在整个作业流程中。

  AutoML这项技术之所以备受各产业重视,是因为AutoML的最终目标,是让流程中的所有步骤都能自动化执行,提高效率的同时还能降低成本。若能顺利实现,AutoML有望在各产业中发挥不同用途,为社会的不同面向带来全面性变革。

  同步改变资料科学家的角色

  然而,如同许多新兴技术所面临的处境,实际运用的状况往往比想象中更为复杂。AutoML是否能发挥其最大功用,程度取决于好几个方面,包含:涉及的产业、资料的类型、模型的种类等等。在前面提到的资料收集和清理阶段其中,数字营销是可以从AutoML获益的领域之一,当顾客与公司的营销活动进行交互后,资料标签将自动生成,成熟的AutoML工具会进一步针对这些标签进行处理,确保它们没有噪声或误差。

  其他产业则更适用于自动化特征工程。举例而言,训练自动驾驶车需要人们协助标注判断出路上行人和各项交通标志;训练医疗显像工具需要经验丰富的医师协助定位肿瘤。不过,自从神经网络能以原始显像图自动构建特征后,许多资料科学家的工作量已有所减轻。

  即便如此,还是必须提醒不要孤注一掷地使用AutoML。毕竟,无论想达到的目的为何,AutoML仍无法完全取代人类知识。相反的,它其实是改变了我们原先利用该知识的焦点与方向。

  以营销任务为例,只有自动化机器执行的效果远比人为作业流程更有效率。通常这些适合自动化的流程是有高度重复性,或是有高度复杂性却有充足的资料给予支持。借由自动化工具的协助,人们可以从重复性的任务中解脱,并将其知识应用到资料较少的领域。

  因此目前的技术仍需依赖资料科学家的支持。有人将这种人类与机器携手合作的方式,称为“半自动化机器学习(Semi-AutoML)”。对照作业流程中的实际执行模式,这样的称谓可说是名副其实。

  所有企业都该大量引进AutoML吗?

  企业只要能够了解AutoML的能力和运行方式,便能在应用过程中有所获益。

  由于这项技术不需要人类专家时刻参与其中,所以能更有效率地进行作业,且将速度大幅提升。只要善加利用,机器的表现不仅能超越人类,更能将人为错误的风险降到最低,流程自动化之后,机器执行所能产生的效益将远超于人力。

  不过,其中仍有其他需纳入考量却容易被忽略的因素,也就是“成本”。

  神经网络结构搜索可说是AutoML领域中的“圣杯”,也就是编写出一套人工智能程序,以自动找出最能解决特定问题的神经网络结构。目前已有研究人员提出证据,认为确实有机会能使神经网络结构搜索完全自动化(且超越人类执行相同任务的表现);然而,届时将需要庞大的运算能力才能达到目的,可能需要同时使用十几个CPU进行训练才足以应对。总而言之,整体投入的软硬件成本将十分可观。因此,任何公司若想寻求自动化机器学习的协助,都应先针对其可能的获益、财务以及时间成本进行权衡和评估,才能更明智地加以运用。

  尽管AutoML能降低人为错误的风险,却无法将其根除。这项技术仅能优化人类设计的衡量标准,但是当衡量标准不正确时,所产出的模型自然也无法解决问题。这不仅会发生在AutoML上,人类也可能在采用标准机器学习时犯下相同的错误。不过,如果人类有参与开发过程,就有机会发现模型行为的错误并协助改正。因此,虽然完全由机器执行作业流程能获得极高的效益,但若未经考量便直接排除人为参与,可能会在无意中导致更多潜在错误发生。

  企业如何付诸实践

  要维持人类与机器的平衡并不简单。企业必须评估人类高度参与下的可能利弊,并决定哪种商业模式才适合自己。例如,让人员全程参与流程阶段的发展史,意味着模式将难以规模化,而若为了让整个流程自动化而逐一创建特定的模型,又会浪费太多时间。实际案例好比营销人员需要即时推出营销活动,因此往往无法等上太久,因为他们追求的是时效性,需要在最佳时刻吸引到顾客的关注。

  如今,最佳的解决方案往往是借助在某些特定领域采用AutoML的资料科学平台(如同前面所提及的“半自动化机器学习(Semi-AutoML)”)。借由自动执行特定步骤,企业便能专心研究如何将运算量集中在提高效率上,而成果又不会因为精准度降低而大打折扣。以上建议不仅能协助营销人员了解AutoML的潜能,更能让人们了解AutoML能为企业成就带来的实质效益,否则,即使采用了这项技术,也只是徒有其表而已。

  若能保持正确观念来运用AutoML,企业便能享受其带来的众多好处,尤其是对营销人员而言更是如此。唯有确实了解AutoML的运行方式、涉及范围,以及它能对企业提供的支持,才能充分发挥AutoML的最大潜能。

    X关闭
    X关闭