随着概念的普及,科技公司对人工智能的要求越来越高,成本、准确度、效率都影响着人工智能能否落地融入日常的使用中。对人工智能应用的快速增长也进而催生了对影响人工智能水平的关键要素——机器学习方法的需求。
近年来,在深度学习领域里,出现了一种「新式学习法」,很多人视它改变了设计复杂的深度学习网络,把看似高不可攀的深度学习,「拉」到了人人触手可及的程度。这个新方式,就是 AutoML。
2017 年 5 月,谷歌在 I/O 大会上发布了 AutoML,他们将 AutoML 应用到了深度学习的图像识别和语言建模的两大数据集中,他们提供的 Cloud AutoML 和 Google NAS 算法结合,把完整的机器学习工作做成了云端产品,用户只需要提供数据,Cloud AutoML 将自动构建深度学习模型。换言之,AutoML
想要做到的,正如其名:自动化机器学习。
如何促进技术公平,降低技术应用门槛,让不懂技术的用户也可以使用人工智能;如何优化机器学习的流程和结果,辅佐数据科学家们投入更有价值的工作,正是 AutoML 以及人工智能领域未来希望攻克的难题之一。
为此,在 IF 19 上,极客公园请到了 Google 第一个 AutoML 产品的技术负责人,来自 Google Brian 团队的资深工程师卢一峰,他作为一个技术从业者,也是一位从 AI 学术研究到 AI 产品落地的实践者,来试图从技术角度解释,如何让机器学习可以为人人所用。
以下内容来自于卢一峰在极客公园 IF2019 创新大会上的演讲实录(经过极客公园编辑):
大家好,今天向跟大家聊一聊关于 AutoML 的故事。
最近,AutoML 这个词,你们在与 AI 相关的媒体上可能见得比较多。AutoML 实际上是三个英文单词的英文缩写,Automated、Machine、Learning,也就是「自动化的机器学习」。
在聊 AutoML 之前,做一个自我介绍,我来自 Google 大脑团队,也有幸作为技术负责人,参与了 Google 第一个 AutoML 产品的研发和设计,我也关注从 AI 的前沿学术研究,再到最终实践当中。言归正传,今天我想跟大家一起聊两个问题:第一,为什么我们需要 AutoML;第二,什么是 AutoML。
我想先问大家另外一问题,当前是什么限制了 AI 更广泛地应用?
AI 发展的瓶颈与解决方案
我们认为 AI 大概有 3 个很关键的因素:第一,人,需要有 AI 的专家;第二,数据;第三,计算力。当我们有了这三个因素以后,就能够创建一个自己的 AI 解决方案。我们也想探讨一下,到底这是三个因素里面哪个因素限制了 AI 更广泛地落地。
数据可能不是瓶颈,因为我们当前每一个企业都在拥抱数字化,所以实际上不管是大企业、小企业,都在试图将自己的 Data 数据化上传到云端,大数据和云服务的普及,也让这种操作变得非常廉价和容易。所以,对于每一个企业来讲,现在的数据并不是一个很大的问题,反而是因为我们无法从数据中获得大量的价值,导致阻碍对数据更大规模收集的动力。
计算力可能也不是瓶颈,OpenAI 做过一个调查,AI 计算力的提升已经突破了摩尔定律。摩尔定律是指 18 个月,我们计算机芯片的密度可以提升 1 倍,意思是说我们的计算力可以提升 1 倍。AI 现在计算力的提升,大概已经到了每 3.5 个月就能翻一番的速度。这个结论来自于他们收集了从 2012 年奠定卷积神经网络在视觉问题上应用的 AlexNet,到 2017 年底的 AlphaGo,这所有计算力的变化。
所以,从 2012 年起到 AlphaGo 的时候,整个 AI 计算力在短短几年的时间已经提升了 30 万倍。这是一个非常惊人的数字,并且这个趋势可能还会继续延续下去,因为所有的 AI 硬件加速厂商都在大力推进这一块。比如说英伟达的 GPU,或者是 Google 的 TPU。
我们认为,AI 专家实际上是现在阻碍 AI 广泛落地的瓶颈,根据国外求职网站 LinkedIn 上的调查研究,现在机器学习的专家缺口非常大,供给和需求的比例正在逐年扩大。我们也知道,培养一个合格的机器学习专家可能需要花很多年的时间,这进一步阻碍了短期内弥补鸿沟的能力。
既然 AI 专家是瓶颈,怎么改进这个公式,才能够让我们的 AI 更广泛地落地?我们认为,如果有可能把 AI 专家他的知识和工作流程,尽量自动化起来,变成一个自动化的算法,我们称为 AutoML,加上数据。
对于我们现在还无法自动化的一些复杂的人脑逻辑,我们给予 100 倍的计算量弥补鸿沟,最终出来了一个新的 AI 解决方案,就是 AutoML + 数据 + 100 倍计算量。这个新公式不一样的是,在传统领域,AI 的广泛应用受限于机器学习专家的数量,然而在这个新场景里,我们可以把机器学习广泛应用的瓶颈,从机器学习专家转移到计算力上面。
也就是说,当我们有足够多的计算力,就可以提供足够多的 AI 应用方案出来,这样我们就让一个本身已经陷入瓶颈的公式继续扩展,只要我们有能力造出更多计算量,这样看上去就是一个更简单的问题。
这就解释了为什么我们需要 AutoML,因为我们需要用计算力的扩展让 AI 更广泛的落地。我们看一看什么是 AutoML。
AutoML:用 AI 训练 AI
首先,AutoML 在 Google 被作为一种新的 AI 研究方法。它通过自动化 AI 专家的研究工作流,可以加速 AI 的研究,并且辅佐 AI 专家取得更好的研究成果。我简单给大家介绍一下,它的工作原理是怎么样的。在这个方法里涉及到两个 AI,一个我们姑且称它为设计者 AI,另外一个是执行者 AI。
设计者 AI 要做的事情是不断根据现有知识能力给出不一样的设计方案,就像一个设计者一样。每一个执行者 AI 会拿到其中一个设计方案,并且把它执行,执行到它能够完成的程度,然后每一个执行者 AI 就会把执行以后的效果,到底好还是不好反馈给这个设计师的 AI。
可想而知,设计者 AI 会逐渐获得很多这样的反馈,说设计方案 A 不太好,方案 B 要好一些,它自己会开始一套进化流程,它自己会根据好还是不好找到一种进化的方法,以让它在下一次提出设计方案的时候,能提出更多好的方案。
因此,经过多次这样的循环迭代,最终这个设计师 AI 会变得越来越厉害,它会设计出越来越更好的方案,最终也就实现了我们的目的,就是说用机器自动的去产生更好的设计方案。这也就是大家经常听到的,用 AI 训练 AI。
我给大家分享两个例子
案例一:就是它在 AI 研究里面取得的一些结果,ImageNet 可能是大家比较熟悉的图片分类的一个经典问题,这个问题本身也比较难,在左边这张图上面,黄色的框里面显示的是,顶级 AI 专家在过去数年中人工设计产生的最好的神经网络,能够达到的准确率。
红色的框里面显示,当 AI 专家使用 AutoML 去加速他的研究,他能够取得更好的准确率,达到 AI 研究的突破。
案例二:AutoML Team 和 Waymo 在两年以前就开始合作了,把 AutoML 引入整个 Waymo 核心 AI 设计框架中,帮助 Google 无人驾驶车公司的 AI 专家设计更好的视觉系统。大家都知道,无人车的视觉系统是核心组件之一,相当于无人车的眼睛。在 AutoML 帮助下,Waymo 通过 AutoML 的方法,提升了核心 AI 系统(激光雷达识别、道路识别),并且这些用 AI 训练出来的 AI 已经被部署到商业运营的车辆当中了,在本身已经有非常优秀的错误率上又进一步减少了 10%。
除了辅佐顶级的 AI 专家加速研究,我们希望知道 AutoML 能不能普惠大众?让我们每个人都能够用它做一个工具,帮助我们解决更多现实世界的问题。
这对我们提出了更高层次的要求,除了 AI 专家以外,我们还需要面对普罗大众,在这个问题的推动下,我们定义了 AutoML 的第二重含义,作为一款面向所有人的 AI 应用产品。首先是基于 AutoML 的研究基础之上,通过自动化 AI 应用的工作流,提供简单易用的产品界面,让每一个人都可以使用 AI,来解决你身边自己的一些问题。
AutoML 的应用落地
我想和大家分享一个 AutoML 和濒危动物保护的故事,我有幸在早期参与到这个很有意义的活动中。整个活动让我感触很深。先给大家介绍一下故事背景,ZSL 成立于 1826 年,致力于全球濒危动物保护,是一个非盈利组织,它们在近年来提出了一个新的动物保护思路和框架,他们设计了一个类似于照相机的盒子,这个盒子有感应设备,当把这个盒子挂在野外树上时,前面有动物经过的话,传感器就能识别到这个动物,然后自动拍下一张照片。
如果在一个保护区里面部署很多这样的摄像头,就能自动了解到在这个保护区里有什么动物存在,以及大概的数量和分布是怎样的。屏幕的最左侧有一个调皮的猴子和老虎拍下了它们的自拍相。
这个解决方案非常聪明,但是挑战在于 6 个月时间之内,因为产生了上百万张的图片(一个保护区)。他们致力于全球很多保护区的保护,这 100 万张图片需要专业人员数月的时间才能进行人工分析和标注。动物学家和动物保护者本身非常缺乏编程和机器学习背景,所以他们需要花很大的代价自己研发一套自动化系统做这件事情。
带着这两个挑战,他们找到了 Google Cloud,通过 Google Cloud 和我所在的 Google Brain 通力合作,打造了这样一款云端产品,对于动物专家来说,他只需要简单的四步就可以完成刚才说的大挑战。
第一步:把手里已经有的标志好的猴子,老虎图片上传到云端,告诉 AutoML 我要做什么事情,比如分类老虎、猴子、大象。
第二步:点一下开始启动,整个系统就全自动运行起来,整个过程中不需要任何人工干预。在 AI 自动建模过程中,可以在评估页面观测到现在这个模型的质量情况(准确度、召回率指标)是否能满足实际应用的需求。
第三步:当这个模型自动训练完毕以后,如果这个指标达到了使用场景需要,就可以简单的在界面上上传更多没有进行标注过的照片,整个系统就会全自动用刚才已经训练好的 AutoML AI 自动化的进行更多图片的自动标注和分类。
整个过程在 AutoML 的帮助下,让没有编程背景的动物专家和保护者,可以自己创建非常高质量的定制化模型,将以前需要数月的数据分析时间缩短到数天,这对于濒危保护动物者来说是革命性的变化。
接下来请大家一起看一个小视频。
(播放视频)
除了刚才那个很有意义的工作外,我们发现 AutoML 被德克萨斯州的海洋环境专家用来解决海岸保护问题。
这个故事大概是这样的。每个海岸线需要定期精确识别海岸线地质构成,因为海岸线时常会变化,他们做这件事的初衷是如果在附近的海域发生了原油泄漏,不同的地质结构对原油泄漏的生态敏感程度不一样,如果他们知道整个海岸线的地质构造,就可以及时对比较敏感的地质带以采取急救措施(放海面上漂浮的浮桶,可以将原油隔离在外面,保护海岸线的动物、植物、环境)。
传统的方法是用飞机沿着海岸线飞行并自动拍照,拍出来的照片里面,以前需要地质学家数年的时间,一张一张识别。比如说给你一张这样的图片,你可能需要识别里面有沙地、盐碱地等各种各样的地质状况,然后标注出来。
和 AutoML 合作以后,他们把这个过程变成了自动化的过程,把以前需要数年时间的数据分析缩短到非常短的时间之内,提升了海洋保护的效率。
除了在视觉领域中,AutoML 作为一个产品被很多传统行业、保护组织应用起来,提升各行各业的生产效率以外,我们也试图扩大 AutoML 在机器学习其它领域的落地,让更多的人能够用它解决一些专业问题。
比如说,我们推出了 AutoML 翻译、AutoML 自然语言理解,你可以用这个自然语言理解,如果是一个小的电商网站,收集到很多用户的评价,你想知道这个评价是正面的还是负面的,以及提到了哪方面的问题。以前你需要人工的标注,现在用 AutoML 自然语言处理,就可以很简单的训练一个属于自己的模型,自动化的做标注和分析。
从今年开始,我们还会陆续推出更多的 AutoML 产品,覆盖更多的 AI 应用场景,希望能够让整个一套工具箱变成每一个人非常顺手的有效工具,提升各自生活工作中的效率。
今天主要和大家聊了 AutoML。AutoML 本质上构建在人工智能之上,试图用自动化的方法扩展人工智能的应用场景和扩大它的范围。我们作为一个新的 AI 研究方法,扩展了 AI 研究能够到达的边界,然后又在这个之上构建了 AutoML 的应用产品,让 AI 的应用得到了比较有效的扩展,让每一个人都可以用 AI 解决现实世界中的问题,这就是我带来的 AutoML 的故事。
谢谢大家!
363 thoughts on “把机器学习自动化,AutoML 要做出人人可用的人工智能〡IF19”