AnimashreeAnandkumar进一步表示,希望将机器学习拓展到更多领域,因为大家的常识,数据本身具有维度。一张照片有长宽、色彩;如果是视频,还有时间,是第四个维度。你搜集这些数据里面有不同的维度,我的问题就是怎么去充分有效利用这些维度。
以下为Animashree Anandkumar的主题演讲实录,有删减。
我今天非常荣幸和大家交流,参加全球木兰论坛。我多次来到中国参观访问,来做发言。这是我第一次看到这么多的女性企业家,女性听众,我们感觉非常骄傲成为你们当中的一员。
在中国、在印度,其实从传统上来说,这是因为几千年的一个历史传统,女性一直在社会当中都受到尊重,但是不得不承认在当今世界我们也是有各种各样的障碍亟待女性去突破,今年看到木兰做了这么多努力,把女性精英聚集在一起,来提高我们高科技从业者的性别多元化。我们现在还有这么多女性,其实我的母亲也是我所在社区的第一位女性工程师,她是我个人的榜样。而且当时也不是那么容易学工程的,因为我的祖父当时是很担心,觉得自己女儿干嘛学工程呢?所以我母亲只好以绝食抗议,最终获得了认可。我自己也是投身数学、科学,以及工程学。
我从三岁开始就特别喜欢跳舞,我觉得它能够体现一种女性优美的运动。后来学习数学,觉得二者是相通的,学习人工智能也感受到共同的美,作为人你怎么来学习、怎么让这个机器像人一样来思维,这个智能对我们意味着什么?当我们说这个人很聪明,到底是一种什么样的含义,怎么让一台机器像人一样,有人的思维和人一样聪明。这是我日思夜想的问题。在过去几年人工智能出现了爆发性的增长,同时也没有考虑到刚刚在研究生层次学习AR没有想到这个行业有如此爆发性的增长,可能由于计算能力的蒙杂,包括中国。因为在我这个群体有很多来自中国的留学生,我教授的留学生就是中国的留学生,现在成为马里兰大学的一位终身教授了。
现在我要和大家分享,未来的机器学习意味着怎样一种革命,以及我们在这样的潮流当中如何从中汲取最大的收益。
我自己也是参加了亚马逊的网络服务业务,在亚马逊我们使用人工智能和机器学习已经有非常悠久的历史,我们一开始是做购物网站的。当然要想如何用AI来做识别和建议,比如有一个人之前买了一个网球,可能未来要买网球拍。但是这样一个建议怎么提供给它,而且这么多的网球拍品牌我们提供哪怕一款呢?是随便吗,我们可能有成百上千上万的品牌,怎样进行个性化的购物推荐呢?另外是实现自动化和库存的管理,我们自己的中心是遍布全美,如何能够保持我们的产品最快到我们的发货中心,供应链如何快速的管理,如何最快的交付到客户的手里。
最近有一个令人激动的发展,就是我们自己开始用无人机来进行递送了。在未来无人机很可能使我们的产品交付到家门口变成一件非常容易的事情。
还有一个是Alexa,Alexa这个人工智能的产品可以成为你的闺蜜、你的好朋友,你可以随便向Alexa提问。现在的使用用户以在不断的增加,特别是孩子,孩子非常喜欢Alexa,因为Alexa可以跟你聊一天也不会嫌烦,现在成为非常受欢迎的AI的亚马逊产品。未来要让它更好的理解这个问题本身,而且能够快速的搜索相关的问题,来做出完美的回答,我们肯定是离不开AI,要有非常强的AI实力才能让它运行完善。
另外,还有amazon go这个产品,如果去我们的门店很麻烦,要排大队,而且要扫码交钱,amazon go这个门店就让你觉得好像在里面偷东西一样,就随便拿一个东西直接走出去就行了。amazon go是可以清楚你买了什么,我们在西雅图开了一个店。未来我觉得有这种技术和模式,我们的零售店会更加便捷、更加方便。
我自己也在参加亚马逊云平台的学习,现在能想象到所有的应用都是在云上运行,所以我们要特别关注云和大数据。
下面就是人工智能和机器学习,这么多的数据都存在云上,很自然就要在云上对它们加以处理,所以我们要构建人工智能和机器学习的服务能力。这是很关键的。我现在在亚马逊网络服务部门做这个事情。
如果我们考虑到底什么是人工智能,它的实质是什么?其实还是算法。算法其实说白了就是程序,告诉你怎么来进行数据的处理,怎么从中学习,然后找出一个新模型来作出新决策。但是要实现这个目标我们得有数据、得有训练数据,还要有海量的训练数据才强。除此之外还需要有运算能力,所以这个云计算就出现了,比如说成百上千GPU放到云上来计算,这样可以进行大规模的学习,所以人工智能其实是有三个核心的要素,核心的算法、训练的数据,以及运算的基础设施。所有这些都是可以在云上实现的。
现在深度学习也是非常时髦的一个概念,大家肯定都听说过这个概念,甚至每天都可以在新闻当中听到。首先我们如何来进行图像识别,如何来进行语音的识别,如何进行自然语言的处理,最后最近最火的就是自动驾驶汽车,AI系统怎么能够进行自主的决策,所以在过去可以深度学习也是这么多的领域呈爆发式的应用的发展。
我给大家举一个例子,就是计算机的场景识别,它可以自动的识别出一张图片当中的不同的物体,比如说有游泳池各种各样的东西,他可以自己给上面打标签。同时还可以进行人脸识别,你能不能看出这个人是不是有独特的指标,他当时是一种什么样的表情和心态。还可以进行识别算法,能不能够在一大群图片当中找出一个人,这些都是应用。这些应用其实在生活当中都已经实现了。
给大家简单介绍一下我自己研究的一些课题,我希望我们的机器学习拓展到更多的领域,因为大家的常识,数据本身是有维度。我们想到一张照片,这个照片有长宽、有不同的色彩;如果是视频,还有时间,是第四个维度。你搜集这些数据里面有不同的维度,我的问题就是怎么去充分有效利用这些维度。
我最近在做一个库来解决这个问题。这是一个非常简单的介绍,就是怎么来充分利用数据当中嵌入不同的维度,当然我说的东西可能听起来太复杂,这个东西确实不简单,我也不会说谎话的。我给大家在这张图片当中展示出来,要走过这些步骤才能把一个概念变成一个真正产出结果的机器学习的产品,它可能每秒输出百万的数据数据点,这是非常非常难的流程,只要你是干我这行的就知道。
在亚马逊的AWS,现在关注的数据集要更大,我们做的是sagemaker是什么东西,使得我们的机器学习算法能够以更少的步骤把它从一个概念变成现实,就是帮大家缩短成熟的时间。我们有一个优惠的算法,你自动的往里面输可以自己的进行学习、自我的进行训练,你可以找一百台机器学习,你愿意定多少台机器就会有多少机器,这里面有所谓的参数的优化的功能。能够自动的选择一些好的参数,一旦我们培训了这样一个机器学习模型就可以进行一键部署,整个思路首先要知道我们想要什么样的机器学习的算法,我们需要完成什么样的使命,我们就可以来进行部署,所以这就是为什么sagemaker如此好。我建议你们如果感兴趣可以看一下我们给它赋予的能力和部署。
我们再看一下整个机器学习的堆栈,上面是一个应用服务,大家都知道的一个最高层次,这里面有一些识别图像、视觉的功能,还有一些视频识别功能。所以我们可以用一个识别的功能和应用。除此之外,我们还有语言识别、图文处理、转录等等。
下一个是平台服务,我们把老的数据带过来,然后看一下需要进行什么样的算法,然后进行培训。
最下面的一层是框架基础的设施,我们可以拿到尽量多的GPU,除此之外我们有云上最快的一些GPU,还有CPU,所以我们有最复杂的以及最起的一个基础设施。能够帮助你们在云上进行更好的机器学习。非常感谢。
本文主要内容用引自 金融界
31 thoughts on “亚马逊AWS首席科学家:赋能机器学习 引领未来革命”