Facebook大中华区平台合作负责人濮冠楠：人工智能－规模与创新

2018-09-08 01:56

8月30－31日，由中国高科技行业门户OFweek维科网、高科会主办，OFweek人工智能网承办的2018中国（上海）国际人工智能展览会暨OFweek（第二届）人工智能产业大会在上海成功举办。本次大会用全新视角透析行业动态，解读人工智能领域本年度海内外最值得关注的学术与研发进展，与数千位人工智能领域的国际知名企业高层、行业资深专家、专家分析机构等数千位精英进行多方分析与探讨。

在30日AI技术专场主论坛上，Facebook大中华区平台合作负责人濮冠楠发表了《人工智能－规模与创新》主题演讲，介绍了Facebook在庞大的数据量下如何通过AI技术做到内容审核、质量监控。同时共享了开源深度学习工具Torch、人工智能系统WIT．AI、深度学习框架PYTORCH、模块化的深度学习框架caffe2。

Facebook大中华区平台合作负责人濮冠楠

以下为Facebook大中华区平台合作负责人濮冠楠的现场演讲内容，OFweek人工智能网作了不改变原意的整理和编辑：

大家好，首先谢谢今天有这个机会可以跟大家简单的介绍一下Facebook在人工智能领域目前的一些进展和所做的一些尝试。

我叫濮冠楠，在新加坡，主要是负责Facebook在大中华地区的和开发者合作关系。我今天简单地先介绍一下。

Facebook在大家正常理解来说，其实就是一家软件公司，是做移动的APP开发的。当然在这一点上我们确实拥有一些规模化比较大的应用，比如说目前Facebook本身在全球的月活跃超过22亿人，我们有一个比较完整的产品矩阵，整体产品矩阵的用户数其实是非常大的。在这些内容里，我们是如何做一些比如说内容的审核、质量的监控，以及各种各样的一些技术的支持呢？其实在很多基层架构的底层里，我们使用了很多AI的一些技术支持。我们看简单的一些例子，可以简单的介绍一些具体飞速的AI是如何在我们的产品里使用的。大家可以看到最左边这个例子，其实是Facebook的messenger。在这个例子里，我们看到其实它是聊天机器人，那就是messenger facebook。

相对于我们作为一个用户来说，聊天机器人可以去搜索、定制自己的旅行，相当于一个智能聊天的方式，去选择制定自己的旅行计划，同时我们可以给一些推荐。在这里大家可以看到，在预订过程过程中，它的AI的部分其实是相当于我们有一个nlp语义学习的分析，这一部分是Facebook的一个架构。同时大家也可能知道在Facebook上我们有很多这种视频的内容，包括我们最近在Facebook推出的展示视频的页面。人工智能在这方面的应用，其实就是说在用户把视频上传到Facebook之后，可以快速的生成一个视频的预览，大概三秒钟，这其实也是通过人工智能来实现的。除此之外，大家可以看到这是我们做的另一个尝试，就是在大概一年半之前Facebook正式开放了自己的相机平台，相当于我们有一个开放的相机平台，开发者也可以在这个平台上开发自己想要做的一些实践，在这边我们可以看到这个平面识别技术，实际上就是通过AI的底层技术来打造的。

最后我们包括除AR、相机之外，虚拟现实的技术很多也会在底层中应用。同时Facebook面对的一个比较大的挑战也是刚才我说过，因为Facebook本身的用户数在全球范围内是一个比较庞大的规模，在这个时候我们生成的虚假用户的内容其实非常多，我们很大程度上是依靠人工智能快速的去识别、删除这些内容。

接下来我简单介绍一下Facebook在人工智能领域做的一些尝试，我们在研究领域做的尝试大概可以分为几点。我们最新的一个在人工智能领域方面的尝试，就是推出了pitch。它上线到现在已经将近18个月时间了，在上线时间都是一个自然的增长。在2016年1月上线之后，大概18个月之前，大家可以看到它其实有一个非常大的自然的增长，尤其是在引用库里、在研究方面，它的增长速度其实是非常快。那什么是pitch？其实就是我们低于人工智能推出的一个比较更偏向于快速部署的一个AI的forMark。

pitch可能比较适合做一些研究方面的应用，因为Facebook毕竟自己也是一个基于用户的APP开发者，所以我们内部另外一个比较大的forMark叫咖啡兔，咖啡兔更像是一个偏向于应用层面的forMark。大家如果知道咖啡兔的话，它几乎是用在我们那公司内部的所有的应用里边，就是我们自己的移动的APP都会使用咖啡兔的forMark，也就是说在这种情况下，我们大概可以知道咖啡兔的使用的量级是非常大的，每天咖啡兔使用的量级大概是200兆一次，同时因为它也随着Facebook的APP预载在手机里，相当于在全世界大概会有10亿到20亿的手机已经会使用到咖啡兔的技术。之前可能很多forMark的模型不能互相混用，将来我们希望打造开放的架构规范，尤其是研究开发人员互相交换意见的时候可以更加简单，模型迁移的成本可能也会更低一些。

最终我们也在今年年初的时候把这3个forMark共同的整合到一起，我们把这个平台的名字称为pitch1．0，相当于把这三个架构综合放到一起了，目前我们希望这一个架构可以更多的满足开发研究方面的需求。同时这方面其实也归功很多我们合作伙伴的大力的支持，比如说微软还有亚马逊。

接下来我简单的讲一下，具体我们的应用层面，对于Facebook来说，我们是如何通过参数去训练大数据的神经网络？

简单来说，我们是有三个具体的应用的层面，如果从应用层面来分区的话，第一个大的就是视觉，就是Facebook在视觉方面是如何做AI的，同时就是语意语言分析。最后是推理。

我简单的介绍一下这三个部分，到底我们具体做了一些尝试是怎么样的。

在具体的图像视觉识别的时候，我们其实一直会有一个尝试，从2012年最开始的，我们可能识别出来的只能是最左边图像里边的一个人。大概五年之后，在2017年的时候，我们的识别已经可以说相对的比较准确，可以识别出具体的每个物体，相当于我们识别出来这个物体多大程度上可以确信。不光是包括这个识别的准确率，同时因为很多时候大家应用的场景，包括图像识别，其实是在移动设备里，就是在手机里，那识别的效率其实也是更加重要的一部分。

这是我们在效率方面的做的一个提升，在2017年之前的时候，如果我们做肢体的具体识别的时候，识别度是比较低的。那在过了一年之后，在2018年的时候，我们就有一个非常高的准确率，同时即使在手机上运行的速度也是比较快的。

几乎非常实时的准确的对整个人的身体建模，同时进行识别。具体我们是如何做到这些的呢？其实是通过海量的数据来进行connive。因为用户在把他的照片上传到Facebook的时候，一般会做一些标签，如何把标签跟照片联系在一起，是一个我们进行模型训练的一个方式。在Facebook上目前公开设置高标贴的照片超过35亿，比如说我们在connive之前可能在看实物，如果我们看照片来识别的话，只能识别出实物。之后经过这些模型的确定之后，我们大概可以分析出来它具体实物的种类、包括地标、具体的地标名字，这些其实都是可以通过我们的图形图像的connive来做到的。

在一个就是语言，为什么语言对像Facebook这样规模的公司比较重要。因为Facebook上的人数其实是非常多的，即使Facebook自己的APP就超过22亿，而且同时用户在上面使用的语言的种数也很多，可能也会超过200多种世界各地不同的语言。这些东西对我们都是一个很大的挑战，如何给用户提供正确的翻译，很简单的说，可能要我们自动地提供机器的翻译，这是其中一种。同时我们也希望尽力、尽量的可能支持全世界各种各样不同的语言。

我刚才可能说过Facebook自己支持的语言，就是我们在UI界面上支持200种不同的语言，但是其实在世界各地大家使用的语言的种类，就是比较活跃的语言其实可能会超过6000种。我们在语言语音识别的时候，会有一些简单的尝试，就是说我们会把不同的语言做一个嵌入，就是把不同的语音打包进行学习。

最后一部分我简单介绍一下，就是在推理这个环节我们做了一些尝试。因为计算机，尤其包括人工智能可以做到的事情，就是帮我们在日常生活中解决很多问题。这方面其实每个公司都会有自己很多不同的尝试。我们尝试一些简单的例子，如果我们看到一个图片，不仅仅是做一个识别，我们可以进一步地推理，它可以做到事情是什么？比如说在不同的场景里，我们可以设置一个指令问浴缸的颜色是什么？我们通过机器学习可以算出来，它可能是淡灰色。是否可以准确视觉识别出房间大概功能是什么？就可能需要更深层次的一个东西，就是推理的功能。

当然大家可能也知道google在围棋方面有很多的尝试，Facebook其实也有自己在围棋这边的一些尝试，我们在这边做了蛮多的事情，我们在AI围棋这边的尝试。同时我们也会使用一些游戏来做一些connivement，这边的画面就是一个已经比较老的游戏，叫做星期争霸。大家可以看到在这边就相当于一个比较生动的模型，相当于你可以看到在游戏中的两个种族的对战。如果在机器在connive之前，我们可以看到右边的这个部队，它的作战并没有一个很清晰的逻辑，经过机器训练之后，可以发现他们其实有自己的布局，包括布阵，这些其实都是并没有很多辅导，大部分都是它自己在训练领悟的。

Facebook在AI方面的投入还是蛮大的，尤其是目前的话，我们会在底层做很多不同的尝试，刚才说过的不同的应用的层级，视觉、语言、推理工具，我们都会有不同的freemarke，而这些都是开源的，大家可以直接在我们的网站上下载到这些不同的东西自己使用。

最后一点，就是对于这种层级的公司，如果要做一些AI的研究或者一些相关的东西的话，大规模的数据中心都是必不可少的。在这边Facebook也在全世界各地建立了自己的数据中心，我们的数据中心的设计图纸也是开源的，如果大家有兴趣的话，也可以去研究一下我们的数据中心是如何设计的。那今天我的演讲环节就到此为止，谢谢大家！