
上周二,Google和Facebook宣布,使开源机器学习框架PyTorch与Tensor-Processing Units(TPU)进行合作。这种伙伴关系标志着人工智能研究合作进入新时代。
“今天,我们很高兴地宣布,Google TPU团队的工程师正积极与PyTorch核心开发人员合作,将PyTorch与Cloud TPU连接起来。长期目标是让每个人都能享受PyTorch的简便性和灵活性,同时能够从Cloud TPU的性能、可扩展性和成本效益上获益。”Google产品总监Rajen Sheth说道。

PyTorch是Facebook的开源框架,可以开发人工智能研究中使用的数学程序。这样的框架允许研究人员开发任意复杂的数学计算图并自动计算衍生产物。
TPU是由Google专门为AI系统设计的计算机芯片。据Google描述,TPU比传统的图形处理单元(GPU)快15到30倍。
PyTorch有什么新功能?
近日,Facebook发布的深度学习框架 PyTorch 1.0主要有三大更新:
一是添加了一个新的混合前端,支持从 Eager 模式到图形模式的跟踪和脚本模型,以弥合研究和生产部署之间的差距。
二是一个经过改进的 Torch 分布式库,可以在 Python 和 C++环境中实现更快的训练。
三是添加了针对关键性能研究的 Eager 模式 C++接口,将在测试版中发布。
目前,研究人员和工程师必须面对许多框架和工具,以创建新的深度学习模型并将其转移到生产环境中大规模运运行,而这里多数框架和工具通常是不兼容的。如此,将会降低开发者在规模化生产中部署 AI 能力的速度。通过这个最新版本,将现有 PyTorch 框架的灵活性与 Caffe2的生产能力结合,提供从研究到生产性 AI 的无缝路径。
Google的TPU有什么优势?
虽然 TPU 是一种专用集成电路,但它运行的程序来自 TensorFlow 框架下的神经网络,驱动了谷歌数据中心的许多重要应用,包括图像识别、翻译、搜索和游戏。通过专门为神经网络重新分配芯片计算资源,TPU 在真实数据中心负载环境下效率要比通用类型的计算机高30-80 倍,目前已为全球 10 亿人提供日常服务。另外,神经网络的推理阶段通常会有严格的响应时间要求,这降低了通用计算机所使用技术的有效性;通用计算机通常运行得较快,但某些情况下也会较慢。
为什么Pytorch与TPU建立连接很重要
将GPU上的大量数据与神经网络训练结合是当前深度学习系统成功的催化剂。可能需要花费数月训练的神经网络,在使用GPU训练时,时间缩短到短短的几个小时。随着深度学习的成熟,神经网络和数据集变得越来越大,这些网络现在需要数月才能在GPU上进行训练。谷歌专有的TPU为这些庞大的系统提供了一种更快速的训练方法。更快的训练意味着研究人员可以更快地进行实验,从而提高AI研究的速度。
为什么这种伙伴关系有利于人工智能研究
传统上,Google和Facebook通过Google Deepmind,Google Brain和Facebook AI Research进行了独立的AI研究。因此,人工智能工具生态系统已经在Tensorflow(谷歌的AI框架)与Pytorch的辩论中分立,虽然竞争使得两个框架都以极快的速度发展,但其也使得研究在可重复性方面困难重重。
如果此公告标志着一种更加协作的AI研究方法,我们可能会看到这两个框架之间的互操作性得到改善。此外,这样的结果使得AI在智能手机上的部署更容易,也便于多种框架建构统一的工具生态系统,并改善研究结果的可重复性。
无所不在的人工智能
伴随着大数据时代的到来,人工智能在过去十年取得了巨大的进步。但今天的人工智能,更多的是狭窄的完成单一任务的人工智能,如人脸识别、语音识别。能够解决各类问题的通用人工智能离我们还有太遥远的距离。从实际应用角度来看,在可预见的未来,我们会看到人工智能从狭窄 (Narrow AI) 走向宽广 (Broad AI),从完成单一任务到完成多个任务,从解决一个领域的特定问题到解决一个领域甚至跨领域的多个问题。
未来的人工智能,我们会看到不断增强的学习推理能力。如何从小样本小数据中学习变得非常重要。面向消费者的人工智能,积累了大量数据。比如图像识别,我们可以用大量数据训练一个模型。而面向企业的人工智能,对于特定的任务,往往没有大量的数据可用。多模态学习将会变得越来越普遍。比如人工智能剪辑电影,需要根据图像、声音,语言来理解视频的涵义。未来的人工智能,需要能够解释结果,即不但给出建议,还能解释为什么给出这样的建议。就像医生给出诊疗意见的同时,还需要解释依据在哪里。
未来几年,人工智能会从云向边缘端扩展,变得无所不在。比如可穿戴设备、物联网终端设备。很多场合我们需要实时的信息处理,如自动驾驶的汽车、为病人服务的医疗设备。也有很多场合由于信息安全的考量或网络带宽的限制,信息无法传输到云端而必须在边缘端处理。实现边缘智能 (Edge Intelligence),往往需要低功耗的智能设备。我们会看到米粒般大小的智能设备,集计算、存储与网络功能于一体。人工智能从云向边缘端的移动,将人工智能与物联网结合起来,使得我们可以对物理世界进行更好的理解、管理与优化。
企业人工智能与行业创新
我们会看到更多人工智能在垂直领域的行业创新。比如医疗,金融,工业制造。今天的人工智能,更多的是面向消费者的人工智能 (Consumer AI)。未来几年,我们会看到企业人工智能 (Enterprise AI) 的兴起与发展。人工智能的成功需要商业成功,而人工智能的商业成功需要人工智能在行业应用的成功。
谈到人工智能,我们往往会谈到数据、算法与计算。实际上,人工智能用于行业创新,应用场景的选择非常关键。你问一个马车夫,他永远不会告诉你他需要一辆汽车。需求与应用场景的确定不容易。这里涉及到信息技术与行业知识的结合。人工智能专家不具备深刻的行业知识,而行业专家又不完全理解人工智能今天发展到什么程度,未来几年可能会取得什么样的进展。二者结合在合适的时间点选择合适的切入点,就变得非常重要。今天的人工智能技术还不能解决我们面临的全部问题。对于今天技术不能完全解决的问题,可以由人与机器协作共同完成,而不须一步到位。人机同行,共同完成人类或机器单独不能完成的任务。
人工智能应用在行业中会带来两类改变,一是借助机器提高效率;二是提供基于知识的专家助手帮助我们更好的决策。前者人工智能取代部分人力,后者人工智能赋能人类专家,增强人类的能力。我们会看到人工智能技术用于制造业,如视频分析用来做产品缺陷检测与质量控制。我们会看到人工智能医生。根据医学指南,与临床数据中学到的知识,为人类医生提供实时的诊疗建议。我们会看到人工智能律师,引用相关的法律文献,发现相关案例,向人类律师呈现最有价值的法律信息。
今天的人工智能,需要大数据训练模型,用于训练的数据需要标识,费时费力。未来的人工智能,我们可以基于已构建的相关领域的模型,再辅以新的数据快速学习,构建新的模型。打个比方,相当于当我们需要完成一项工程时,我们会招聘有相关经验的工程师,再加以适当的培训,而不会去找一个毫无经验的初学者。针对行业领域,我们需要预先构建哪些模型,如何构建,都是接下来需要关注解决的问题。
人工智能时代,信息安全面临全新的挑战。一方面,人工智能技术本身可能被用来考验与攻击信息系统的安全。另一方面,人工智能可能因为学习了有瑕疵的数据或被恶意更改的数据,而产生了安全的隐患,或伦理的缺陷。如何确保数据的安全,如何验证人工智能模型的安全与合乎伦理,是我们未来需要妥善应对的问题。