在这个“IT 的未来”系列的第一部分中,我提出了一个问题:十年后 IT 会是什么样子?

在开始对话之前,我概述了 IT 的三个主要部分——程序 IT、统计 IT 和机器学习 IT——并指出机器学习将在未来十年内实现最大的增长。机器学习的突破已经在众多行业中得到应用,为此目的,软件公司越来越多地配备数据科学家。

但在 IT 的未来还有更多需要关注的地方。

移动和大规模神经处理器

神经处理需要大量的并行性,但在执行阶段每个并行“线程”的性能相对较低。经典处理器是为反向用例构建的——有限数量的线程,每个都具有高性能。

但这些世界之间的距离正在消退:移动设备处理器越来越多地配备用于神经推理(用户端任务,利用经过全面训练的神经网络)的片上“协处理器”。传统处理器可以逐渐增加用于机器学习的额外神经内核,而从头开始为这些任务构建的新处理器正在看到曙光:IBM TrueNorth是为大规模并行神经推理而构建的芯片示例,同时功耗极低—— 70 mW,是当今 CPU 消耗的千分之一。

新的数据基础设施

训练神经网络所需的大量示例是一项宝贵的资产,一旦完成特定任务的训练阶段,就不应该将其删除。除了在随后的训练运行中可能重复使用之外,这些数据可能会为训练样本产生新的市场。想想训练基本自动驾驶技能所需的数百万小时带注释的街道驾驶视频。

数据基础设施必须适应机器学习的这些阶段:(1) 大量示例的收集和注释,(2) 训练阶段本身,需要高吞吐量能力,以及 (3) 存档样本的交易阶段. 在规模上,这需要成为与 S3 兼容的数据收集器(如IBM Cloud Object Storage System)、用于训练的高性能文件系统(如IBM Spectrum Scale)和用于数据交换的交易平台之间的工作流。

IT 中的深度学习

那么,在认知工作负载和深度学习时代,IT 会是什么样子?

不久之后,组织在投资 IT 项目时将不得不做出新的决定。“制造或购买”的决定很快就会变成“教或买”——意思是,我是否有合适的技能来教机器,或者是否有现成的(在线)技能服务可供我利用?所需技能是我组织的知识产权的一部分,还是通用知识?

组织还必须确定他们是否需要在本地或公共云中使用该技术,以及是否允许他们的数据离开本地边界。

公共选项非常适合非机密数据,标准任务可以运行——例如,通过预先训练的IBM Watson 云服务。对于仅属于您的公司且需要保持安全的数据,以及需要自定义培训的更复杂的任务,您可能更喜欢利用IBM PowerAI软件平台的私有选项。

当然,许多组织希望将两者交织到混合云环境中,以便以最佳方式存储和分析不同的数据。对于混合环境,像IBM Spectrum Scale这样的持久集群存储软件可以在各种云环境下运行——其目的是为您提供一个数据层来处理所有事情,而无需“数据旅游”。

人工智能会统治世界吗?

我很高兴看到机器学习如何发展并塑造信息技术的未来。我不担心人工智能会“接管人类”并统治世界。相反,我认为它将把我们从许多平凡的任务和决定中解放出来,并给予我们开始新事业的自由。在这方面,它与之前所有的工业/运输/通信革命没有什么不同。

Tags: none

我有个想法