← Dailyio 历史存档 | 搜索

分类: Open Access

共有 354 篇文章

从阿兰·图灵到冯·诺伊曼,现代计算机的出生是如何带上「原罪」的?

今天分享《当哥德尔与爱因斯坦散步》这本书里的一个故事。

img

本书的作者吉姆·霍尔特,他的身份很难直接定义。比如,他是一位哲学家,因为他的一生都在研究哲学相关的内容。当然,他也是一位科学作家,迄今为止已经出版了三本科学畅销书;同时,霍尔特也是个媒体从业者,他在 BBC 威尔士电台主持一档节目长达 10 年之久,也曾在杂志社担任主编,并且是美国多家电视节目的特邀嘉宾。

作为专栏作者,他为《纽约客》、《纽约时报书评》以及《纽约书评》以及《美国学人(The American Scholar)》撰稿。他的文章既有科学领域的严肃性,也饱含哲学家的睿智。

在 2013 年出版的《世界为何存在》里,霍尔特采访了一群宇宙科学家、数学家、物理学家、哲学家、神学家、神秘主义者等,霍尔特要让这些领域的从业者发声,同时,还希望这些人站在其他领域展开思考,他刻意选择了一些具有多领域背景的学者,让他们的思想互相碰撞,而把结论留给聪明的读者。

而《当爱因斯坦与哥德尔散步》这本书则是过去近二十年的文章整理在一起,共计 24 篇长文和 15 篇短文。这也让整本书的主题比较发散。比如,你不仅会看到爱因斯坦和哥德尔对于时间的迷思,也会跟随霍尔特的脚步探寻拜伦之女艾达的精彩人生,还会领略数学里的无限、物理学的弦理论以及关于上帝、真理的思考。

这些宏大的主题及其深奥的理论,也与本书的副标题「浏览思想的边缘(Excursions to the Edge of Thought」」相贴切。霍尔特在前言部分谈到,自己选择这些主题的原因有几个方面,他会考虑这些话题的深度以及背后的人和故事,同时,霍尔特也特意强调话题里所涉及到的哲学要素,而从这个角度去看,霍尔特将爱因斯坦与哥德尔散步的照片作为图书封面就十分形象了。

本书涉及到非常多的科学、哲学领域,其中有一个关于现代计算机起源的故事非常有趣。

阿兰·图灵是现代计算机理论的开拓者,也是人工智能的早期研究者。他在二战期间帮助盟军破解了德国的电报密码,成为二战英雄,然而却在战后保守的英国,因同性恋被判刑并最终自杀。

而在美国,图灵的理论启发了一批科学家投入到通用计算机的研究之中,其中冯·诺伊曼主导的计算机制造取得巨大成功。

霍尔特试图梳理图灵与诺伊曼的性格特点,以及他们两个人的交集,展现了两种不同的「机器人生」。

如果各位看过电影《模拟游戏》,一定对阿兰·图灵在二战期间的「战功」印象深刻,但电影有意无意地忽略了图灵此时对于通用计算机的思考。本书作者霍尔特引用了 David Leavitt 的研究和观点,后者则是《The Man Who Knew Too Much:Alan Turing and the Invention of the Computer 》一书的作者。

图灵对于计算机的思考始于大学期间。在参加一个关于数学基础的讲座时,图灵了解到一个数学难题:决定性问题(decision problem )。

决定性问题的本质是思考推理是否可以用计算来表达出来。早在 17 世纪,哲学家莱布尼茨就在追求这个方法,他希望通过一个理性的微积分公式,来解决所有的分歧。对数学家而言,如果能有一套机械规则来快速判定某些推理是否有效,也势必给数学领域带来翻天覆地的变化。

图灵给出了一个异常简单的答案,他将人类计算过程中的工具进行抽象,比如人类运算的时候会在纸上写或擦除文字或符号;再比如,人类会关注纸张上的符号、数字位置,并始终关注位置的变化。

这就是图灵机的灵感来源。1936 年,23 岁的图灵已经解决了「决定性问题」,不过与此同时,一位来自美国的逻辑学家 Church 也解决了这个问题。为此,图灵决定前往普林斯顿,学习更多逻辑知识。

在普林斯顿,图灵一边向前辈学习数理逻辑,一边着手准备设计图灵机,此时他已经开始用继电器来实现基本控制。与此同时,图灵还认识了冯·诺伊曼,他也是我们故事的主角。只不过这段学习将成非常短暂,随着二战的升级,图灵回到英国,开始了破解德军电报密码的工作,这一段恰恰也是电影《模拟游戏》里的内容。

1945 年二战结束,图灵提出一份建造计算机的详细计划,其中包含了从抽象结构到电路图的所有内容,以及 11000 磅的预算,但战后的英国,资金和原材料非常紧张,无法支撑这台计算机的建造,图灵和同事们被迫放弃在伦敦工作的想法,他们搬到北方的工业城市曼彻斯特,希望利用当地的工业基础,加速计算机的建造。

霍尔特认为,图灵对于计算机的迷恋体现在哲学层面。这可以从图灵写给朋友的一封信里看出来,信里写道:「我对制作大脑动作模型的可能性比计算机的实际应用更感兴趣」。也正是这样的兴趣,促使图灵进一步思考是否存在一台可以模拟人类大脑能力的机器,他将这些思考以论文的形式发表,并提出了「图灵测试」。

与图灵哲学层面的「计算机」不同,在大洋彼岸的美国,曾与图灵共事的冯·诺伊曼,则希望真正打造一台计算机。

二战期间,美国军方就已经开始秘密研发「通用计算机」,这台机器只能用于计算原子弹的路径,根本无法编程,也无法成为所谓「通用计算机」。

1945 年二战结束,美国继续推进计算机的研究工作,宾夕法尼亚大学承建了这台计算机的设计建造,冯·诺伊曼则已技术顾问参与其中,1935 年,冯·诺伊曼详细总结了这台计算机的设计逻辑,比如以二进制代替十进制,并发表了了一篇报告,自此之后,冯·诺伊曼的计算机架构延续至今,成为所有计算设备的标准。

从结果上看,冯·诺伊曼无疑是成功的,但霍尔特认为,这份成功背后掩盖了太多的事实。

首先,冯·诺伊曼的「通用计算机」架构是否来源自图灵呢?冯·诺伊曼在普林斯顿认识了图灵,还曾在图灵博士毕业后给他一份工作,不过由于图灵回国而作罢。而且,不止一位当时的人谈到,冯·诺伊曼非常清楚图灵的通用计算机的想法,

霍尔特引用了 2012 年出版的《图灵大教堂》一书的内容指出,冯·诺伊曼从图灵那里获取了灵感,将计算机看作一种逻辑机器,从而实现了通用计算机建造。至于为何图灵没有建造成功,一方面是战后英国无力承担这样的工程,另一方面则是,冯·诺伊曼的声望,使得其可以在美国获得更多的资源支持,当时美国军方由于担心冯·诺伊曼前往 IBM 或去哈佛,也加快了资金支持力度。

其次,冯·诺伊曼主导的这台计算机让计算机科学感到蒙羞。1952 年,这台计算机第一次亮相,通过这台计算机精确计算后,一颗氢弹准确地找到了目的地。霍尔特认为,这让计算机从一开始就带有了「原罪」。

事实上,冯·诺伊曼也是冷战时期最反对苏联甚至主张先发制人的科学家,他也成为以后好莱坞电影里某些邪恶博士的原型。霍尔特援引科学历史学家乔治·戴森的观点,冯·诺伊曼似乎和魔鬼达成了协议,「科学家们会得到计算机,而军队得到炸弹。」

另一个细节是,冯·诺伊曼并不关心物理结构,他只是招募了一群聪明的成员。他曾反复告诉他的团队,「不要从头创造任何东西」。也就是说,他不在乎到底这台计算机上的技术是不是原创,他要的是一台属于他的计算机。

因此,霍尔特最后写道,数字宇宙的真正起源不是在上世纪 50 年代,而是在 1936 年,由一位年轻的英国人阿兰·图灵所开启。冯·诺伊曼当然也是一位伟大的科学家,他和图灵一样是二战的幕后英雄,但我们还是需要记住:那台图灵想象中的计算机要比冯·诺伊曼制造出来的计算机更能对抗极权与暴政。

AI 公司如何转型、数据为什么不是 AI 公司的护城河以及 AI 是否是新电力?

2017 年 12 月的时候,阿里巴巴技术委员会主席王坚博士曾发表过一个观点:「今天最需要转型的不是传统公司,而是互联网公司」。

这句话当然有不少潜台词。王坚博士主要关注的是互联网与制造业的融合,比如他说:「没有互联网的制造业没有未来,没有制造业的互联网更没有未来」。而随着制造业与互联网之间的关系越来越密切,衡量经济发展的标准也会从用电量转为计算消耗量。

由此也引发了我的一系列思考。如果互联网公司需要转型应对赋能实体经济,那么「人工智能公司」是否也应该转型呢?或者,是否可以推理出,所谓「人工智能公司」是一个伪命题呢?吴恩达曾将人工智能比作「电力」,那么这个「新电能」是如何发挥作用的,是否也和王坚所说的「计算消耗量」是同一个事情?

差不多一年前,我曾在当时的会员通讯里提出一个观点,人工智能不仅需要技术上的突破,还需要一场全新的社会协作。我引用了 Google 大脑团队的女科学家 Hanie Sedghi 的一段话:

The other issue is the need for collaboration between social scientists and AI researchers. You know, you can’t expect AI researchers themselves to come up with a clear understanding of fairness. Not only we need people in social sciences to collaborate with us in defining these words, but also we need to keep this collaboration all along to the end of the product research and development.

这种社会协作正在越来越多的垂直领域里发生:

脸部图像的标注是一个几乎没有门槛的工作,智力正常的成年人都可以很轻松地在脸部图像中找到鼻子、眼睛、嘴巴。但当图像识别从人脸延伸到垂直领域,比如医疗影像时,就面临一个巨大挑战,毕竟,不是每个人都具备医疗知识,而且从医疗安全的角度考虑,也无法有所谓的速成教程。因此,标注医疗影像的工作必须是一件人工智能工程师与经过专业培训的医生来一起完成。

类似的案例也出现在工业制造、环境保护、法院审理等多个领域。以法院庭审为例,长期以来,如何将庭审时的记录自动化,曾是一件遥不可及的事情。这是一个可以运用语音、自然语言理解的综合场景,同时也是一个专业化、场景化非常突出的领域。有一些公司将语音识别卖给法院使用,当另一个尴尬的事实是,当一个语音识别系统将一个小时的庭审语音转化为几百页的文本记录时,不管是原被告双方现场签字还是后续的搜索摘录,反而又成了一件效率低下的事情。

更进一步的问题:放眼全球,过去三四年的时间里,不管是 Google、Facebook、百度、阿里这样的巨头,还是商汤、旷视这样的独角兽企业,他们的人工智能技术到底开创了一个个新行业还是被一个个传统行业所改变?

答案也显而易见。以全世界公认人工智能技术最强的 Google 为例,其人工智能各项技术的用途大致分为两类:

  1. 内部:用于改进搜索结果;用于打造 Google 语音助理,并提升语音交互体验;用于打造基于算法的手机相机;
  2. 外部:将 AI 能力(硬件、服务)包装为单独的模块,通过云服务提供给不同领域的企业或开发者;与包括医疗、零售等行业合作,将 AI 能力用于他们的业务体系里。

类似的尝试,我们也可以在百度、阿里巴巴、微软等巨头公司新闻稿里看到,阿里云更是提出了「产业 AI」的概念,并一次为口号,开始向各个行业销售自己的 AI 技术。

从技术角度去看,当下 AI 最火的领域主要集中在机器学习。过去三四年的实践的确证明了机器学习可以实现某种意义上的 AI,但机器学习也面临两大无解的难题:其一是只能解决特定领域的问题;其二是需要海量的数据。

上述两大难题也注定了目前所有的 AI 巨头或独角兽只能选择「下沉」到各个行业,利用这些行业里丰富数据,一个个地解决行业问题,而这些特定行业的解决方案是否具有通用性,目前还留有巨大的疑问。

这也让我不得不得出第一个结论:当下的人工智能公司,或者人工智能产品,根本无法开启一个「AI 产业」,他们所扮演的角色,不过是各个行业转型过程中的助推器罢了,一如 a16z 投资人 Ben Evans 所言,机器学习(人工智能)更像是「新时代的 SQL」。

那么,如此多的 AI 公司与 AI 产品以及当下各行各业对于 AI 的拥抱,能否让 AI 成为如电力一般的技术呢?

吴恩达将电和人工智能放在一起对比,其中隐藏了一个条件,人工智能也是一个通用技术:

Just as electricity transformed almost everything 100 years ago, today I actually have a hard time thinking of an industry that I don’t think AI will transform in the next several years……

但正如上文所言,目前人工智能只能局限在某些特定领域,学术上曾经用了「弱人工智能(Narrow AI)」来定义只能在特定领域的 AI 技术。这也意味着,目前的 AI 根本无法成为一种通用技术,也无法像电力一样带来如此大的社会和经济影响。

即便我们假设,吴恩达所言的「人工智能」是学术界的「强人工智能」,也就是具备了通用技术的潜力1,那么 AI 又该如何像电力革命那样,影响世界呢?

投资人 Rob May 在一篇文章里探讨了这种可能性,他首先提出了一个观点:电力革命价值的最大化,来自于用电价格的平民化。

他提到了一位企业家:塞缪尔‧英萨尔(Samuel Insull)。一位英国出生的美国商业巨头,富豪,爱迪生早年的私人秘书和密友,通用电气创始人之一,他的一生备受争议,但他用大型蒸汽涡轮机来生产廉价的电力,实现规模经济以此来克服市场成本,这就使千家万户都能用得起电。

Rob May 认为,如果将电的发展规律作为 AI 的参考,势必要思考 AI 的成本结构,主要包括三个方面:

  1. 数据成本
  2. 推理成本
  3. 训练成本

先说数据。如上文所言,数据是人工智能里的「燃料」,尤其在已标注的数据。然而,AI 的数据与发电时的燃料所不同的一点:尽管数据越多越好,但当数据量达到某个阈值之后,其 AI 模型的精准度并不会继续提升。也就是说,AI 的数据无法成为一种规模经济,依靠更多数据来降低整个 AI 成本,几乎是不可能的事情。

另外值得一提的是,数据不会成为 AI 巨头们竞争的第一要务。原因也不难理解,即便是中美两大数据量最大的公司——阿里巴巴与 Google——其所拥有的数据还是自身业务数据,阿里的电商数据可以直接应用到制造业的 AI 模型训练吗?显然不能,同理,Google 的搜索数据,也无法帮助其 AI 模型应对零售业的需求。

从这个角度去看,AI 数据成本,既无法通过数据量扩大形成规模经济而降低,也不能依靠 AI 巨头们自身的数据优势。

再来谈推理和训练成本。我同意 Rob May 的观点,目前推理成本受限于硬件。过去的 2018 年,我们也看到了包括 Google、亚马逊、华为、阿里等巨头开始布局芯片领域,也涉及到了推理芯片,这是一个非常好的信号,有望推动这个领域进入规模化阶段。

而 Rob May 所言的训练,则是广义层面的「训练」,他这样写道:

……and by training I don’t mean training a neural net. The current model of doing so is way too targeted to be a generic benefit like we need for the AI-as-electricity framework to make sense. At some point, I think training will be a more generic process that includes humans training machines, and machines learning by reacting to a broad based environment like humans do — not just narrowly targeted applications. I think broad based training is the place to really get economies of scale — train a thing once and see it execute that training as many times as the world needs it to for all kinds of applications.

利用这种更广义的人与机器、机器与环境甚至机器与机器的「训练」,有望可以大幅降低 AI 的训练成本,比如某一天,你可以用 1 美元事业 GCP 上的机器学习服务器。Rob May 还援引了经济学家罗宾·汉森 The Age of Em 一书里观点,当 AI 成本最终接近电力成本时,整个 AI 的使用成本结构也很发生变化:你也不是为目前执行的任务付费,而是像用电一样,为你使用 AI 技术的时间与总量付费。

到这里,我也可以逐一回答本文一开始的几个疑问。

第一,当下,人工智能公司或者人工智能产品突破的唯一途径就是「下沉」到各个行业,打造各个垂直领域的人工智能;

第二,没有「人工智能产业」一说,但「产业人工智能」会有巨大市场;

第三,数据当然是「新石油」,不过,这种新能源并不你直接带来规模效应,数据也不是人工智能公司的护城河,至于护城河是什么,参加第一条;

第四,人工智能会不会成为像电一样的通用技术?有可能,但前提是,我们可以进入「强人工智能」时代。(完)


  1. 此处我只是假设,因为 50 年甚至 100 年里都不会出现真正意义上的「强人工智能」。  ↩

微软企业产品线全景报告

知乎上有个问题:「1997 年苹果濒临倒闭是,为何盖茨会给苹果投资 1.5 亿美元」。这个问题的回答者不乏像黄继新这样的大拿,另外还有大概 20 个值得阅读的回答,这些回答基本集中在以下几个方面:

  • 人情关系:比尔·盖茨与乔布斯的私人关系;
  • 规避反垄断法的风险;
  • 苹果与微软的专利诉讼。

但我最认可的答案来自一位名叫 Lvony 的网友,他从微软与苹果之间是否存在竞争关系入手:

这些答案和问题一样犯了一个致命的错误:谁说苹果是微软的竞争对手了?

两家公司经常互怼就是竞争对手吗?这就像BAT三家互怼一样,请问他们在什么领域直接竞争吗?

所以问题的关键在于,他们根本就不是竞争对手啊,所以搭救一下苹果对当时的微软乃至现在的微软又有什么伤害呢?难道没有苹果微软的手机就会成功?

微软是一家软件公司,请记住这一点,苹果有卖过非苹果平台的软件吗?没有啊,亲!他们怎么竞争了?微软怎么掘墓了?

…..

微软的最大竞争对手其实是IBM、Sun什么的这些软硬件都做的公司或是Lotus、Corel、Netscape之类的软件公司。苹果?那是他的合作伙伴好吧,和intel一样的合作伙伴……

引文部分的加粗文字是我特意标注的,这也是我对微软这家公司的一个定位。即便是现在距离微软「拯救」苹果公司已经过去了 22 年,即便是在当下微软的硬件业务逐步成为 PC/平板/二合一等计算设备的代言者,但微软的依然是一家软件公司,或者更准确地说,是一家面向企业的软件公司。

2018 年 3 月,在经历了一次全新架构调整后,微软的核心业务包括以下三个板块:

  1. 生产力和商业应用;
  2. 智能云;
  3. 个人计算设备。

从财报上看,微软的绝大部分收入来自企业市场,也就是上文里的 1 和 2 领域。

img

具体来看,微软的生产力和商业应用板块,包括了 Office 365、Skype、LinedIn、微软的 ERP 以及 CRM 和 Dynamic 365。

智能云板块包括 Azure 云平台、Visual Studio 开发者平台以及面向云端服务器的 Windows Server。

最后的个人计算板块,也就是消费者比较熟悉的 Windows 系统、Surface 硬件、Xbox 游戏主机等。

下图是微软 CEO 纳德拉上任之后的股价变化,可以看出,这位微软历史上第三位 CEO 带来这家公司实现了「跨越式发展」。

img

而如果将股价变化与去年三月微软架构调整结合起来去看,也能进一步看到,微软目前押注云、人工智能的正确性,下图是 CBinsights 统计的一份微软管理架构。

![]()

这份架构明确了 AI 在微软的地位,从内部运营、研发到外部赋能、产品升级,微软都希望将 AI 作为整个公司的核心引擎,至少在过去几年,微软作为一家面向企业的公司的营收已远远超过其他竞争对手。

img

正如上文所言,企业业务一直是微软主要的收入来源,因此,只有理解微软在企业业务上的实力和布局,才能真正理解微软这家公司的本质。

自 2014 年纳德拉出任 CEO 开始,云始终就是微软的核心产品,目前微软的云产品不仅支持内部的软件、游戏、个人计算业务,还通过 Azure 公有云平台,不断向 AWS 发起挑战。

纳德拉在上一季度财报里这样评价云的重要性:

Every one of our solutions is reinforcing our core intelligent cloud and intelligent edge platform. Not only are we optimistic about the opportunity for us and for our customers, we also recognize our responsibility.

纳德拉的确有底气说这番话,在涉及到云服务的投资、收购中,微软可谓不遗余力。比如 2016 年投资 Mesosphere,这是一家打造 Mesos 容器的创业公司,虽然拒绝了微软 1.5 亿美元的收购邀约,但如今两家公司已经实现了战略合作。

另外,微软还投资了私有云创业公司 CloudSimple、容器开发者工具公司 CodeFresh、企业业务分析平台 Paxata 等。

上述这些投资都是通过微软旗下的投资集团 M12 完成,M12 网站上也介绍了该投资机构的愿景。

img

相比于 AWS 和 GCP,微软的收购策略非常激进。自 2013 年开始,微软收购了大量与云相关的创业公司。

img

这其中几个典型代表:

  • 2017 年 6 月,微软收购云计算费用管理配置公司 Cloudyn;
  • 2018 年 6 月,收购 AI 软件公司 Bonsai;
  • 2018 年 6 月,收购 Github;

微软在云上的巨额投资还体现在 Azure 云数据中心投入上。数据中心的投资是一个巨额投资,目前尚无公开信息透露每一个数据中心的具体成本,但如果以云计算最赚钱的 AWS 在数据中心的投资速度来看,微软依然是目前数据中心投资最多的公司。目前微软 Azure 数据中心可用区为 44 个,并且还有 10 个可用区还在建设之中,这些数字都要比 AWS 和 GCP 高。

img

如今,Azure 的云服务产品已经非常丰富,下图是微软 Azure 的产品目录,从云基础设施到 IoT 以及 AI,Azure 可谓应有尽有。

img

而微软作为企业服务的早期玩家,其云服务最早也主打混合云,这是一个不同于公有云和私有云的架构,混合云的架构能够帮助企业实现在公有云与私有云之间的数据、业务切换,为企业提供安全、灵活的云服务,也是很多大公司的首选的云服务解决方案。

根据微软上一季度财报透露的信息,整个智能云业务营收 86 亿美元,同比增长了 24%,主要的贡献力量来自混合云产品。财报分析师会议上,纳德拉也进一步强调,混合云并不是企业迈向云端的过渡:

…we don’t think of hybrid as some stopgap as a move to the cloud. We think about [it as] the coming together of distributed computing where the cloud and the edge work together for not just the old workloads, but most importantly for new workloads.

这也意味着,微软会将混合云作为未来 Azure 阻击 AWS 的重要武器。事实上,过去的 2017、2018 年,即便是曾对混合云嗤之以鼻的 AWS,也开始逐步加大混合云的支持力度。2018 年的 re:Invent 大会上,AWS 发布 Outposts,可以让企业将亚马逊云搬入自己的数据中心,可以兼容在AWS原生平台或 VMware Cloud on AWS 上,这一步大大加强了AWS 在混合云上的竞争力,这个领域的争夺也将持续下去。

混合云之外,微软的云服务产品里还有几个值得关注的,比如其对量子计算的关注,根据 The Information 的报道,微软招募了多位曾在高通的工程师,推进量子计算的研发,不过这个领域还处在相对早期的阶段,距离技术突破还需要一段时间。

另外,2018 年,微软在 Build 2018 开发者会议上发布了 IoT 和边缘计算的计划,CB insights 统计了微软新闻宣传里的用语,如下图所示,IoT、边缘计算已经和 Azure 绑定在一起了。 img

如果说 Azure 是在 AWS、GCP 的云战场,那么微软还有另一个战场:企业软件和服务。

微软是全球最大的企业软件公司。上一个季度里,微软企业软件、服务的营收为 98 亿美元,运营利润 39 亿美元。企业软件服务的增长主要通过投资并购以及内部的产品创新共同推动。

与云服务一样,微软企业服务的投资依然通过 M12VC 完成,自 2013 年开始,M12VC 参与了微软整个 61 个投资项目中的 48 个,比如 CRM 管理平台 Outreach、身份管理软件 Onifido 以及增强智能平台 CongitiveScale 等。

img

微软对于企业软件服务的收购也非常积极。2015 年,微软一口气收购了 14 家公司,包括云数据管理公司 Informatica、待办事项创业公司 Wunderlist 以及文本分析软件 Equivio 等。

img

目前来看,只有 Github、LikedIn 等少数几家公司保持独立运作,上述收购的产品,绝大多数都融入到微软的产品策略里。

纵观微软的企业产品图,其核心是两大产品 Windows 和 Office,而为了进一步增强 Windows、Office 的用户粘性,微软持续推出一系列企业服务产品。

需要特别指出的是,如今的微软企业软件,已经全面拥抱订阅制,并以 SaaS 的方式完成软件的分发。以 Dynamics 为例,这是一个集 ERP 与 CRM 的软件,早在 2000 年左右就已经推出,而 2016 年 11 月,Dynamics365 正式问世,尽管功能类似,但这是一个基于云端的 SaaS 订阅产品,为企业提供了更灵活的产品选择。

对于企业用户而言,使用统一架构的优势不言而喻。为此,微软还将 Office 365 和 Windows 10 订阅整合到一个新产品中,打造了 微软365 的订阅组合,提供了更多数据分析、团队协作、数据安全的功能。

img

企业软件服务在微软内部的地位还体现在多个方面,比如 CB insights 就发现,微软企业服务的专利申请远远超过消费者业务的专利。

img

而在财报分析师会议上,提及企业服务(包括 Azure)的次数在过去四年有了大幅变化。

img

而在中国市场,微软作为 IaaS 领域最早落地的美国公司,已经通过世纪互联向中国客户提供服务,既 Azure、Office 365 之后,2018 年微软也宣布其 Dynamics365 将在今年春天落地中国,从而进一步完善了微软在华的企业产品线。

以上就是微软企业产品线的基本情况,如果再回过头来看那个关于微软与苹果的问题,结合当下两家公司的处境和发展方向,也不难发现,其实这二十多年里,两家公司并没有太大变化,依然有着自己的产品边界,苹果依然是一家面向消费者的「硬件+服务」的公司,而微软,也还是一家面向企业客户的软件服务公司。(完)

智能音箱的「智商」

智能音箱的「智商」|Dailyio Issue#226

圣诞节前,美国 VC Loup Ventures 发布了一份年度智能音箱 IQ 测试报告。测试中,Loup Ventures 选取了美国四个主流智能音箱,包括 Google Home、苹果 HomePod、亚马逊 Echo 以及搭载微软 Cortana 的的音箱 Invoke。

Loup Ventures 设计了 800 个测试问题,主要分为以下五个方面:

  • 本地服务:比如「最近的咖啡馆在哪里?」
  • 购物:比如「订购一包纸巾」
  • 导航:比如「如何坐地铁去 XX 大楼」
  • 资讯:比如「这周有哪些英超比赛?」
  • 语音命令:比如「提醒我下午 4 点打电话给XX」

Loup Venture 利用两个维度来测量这些音箱回答质量:其一,是否真正理解了问题;其二,是否做出了精准的回答。

由此得到了下图的测试结果,在「理解问题」的测量里,四个产品并没有特别大的差距,真正的差距出现在回答精准度上。最终,Google Home 无论是回答准确率还是理解问题上都领先其他几个产品,也成为「智商」最高的智能音箱。

img

这个测试以一种客观数据的形态展现了目前各家巨头智能音箱的实力,但过于客观的数据却显得太冰冷,如果仅仅将智能音箱理解、回答问题作为衡量智能音箱的标准,尤其是,强调所谓智能音箱的「智商」,更是充满了数字(数据)至上的偏见。

首先,从计算设备形态上看,智能音箱都是一个典型的家庭设备,这也意味着它和作为个人计算设备的智能手机有着明显的不同。比如相比于智能手机,智能音箱几乎是不可移动的,它常年位于家庭中某一个固定的地方;再比如,智能音箱允许家庭里的所有人来唤醒它、使用它,这也让智能音箱成为电视之后又一个更具「客厅意义」的计算设备。

其次,智能音箱的交互远不是语音交互这么简单。2017 年,亚马逊发布了带屏幕的 Echo Show,不仅增加了屏幕的交互方式,还进一步强化了智能音箱作为家庭计算设备的属性。我曾在当时的会员通讯里写道:

为此,Echo Show 还提供了一个名叫「Drop in」的功能……你可以将其理解为一个类似对讲机的功能,再开启该功能后,你可以随时查看其他家庭成员家里或房间里 Echo Show 相机拍摄的画面,比如广告里年轻夫妻要查看婴儿房里两个啼哭孩子的时候,就使用了这个功能。

这是一个颇具野心也很具「侵略性」的功能,它大大强化了 Echo Show 的家庭定位,你不大可能将「Drop in」用在普通朋友之间甚至情侣之间,但在家庭成员之间,这个功能却大有用途。广告里至少有两个「Drop in」功能的演示,其场景设计都是围绕家庭成员内部的沟通。

去年 3 月,阿里巴巴和百度相继在国内发布了带有屏幕的智能音箱。彼时,中国智能音箱市场刚刚由阿里巴巴天猫精灵带动起来,而两家公司也在 3 月下旬带来了两个「屏幕音箱」,不过阿里巴巴的解决方案略显简陋n 基于 AliGinie 2.0 的精灵火眼功能,该功能内置在天猫精灵的手机 App 中,用户只需要同时购买一个类似手机支架的 Xholder,就能让 2017 年发布的天猫精灵 X1 变身为「视频音箱」。

img

四天后,百度在其总部召开一场硬件发布会,李彦宏亲自上阵,发布了传闻已久的百度智能视频音箱「小度在家」。

img

「小度在家」的宣传片里,忙碌的年轻人无法和父母团聚、焦虑的职场的妈妈想时刻和孩子通话等等场景反复出现。这年 Echo Show 发布时的广告几乎一模一样,尤其是家庭通讯功能:

其中,“一呼即通”功能最适合有老人和孩子的家庭。通过简单的权限设置,当你向家里的小度在家拨出电话时,不需要家人操作接听,小度在家就能帮你直接联通。

综上来看,智能音箱的设备形态、更丰富的交互方式,使得智能音箱的定位越发清晰化,它一个全新的家庭设备。另一方面,纵观国内外,不同公司对于自身智能音箱的功能也有不同的侧重,比如 HomePod 更强调其在整个苹果生态里的左右,而 Google Home 则是 Google 搜索的延伸,至于亚马逊 Echo,则藏着亚马逊电商扩张的野心。

在国内,百度虽然发布了多款智能音箱,但其用意是推动 DuerOS 的市场份额,而小米的智能音箱卖点,是其智能手机以及物联网的广泛布局。

因此,仅仅依靠语音识别和反馈,并不足以反映智能音箱的实力,更无法体现所谓的「智商」,它只是提供了一个简要的测试维度,不具备任何行业示范意义。

95 篇付费内容里,隐藏了六大科技行业关键词

如果算上这一期,Dailyio 在 2018 年共发布了 88 期会员通讯以及 7 期「Weekly Spot」(这部分内容只发送给年付会员)。这些内容始终围绕科技行业,尤其是互联网行业的变化,同时,又围绕科技领域延伸出一系列社会、经济思考。

作为今年最后一期 Dailyio 会员通讯,我也希望通过整理过去一年 Dailyio 会员通讯的内容,梳理出 2018 年 Dailyio 所定义的科技行业关键词,包括以下:

  • 超越技术性的 AI
  • 云端之战
  • 保卫手机
  • 自动驾驶的乱局
  • 拯救社交媒体
  • 尴尬的 iPad Pro

超越技术性的 AI

2018 年的人工智能依然是整个科技行业关注的焦点,但这个话题显然已经超越了技术领域的范畴。

当人脸识别技术已经足以惩罚城市闯红灯的人的时候,更多人的反应是对其技术拍手叫好,几乎没有任何中文媒体提及人脸识别背后的潜在危险。我曾在一期会员通讯里引用《大西洋月刊》的一段讨论

The technology’s veneer of convenience conceals a dark truth: Quietly and very rapidly, facial recognition has enabled China to become the world’s most advanced surveillance state.

当新技术被应用到公共领域,普通个体智能寄希望于当局的算法不要「作恶」。在今年公布的《北京市进一步优化营商环境行动计划(2018年—2020年)》里,明确提出,2020年底前完成北京市社会信用条例立法工作,并建成覆盖全部常住人口的北京「个人诚信分」工程。这也意味着,北京将真正开启对个人信用的评价,个人诚信分将关系终身。

官方的通知这样写道:

未来三年,北京将完善信用联合奖惩机制。建立健全数据清单、行为清单、措施清单等全市统一的信用联合奖惩“三清单”制度,2020年底前建成覆盖全部常住人口的北京“个人诚信分”工程。“这是北京一个重要的创新做法,将对个人的信用进行评价,关系终身,”市发改委相关负责人表示。根据《行动计划》,北京将大力推动信用信息在市场准入、公共服务、旅游出行、创业求职等领域广泛应用,为守信者提供“容缺受理”“绿色通道”便利措施以及“信易+”示范项目激励措施。此外,还将完善信用黑名单制度,定期公示企业和个人失信记录,形成“一处失信、处处受限、寸步难行”的失信惩戒格局,让违法违规失信者付出沉重代价。

事实上,海外媒体对于此事的敏感度,早已身在其中的你我更清楚,还记得今年 1 月份《连线》杂志的封面吗? img

站在无处不在的屏幕前的任何抵抗都不可避免地被屏幕光所遮挡。数字化、屏幕、电子设备,这些人类文明的产物是否真的在推进人类进程呢?

其次,当中国的机器学习创业公司越来越多地成为全球科技领域的新独角兽时,另一个被忽视的事实是,大量中国人工智能公司与中国政府之间的复杂关系,正在成为美国以及其他西方国家最大的担忧

CBinsights 也在一份研究报告里详细分析了中国机器学习创业公司,特别是机器视觉公司与政府的关系,比如 LLvision 公司(亮亮视野公司),下图是春运期间郑州火车站执勤民警的装备,就是来自 LLvision公司。

img

事实上,即便是美国公司,其人工智能与政府之间的关系也成为媒体关注的焦点。以 Google 和军方的 Maven 项目为例,在经历了一系列员工抗议和媒体声讨之后,Google 最终宣布待项目到期后,不再参与其中。

即便 Google 随后更新了自己的 AI 使用原则和底线,但我依然将其定义为「人工智能新黑盒子」。一方面,从生意的角度来看,政府又是新技术的最大卖家,另一方面,科技公司与政府合作的透明性无法保证,我曾在当时的会员通讯里写道:

这意味着,Google 不会停止与政府的合作,只是不会和政府合作涉及到战争的项目。也正是这段话,让 Google 此次发布的这些原则和底线都更像是一个纯粹的 PR 行为。Google 即没有设置相应的监督机制,也没有提出必要的防御措施,整个表态也就失去了其意义,此次 Maven 项目的争议中,Google 内部上千名工程师的签名信以及辞职威胁的作用到底有多大,以及在其他公司又有多少可复制性,都是一个巨大的问号。

从这个角度去看,公众早先对于人工智能的担心,有很大一部分是因为其算法本身是个黑盒子,而现在,我们更应该考虑的是,这些从事人工智能的科技巨头们,到底和政府做了哪些合作?有哪些你不知道的人工智能项目,最终影响到你我的日常生活?

第三,当全球 AI 技术实力最强的 Google,又一次选择进入中国会怎样?这几乎是 Dailyio 2018 下半年最为关注的话题,为此,我也先后写了《Google 的「成人礼」》与《Google 的「成人礼」(续):孩子才分对错,大人只看利弊》两篇文章,这两篇文章得出了一个非常悲观的结论:

一个潜在的威胁是,当互联网的原生产品——从搜索引擎到社交媒体——证明并无法改善国家民主并提升公众智力的时候,尤其是在美国互联网巨头「横行世界」的大背景下,古老帝国对于互联网的管理方法有可能被越来越多国家所效仿

随着 Google 本月悄然关闭了 Dragonfly 项目,这个争议也暂时告一段落。

第四,5 月份的 Google I/O 大会上,Google 展示了一个可以让人工智能打电话的产品 Google Duplex,如果你还没看过或者已经忘记了这个演示,不妨先来看看,视频地址

我在当时的会员通讯里这样写道:

新一集的《西部世界》里,有个细节令我印象深刻:一个新出场的妹子在园区被男子搭讪,两人在上床前,女子要用游戏枪来「检验」这个男子到底是不是机器人。

两个场景放在一起来看,一实一虚,却构成了一个宏大的命题:我们还能相信电话那头的声音吗?

这是摆在当下人工智能领域一大伦理挑战,而更大的挑战则是技术局限性与大众无知之间的矛盾,我在一期会员通讯里列举了 ZDNet 选取的几个 AI 可怕行为,除了一些被偷换概念的案例外,更多的「可怕」,则是媒体在报道上的误解与无知,以及在某些宏大命题,如人类被机器取代、人机对立上的炒作。

事实上,这些「可怕」更是人工智能当下局限性的真实写照。程序设计的不完善、算法的不透明以及 AI 程序生存环境之恶劣(参考 Tay 的遭遇),才是 AI 程序如此「可怕」的根本原因。

云端之战

Dailyio 一直关注云计算领域的变革方向,这一年,几个重要玩家相继进入到一个新阶段。

先看亚马逊,在 2018 re:Invent 大会上,AWS CEO Andy Jassy 通过分析客户的每一个痛点来发布一款款产品,从 Windows 服务器、数据库、机器学习等等。

一个值得关注的场景是,尽管 AWS 研发部门或许是在围绕客户需求来进行产品开发,但此次大会所传递的信息里,已经可以明显感觉到 AWS 受到微软 Azure 和 Google Cloud 的市场宣传的影响

正如我曾多次在 Dailyio 会员通讯里所言,公用云市场并不是一个赢者通吃的游戏。AWS 固然非常强大,但其他公司依然有自己的优势和机会。

其次,Azure。2018 年 3 月,微软进行了一次重组,设置云和 AI 部门,负责 Azure 云服务、企业服务,并将 Windows 一些涉及到企业服务的产品以及微软应用商店整合进来,还包括 AI 和虚拟现实等新技术应用落地项目。

这次重组使得微软的业务定位更清晰,并将云计算与人工智能落地牢牢绑定在一起,这意味着,微软将在加快人工智能的落地,尤其是如何将人工智能的研究通过云服务卖给更多的客户。

第三,Google Cloud Platefrom。在 GCP 的年度开发者会议——Google Cloud Next 上,GCP 进一步明确了自己的发展方向:人工智能不是未来,而是正在发生的故事。Google Cloud 不仅将人工智能注入到自己的产品里,还进一步向开发者们释放了新的信号:

  • 硬件:发布第三代 TPU;
  • 工具:公测版的 AutoML Vision(图像)、Cloud AutoML(新增自然语言和翻译)
  • 偏解决方案的产品:Contact Center AI,可以让机器直接通过电话与人类用户互动;

不过,随着 GCP CEO Diane Greene 将于 2019 年离职,GCP 也再一次被放在了媒体聚光灯之下。

过去三年时间,Google Cloud 一直希望通过机器学习作为突围而出的捷径,上述一系列布局和整合,的确让 Google Cloud 拥有了人工智能领域的号召力,但 Google Cloud 的这些成绩,更多的是「Google」的生意,而非「Cloud」的生意,或者换句话说,Google Cloud 的企业级服务能力,尤其是大企业的服务能力,始终是一个无法跨越的坎。

某种意义上说,这更像是一个企业文化或企业基因的玄学问题。Google 长期以来形成的工程师文化,促使这家公司在新技术上不断创新,以云服务为例,早在 2008 年,这家公司就发布了面向 PaaS 服务的 Google App Engine(以下简称 GAE)。

简而言之,GAE 提供了一个利用 Google 底层技术来构建 Web 应用的平台,开发者可以方便地部署自己的应用。

这在遥远的 2008 年是一件非常炫酷的事情。彼时,亚马逊 AWS 只能提供最底层的 IaaS 服务,而微软的 Azure 还要至少两年才会发布,但 GAE 作为一款典型的 Google 产品,迷失在炫酷的技术与实用的功能之中,忽略了企业客户的核心诉求:稳定性

第三,阿里云。这一年,阿里巴巴进入到「后马云时代」的过渡期,在马云即将退休的过渡期内,阿里巴巴需要一个可以向欧美市场介绍公司发展的人,张勇也在CNBC 的专访中,以双十一的意义为切入点,详细介绍了阿里巴巴体系以及未来战略,某种意义上,这也是向华尔街展现阿里巴巴对于未来的布局和思考

此次访谈里最重要的一段话是张勇对于阿里巴巴云计算业务的表述,他的原话是这样的:

We strongly believe that every business in the future will be powered by cloud. We are very happy to build this cloud infrastructure in a new digital era and support all business…… I think cloud will be … the main business of Alibaba in the future……

另外一点,9 月份的云栖大会上,阿里巴巴正式宣布进入芯片领域,并发力人工智能芯片的研发,虽然以「平头哥半导体」公司的方式运营,但这款芯片或者这一系列芯片的落脚点都是为了服务阿里云以及 IoT,从而进一步提升云服务以及物联网领域的竞争力。

所有这些都是烧钱,而且是极度烧钱的领域,在马云逐步隐退的背景下,外界普遍对于阿里巴巴新管理层能否坚持如此高昂的投资持怀疑态度,至少张勇这番话传递出来的信息,以及随后阿里云架构升级,阿里巴巴 CTO 张建锋开始负责阿里云,他也是也是基础研究机构达摩院和「平头哥半导体」的负责人,进一步凸显出阿里云的战略价值。

第四,华为。2017 年 11 月份的时候,华为掌门人任正非在华为内部 GTS(全球技术服务)做了一番讲话,其中就谈到了人工智能。我曾在当时的会员通讯里提及,这可能是理解华为人工智能发展方向的重要参考,这个讲话有以下几个关键点:

  • 人工智能聚焦内部效率提升;
  • 加快研发公司统一的人工智能平台
  • 加强内部的协同效应。

请注意标粗的第二点,「统一的人工智能平台」恰恰是今年全联接大会的主旨,华为轮值董事长徐直军本周发布了被广泛认为是近年来华为最具变革意义的项目:全栈全场景的人工智能平台。

至此,华为过去两年做了两件颇具象征意义的转型,或者说战略变化:进军公有云市场;推出人工智能平台

不论是国内还是海外,此次外界更多的关注点,还是聚焦在华为发布的人工智能芯片:Ascend 910。这是一款面向数据中心的人工智能芯片,华为官方将其性能定义为「目前全球已发布的单芯片计算密度最大的AI芯片」,将在明年二季度通过华为的公有云提供相关服务。

目前可以确定的消息是,华为不会直接售卖这款芯片,而是将其打包到整个人工智能开发框架之中,也就是上文提及的全栈全场景的人工智能平台。开发者或者企业,只有在这个平台上,才能使用华为的这款芯片,这也让未来华为人工智能的商业模式愈发和公有云绑定在一起,或者可以这么理解:华为希望依靠人工智能来实现快速追赶阿里云的目标。

保卫手机

所谓「 保卫手机」,是在智能手机 10 年之痒之后到底路在何方的大背景下,整个行业——从运营商到手机制造商——为止探寻的解决方案。

这一年手机厂商所选择的方式,就是加入人工智能。这个思路也是 2017 年智能手机发展趋势的延续,其重点则是目前人工智能发展最成熟的机器视觉,也就是利用机器视觉提升拍照体验。

当然,不同的公司依然有不同的思路,比如华为,在上半年一场名为「眼界大开」、长达两个小时的发布会上,智能手机部分的介绍至少有一个半小时,而介绍 P20 的拍照,又占据了其中的一个小时。

更愿意将其作为智能手机与人工智能结合的样本——只有实现软硬件的结合,才能真正释放人工智能在移动设备上的各项能力,这样的思路也进一步延伸到了下半年 Mate 20 系列手机的设计之中。

在全球范围内的几个玩家,包括苹果、三星、华为、Google 都拿出了不同的解决方案,在撇开外观、性能对比之后,如果将目前消费者最看重的相机来进行对比,则呈现出三大阵营:

  • 苹果、三星:软(调教算法)硬(摄像头配置)均衡并一体化;
  • 华为:优先保证硬件配置,其次是软件的优化;
  • Google:AI 算法优先,硬件配置或许无所谓;

的 Pixel 3 系列里,Google 继续以一个后置摄像头横行天下。硬件层面,Google 在 Pixel 里继续内置了一个专属的图像处理器,在这个基础之上,将 Google 的 AI 能力,尤其是计算机视觉能力,输出到这台小小的手机上

举两个例子,Top Shot,类似于 iPhone 中的 Live Photo,会记录用户按下快门前后的几秒图像,但 Google 做到了一点:让手机自动帮助用户挑选最好看的照片。

另一个就是 Night Sight,也就是夜视功能,不同于其他手机夜拍时的多张合成,而是通过对大量图片的机器学习,Pixel 3 的相机可以自动增强照片的颜色,所带来的就是更好的夜拍成效效果,下图就是一个非常直观的案例对比。 img

过往基于云端的图像处理能力——如果你用过 Google Photo,一定会机器自动修复的照片所震撼——下沉到智能手机上,也给整个行业带来新的思考:到底 AI 给予智能手机拍照的提升,是仅仅局限在后期的磨皮还是前期的成像?以及,当 AI 拍照的场景识别逐渐沦为积累的时候,AI 还能如何主动、自动给相机带来质的变化?

自动驾驶乱战

2018 年的自动驾驶令人激动。

在奔向自动驾驶的征程中,已经分化为两大阵营,他们各自对于自动驾驶的实现方式有不同的理解。

第一个阵营的公司认为,自动驾驶的实现需要循序渐进,在保持现有汽车操作方式的基础上逐步加入更多的自动驾驶技术。这些公司也主张先用高端豪车来打开市场,比如将 Level 3 里的相关技术优先配置到部分豪车上,利用这些豪车实现对市场和驾驶员的启蒙与教育,这些公司就包括特斯拉、奥迪、通用等。

与此同时,该阵营的公司也相信 Level 3 是一个重要突破口,一旦能够实现这个级别的自动驾驶,未来 Level 5 全自动驾驶也不再是遥远的事情。

第二类公司观点则显得相对激进。以福特、沃尔沃和 Waymo(Alphabet)为代表,他们认为自动驾驶的突破口在 Level 4,因此需要尽量减少人为因素,比如汽车操控装置的改革,方向盘、制动系统等都是针对人类司机的设备,机器完全不需要,那么是否可以拆除呢?

img

而从技术层面上看,高精地图的争夺越发激烈。

曾担任 Here 地图副总裁的 John Ristevski 说过这么一番话:「如果你有一辆自动驾驶汽车,那么(高精)地图并不是一个可有可无的选择,而是这辆汽车的核心功能。」作为常年奋斗在自动驾驶第一线的从业者,John Ristevski 敏锐看到了高精地图之于自动驾驶的重要意义——不仅赋予一辆汽车具备真正意义上的自动驾驶,还将开启一个高精地图商业化的美好前景。

与之遥相呼应的则是资本市场对于高精地图创业公司的青睐,由华人创办硅谷高精地图创业公司 DeepMap 已经吸引到英伟达和博世旗下 VC 的青睐,更有消息称,阿里巴巴、滴滴出行以及北汽都加入到该公司的 B 轮融资行列里。

不过摆在这些巨头和创业公司面前的挑战也不少,从技术上说,高精地图的门槛并不高,本身是一个资金密集型的产业,也就是说,未来可能还有新的玩家,或是巨头或是拿着巨头钱的创业公司入局,这个行业会越来越拥挤。

加州汽车管理部门(Department of Motor Vehicles,下文简称为 DMV)一直在发布该州公共道路自动驾驶测试车辆的事故报告,所有的报告都可以在该部门的官方网站免费获取,科技媒体 axios 根据这些数据做了一份统计,如下图所示。

img

这个图很值得玩味。先说表面现象,在自动驾驶模式下,事故率远低于传统(即人类驾驶)模式;而自动驾驶的汽车相比较于人类驾驶的汽车,更热衷于「停车」。

更深层次去看,我们首先要接受自动驾驶汽车事故将越来越多的事实。尽管目前包括 Drive.ai、Voyage 等创业公司的测试车辆都在跑在特定路段,但倘若没有公共道路测试,自动驾驶汽车的安全性无法得到验证。

随着自动驾驶汽车越来越多地进入到公共道路,道路上的汽车将分为几种类型:

  • 自动驾驶模式下的汽车,数量比较小(呈现增多的态势),安全性最好;
  • 「自动驾驶模式+传统模式」的汽车,数量中等,安全性中等;
  • 传统模式的汽车,数量最大,安全性最差;

所谓「人机混合」便是对上述场景最好的描述,由于短期内人类还不会将汽车驾驶大权完全交给汽车,这也使得因人类驾驶员错误导致的事故会不断与自动驾驶扯上关系,比如人类驾驶员过多干预自动驾驶汽车的行进模式,再比如人类驾驶的车辆与自动驾驶发生碰撞等等。

拯救社交媒体

7 月 25 日,Facebook 股价当日跌幅高达 20%,一天的市值蒸发了 1200 亿美元,创造了美国股市历史上单日最大跌幅。

img

几乎是 Facebook 股价悬崖式下跌的同期,中文社交媒体圈里开始发酵一条关于 Facebook 成立中国公司的消息,虽然中国多家科技媒体都在跟进这个消息,但随着 Facebook 中国公司从工商注册里「消失」,这些中文报道也立刻被删除。

《纽约时报》用一种戏谑的口气描绘了这个场景:

For Facebook, success in China was brief. Very brief.

也正如《纽约时报》所言,Facebook 过往多年不断向中国当局示好:

Over the years, Facebook’s founder, Mark Zuckerberg, has tried myriad ways to court China. He asked Chinese president Xi Jinping to suggest a Chinese name for his child during a state visit, held a Mandarin-language question-and-answer session with students that was widely shared, and even posted photos from a smog-filled jog through Tiananmen Square.

扎克伯格的所有举措,都是希望能将 Facebook 以某种形式实现在中国落地——不管是如 LinkedIn 式的还是类似亚马逊 AWS、微软 Azure 那样的方式,中国巨大的网络人口以及仍在持续增长的互联网市场,构成了 Facebook 用户增长的巨大想象空间。

但 Facebook 的问题远不止于增长停滞。我曾将 Facebook 比作「现实版的西部世界」,当2004 年 6 -7 月间,这家公司在成立不到半年的时间就得到 Clarium Capital 总裁彼得·蒂尔的青睐,拿到 50 万美元融资。

或许扎克伯格也像年轻时的「黑帽人」威廉一样,有段自我陈述,如下图所示:

img

后来的故事里,我们看到了 NewsFeed 的横空出世,这是社交媒体发展历史的里程碑,奠定了社交媒体的基本形态,从此之后,当你关注了某个人,他/她/它的所有状态更新都会出现在你的社交媒体时间线里。而「Like」按钮的出现进一步释放了用户的喜好,并在 Newsfeed 的算法中让「模仿的欲望」,在 Facebook 这个大主题乐园里,每个人每时每刻都在上演着自己的故事。

值得关注的是,Facebook 的进化里有太多「硅谷式的傲慢」,这也是我在阅读欧逸文最新发表在《纽约客》一篇文章的心路历程,这篇名为 Can Mark Zuckerberg Fix Facebook Before It Breaks Democracy? 的文章,通过采访扎克伯格及其身边的人,试图找到 FB 当下困境的缘由。

这篇长文涵盖的内容非常多,从扎克伯格的家庭到他创立 FB 的经历以及 FB 发展过程中多个重要节点,比如搬到加州、推出 News Feed、收购 Instagram、拒绝雅虎收购以及最近两年的假新闻和数据泄漏事件等。在欧逸文笔下,扎克伯格的形象变得非常丰满,他并非如 CNN 所言的「没有情商的工程师」,也不是电影《社交网络》里的那个野心勃勃的创业者。

自 2016 年美国大选后的争议开始,扎克伯格的 Facebook 试图一次次地为「技术」辩护,他在大选后表达了对假新闻的不屑

The idea that fake news on Facebook—of which, you know, it’s a very small amount of the content—influenced the election in any way, I think, is a pretty crazy idea……

这是他对 Facebook 平台以及用户的自信,他认为他的平台提供了足够丰富的新闻,无论真假;他同时也认为,他的用户可以像他一样分辨真假新闻。悲哀的是,或许也是这样的自信,让菲律宾、缅甸等地用户付出了生命的代价。

BuzzFeed 这篇长文详细介绍了 Facebook 在菲律宾的遭遇。FB 在当地拥有将近 7000 万用户,约占这个国家人口总数的三分之二,而另外三分之一的人口目前还没有接入互联网。这意味着,FB 成为这个国家新闻分发的中心。在这样的背景下,FB 沦为菲律宾当局的「新武器」,他们先利用 FB 散播虚假消息, 再利用传统媒体加以炒作,最后实现打击政敌或异见分子的目的。

在缅甸若开邦罗兴亚的种族冲突中,Facebook 扮演了非常不光彩的角色,联合国缅甸事实调查团主席祖基·达鲁斯曼曾这样评价 Facebook 的作用

如果你观察,在公众层面……它在实质上促进了恶性的斗争、分裂和冲突……当然,仇恨言论也是其中的一部分,就缅甸形势而言,社交媒体就是Facebook,Facebook就是社交媒体……

《纽约时报》也用一篇重磅报道给了 FB 一记重拳。通过采访了 50 多位 FB 员工或前员工以及大量政府官员,NYT 展现了 FB 面对外部压力而做出的一系列看似正确却不负责任的决定。

文章指出,扎克伯格和桑德伯格完全低估了此次危机的影响。但由于桑德伯格在公司内部负责政治议题,因此本文也是围绕桑德伯格的一系列决策过程,比如她如何「最小化俄罗斯在 FB 的影响」:

If Facebook implicated Russia further, Mr. Kaplan said, Republicans would accuse the company of siding with Democrats. And if Facebook pulled down the Russians’ fake pages, regular Facebook users might also react with outrage at having been deceived: His own mother-in-law, Mr. Kaplan said, had followed a Facebook page created by Russian trolls.

Ms. Sandberg sided with Mr. Kaplan, recalled four people involved. Mr. Zuckerberg — who spent much of 2017 on a national “listening tour,” feeding cows in Wisconsin and eating dinner with Somali refugees in Minnesota — did not participate in the conversations about the public paper. When it was published that April, the word “Russia” never appeared.

Ms. Sandberg’s subordinates took a similar approach in Washington, where the Senate had begun pursuing its own investigation, led by Richard Burr, the North Carolina Republican, and Mark Warner, the Virginia Democrat. Throughout the spring and summer of 2017, Facebook officials repeatedly played down Senate investigators’ concerns about the company, while publicly claiming there had been no Russian effort of any significance on Facebook.

这场涉及到技术、外交、政治乃至社会的博弈,也就延续到 2019 年,这场博弈没有所谓的胜者,唯一能做的,就是让损失降低到最低。

尴尬 iPad Pro

2018 年的苹果公司有诸多值得铭记的重要时刻,比如公司市值破万亿美元,再比如正式将 iPhone 的定价放到了 1100 美元(约合人民币 10000 元)+的价格区间里。

但我看到的则是新一代 iPad Pro 的尴尬

在纽约布鲁克林音乐学院 Howard Gilman 剧场的这场秋季发布会,蒂姆·库克出场后受到了全球经久不息的掌声与欢呼声,而中间产品发布的串场中,面对如此热烈的现场反馈,库克甚至表示:「我要搬到纽约!」

iPad Pro 毫无疑问是这场发布会的主角。库克在串场时透露了两组数字,截止到现在,iPad 的累计销量已经达到 4.4 亿部;而在一个对比图里,如下图所示,上一季度 iPad 产品线的销量已经超越 PC 行业老大惠普。

img

上述两个数字的解读有很多。从我的角度来看,至少有三点需要关注。其一,庞大的 iPad 存量用户会成为苹果巨大的资源,能否让这一部分人升级换代新 iPad 或者 iPad Pro 将成为 iPad 产品线未来发展状况的重要指标。

其二,苹果有意将 iPad 放在 PC 行业销量的对比中,某种意义上也是一种错位竞争。毕竟,在 iPad 所有产品里,真正拉高销量的还是价格较低的 iPad(比如 2018 年的所谓教育版 iPad)。

其三,正由于 iPad Pro 在整个 iPad 产品销量的比重并不高,因此,此次发布会,苹果给 iPad Pro 带来了一次史无前例的变化,第一次让 iPad Pro 用了除尺寸之外更多可辨识的外观特点。

从此开始,「Pro」所代表的,不仅是性能,还有外观设计以及大量独家配件,此次发布的 Apple Pencil 第二代已经不能向下兼容,这意味着 2017、2018 年两代 iPad Pro 的区分度已经非常明显了。

作为一个多年 iPad(包括 iPad、iPad Mini、iPad Pro)的用户,甚至还写出了如何在 iPad Pro 上践行生产力的电子书,更重要的一点,我现在有超过 95% 的工作都是在 iPad Pro 上完成。但我依然只能说,苹果所希望的 iPad Pro 的样子,在 2018 年 10 月 30 号发布会之后,只兑现了一半的承诺,还有一半的承诺要在 2019 年才能兑现。

年初的时候,长期跟踪苹果产品动向的 Bloomberg 记者 Mark Gurman 独家爆料,整个 2018 年,苹果将 iOS 的升级更新定位于优化性能、减少 Bug,更大层面的更新被推迟到 2019 年 的 iOS 13, 以 iOS 12 为例,相较于 2017 年 iOS 11 所带来的惊喜,iOS 12 所释放的信息就是两个字:优化。

比如,iOS 12 可以适配所有支持 iOS 11 的设备,并对早期的 iOS 设备进行了性能优化,减少应用和键盘弹出时间;再比如,在 AR 场景中,推出 ARKit 2.0,这是 2017 年苹果发力 AR 之后的升级版开发工具;再比如基于机器学习的照片推荐功能,提供了搜索建议、编辑照片时的建议以及照片分享建议等等。

如果以一个更新周期(通常为一年)来看,这当然不会是 iOS 12 的全部,不过,参考历次 WWDC 大会上 iOS 更新所展示的样子,也可以肯定地说,这就是 iOS 12 的全部功能。

这意味着,当 2017 年 iPad Pro 9.5 英寸随着「 iOS 11 For iPad」一并发布时,用户可以明显感知到一款软硬件结合后的新一代计算设备的雏形。而昨天发布的两款 iPad Pro,尽管硬件上拥有了「野兽般」的功能提升,但在系统层面,屏幕交互借鉴的是 iPhone X 系列的交互手势,一屏多应用的操作逻辑也是从 iOS 11 开始的小修小改,这也让此次发布的 iPad Pro 多少有点尴尬。

尾巴:年关难过年年过

每年的岁末年初都弥漫着一股告别无法改变的过去与期盼不确定性未来的复杂情绪。2018 年下半年所盛行的「寒冬论」,更加剧了对于 2019 不确定性的担忧。

但如果你去翻开历年的年终总结,多少也可以发现,这几乎人类在某种时间仪式面前例行的自我反思,所谓「年关难过年年过」便是这个心理的最佳描述。

2018 年已然过去,回忆与展望都不足以度过这个「寒冬」,唯有坚持自己的目标,才能一步步迎来春天。

我们 2019 年再见!

回顾 2018 AI 格局以及关于 2019 AI 的五大预测

上周,AI Index 2018 年度报告正式发布,我在上周的「Weekly Spot」里提到了里面的几个关键要点,但这份报告还有诸多值得关注的内容。

通过梳理和回顾 2018 年 AI 领域的发展,我也想对 2019 年的人工智能做一些预测和展望。

先从权威性的角度去看,参与该报告的人包括斯坦福大学的 Yoav Shoham、MIT 的 Erik Brynijolfsson、OpenAI 的 Jack Clark 等人。其中,Yoav Shoham 是斯坦福的计算机科学荣誉退休教授,而 Erik Brynijolfsson 则是 MIT 斯隆管理学院教授,长期关注数字化发展对于社会、企业以及个人的影响,至于 Jack Clark,他是前 Bloomberg 的神经网络领域资深记者,如今担任 Elon Musk 的非盈利组织 OpenAI 的战略总监,同时他也在运营一份 Newsletter「Import AI」。

正是这样的人员组成,也让这份报告不仅局限在 AI 技术领域,更具备了经济层面和道德层面的思考。

AI Index 2018 报告试图通过多个指标来衡量 AI 的发展总体状况。这些指标包括三大部分:

  • 数据
  • 政策
  • 暂时无法衡量的领域;

我们一个个来展开。先来看「数据」。这里的「数据」包括了两个维度的数据:

  1. 全社会对 AI 的关注度数据;
  2. AI 各技术的突破数据;

这两组数据相互独立又相互关联,共同构成了观察 2018 AI 发展的重要视角。其中,全社会对于 AI 的关注点又体现在学术论文、AI 课程/培训、大型会议参与度、创业公司融资、大公司 AI 适应度、专利、人才需求、媒体关注等等

来看几个有趣的数字,下面两幅图里,科技行业公司与其他行业公司在财报会议上提及的技术名词有着明显的时间差。再比如,为何其他行业一直都在关注 AI 和 ML,而科技行业会在 2015 年集体爆发?

img img

再比如,下图是媒体文章里关于 AI 的情绪,2016 年 1 月是个重要的时间拐点,这个时间点恰恰是 DeepMind 首次披露 AlphaGo 可以战胜人类棋手的时刻。

img

与 AI 参与度并行发展的,则是 AI 各技术的发展数据,这份报告列举了图像识别、自然语言处理、机器人问答的发展状况,基本可以总结为一句话:机器识别率持续上升、训练时间持续下降。

以 ImageNet 的训练时间为例,仅仅用了一年半的时间,利用 ImageNet 训练神经网络的时间从将近一个小时下降到 4 分钟,这是一个巨大的提速

img

报告指出,这个数据至少有两大意义:其一,由于图像识别是典型的监督学习,这个领域的突破可以适用在多个监督学习领域;其二,这也充分体现了过去一年半,围绕 AI 的软硬件的进步。

在政策层面,该报告对比了美国、欧洲与中国近四年的重要 AI 政策,感兴趣的读者朋友可以直接去浏览,这个部分就不再赘述。

接下来,谈谈几个暂时还无法衡量的指标,这些领域目前还停留在相对早期的阶段,只是个别公司或研究者所关注的,但却极具潜力。

比如,IBM 研究者 Francesca Rossei 提出了一个关注领域「常识推理和自然语言理解」。这里探讨的是,如何将常识推理纳入到问答系统中。目前,机器问答系统依然无法具有真正的「对话」能力,而只有加入常识推理,才能最大限度提升机器对于对话的理解能力,这个领域的研究正在加速,该报告也强调,他们会持续关注这些新指标的发展。

再比如 ,来自 MIT 的 Rodney Brooks 将 AI 与机器人放在一起,就目前来看,机器人的出货量还没有一个统一的指标,更多的机器人出货量统计还是工业机器人,但工业机器人缺乏或根本就没有 AI 能力。随着越来越多的机器人拥有了 AI 能力,这些机器人的出货量统计也会成为一个观察 AI 发展的重要指标。

至此,关于 AI Index 2018 年度报告的主要内容已经梳理完毕,如果你关注 AI 发展,我强烈建议各位阅读这份报告,从而可以进一步感受全球 AI 的发展和进步。

在即将到来的 2019 年,我对全球 AI 领域也有几个预测。

首先值得关注的是 AI 硬件创业领域。过往几年 AI 创业热点聚集在算法和软件上,但围绕 AI 的硬件创业公司也非常值得关注,比如 AI 芯片,这个领域的会在 2019 年出现爆发增长,从而成为资本重点投资的新赛道。

其次,过去几年创业热门领域,如自动化、预测分析、机器视觉等,将步入大量「大鱼吃小鱼」的新阶段,一方面,创业公司之间的兼并会加速,另一方面则是巨头的收割已经开始。

第三,AI 领域的新工作需求开始凸显,比如「数据标注师」和「数据训练师」也成为热门职业,这也是当下 AI 需要大量标注数据的必然要求。

第四,GAN(Generative Adversarial Networks),即生成对抗网络将具有真正的应用落地。

GAN 是近四年来深度学习的一个热门领域,简而言之,就是通过两个神经网络的「对抗」,来提升最终的算法质量。微软一位工程师曾经这样解释:

……一个是摄影师(男生),一个是摄影师的女朋友(女生)。男生一直试图拍出像众多优秀摄影师一样的好照片,而女生一直以挑剔的眼光找出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。于是两者的交流过程类似于:男生拍一些照片 ->女生分辨男生拍的照片和自己喜欢的照片的区别->男生根据反馈改进自己的技术,拍新的照片->女生根据新的照片继续提出改进意见->……,这个过程直到均衡出现:即女生不能再分辨出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。

GAN 拥有巨大的应用场景,比如图片、机器翻译、对话、语音合成等领域。甚至也有人在研究,将 GAN 应用到自动驾驶中,这个领域的发展,非常值得期待。

第五,深度学习之外,我们还应该注意其他方法。如今,关于深度学习局限性的争议越来越多,事实也的确如此。数据量始终是深度学习无法克服的难题,更困难的事,深度学习无法产生人类习以为常的「常识」,这也将大大限制机器智能的发展。

长期以来,人工智能研究中都存在「联结主义」与「符号主义」两大门派的对抗,前者催生了目前的深度学习,而后者则强调常识推理,这恰恰也是当下人工智能所欠缺的。在这个领域,Google 正在发力,预计在 2019 年,符号逻辑的人工智能研究方法会初露锋芒。

伴随着技术突破的激动与技术伦理问题的担忧,AI 的 2018 即将画上一个句号,但这一切也仅仅只是一个开始(完)。