← Dailyio 历史存档 | 搜索

分类: Open Access

共有 354 篇文章

乔布斯去世后,苹果 AI 实践的三个阶段

这期的会员通讯,我将梳理过去 9 年苹果在人工智能领域的探索,包括以下几个方面:

  • 乔布斯为何要买下 Siri ?
  • Siri 是如何被苹果「毁掉」的?
  • 为什么 2016 年 WWDC 大会是苹果 AI 实践的转折点?
  • Core ML 带来那三重意义?
  • 2018 年苹果 AI 产品和团队调整的意义如何?
  • 2019 年苹果会如何将 iPhone 与 AI 结合起来?

上周,CNBC 率先报道了 AI 领域知名学者、GANs(对抗式生成网络)提出者 Ian Goodfellow 离开 Google 并加入苹果的消息。

CNBC 发现,Ian Goodfellow 在周四更新了自己的 LinkedIn 个人资料,显示这位 AI 领域炙手可热的研究者已经在今年 3 月加入苹果,并成为苹果「特殊项目小组」的机器学习负责人,该小组直接向苹果 CEO 库克汇报。

媒体对于 Ian Goodfellow 的关注较多,此君在 2013 年以实习生身份加入 Google,一年后,他完成了一篇题为《Generative Adversarial Nets》的论文,该论文提供了一个计算机如何生成图片的思路——将两个神经网络相互对抗

img

这个方法引发行业震动,包括 Facebook AI 首席科学家 Yann LeCun 以及参与 Google Brain 和百度大脑建设的吴恩达,都肯定了该方法对于机器学习发展的的重要意义。

值得一提的是,此前「AI 换脸」技术 DeepFake,其核心技术也是来自 Ian Goodfellow 的发明。

目前尚不清楚 Ian Goodfellow 会给苹果带来哪些变化,考虑其 3 月份刚刚入职,而且 Ian Goodfellow 主要关注在研究领域,因此可以断定,短期内,Ian Goodfellow 的研究不会直接落地到苹果的产品里。

但 AI 之于苹果,已然变得越来越重要了。

如果以当下的视角去看,苹果的 AI 探索始于收购 Siri。

作为乔布斯生前收购的最后一家公司,Siri 肩负着乔布斯对于未来交互模式的远见思考。

img

正如上图所示,「互联网女皇」 Mary Meeker 在人机交互历史回顾中中指出,几百万年前,人类从声音的交互开始,而文字的发明,则让交互从声音转入文本阶段,于是出现了各种与文本打交道的交互工具。即便如此,人类交流中的 90% 依然还是通过声音来完成,这种更自然也更原始的交互模式在过去半个世纪里并未得到突破性的进展。

自动语音识别(Automatic Speech Recognition ,简称ASR)是一种机器可识别人类说话单词的能力。很长一段时间里,ASR 在准确度上都无法与人类识别相媲美,而在 2010 年,ASR 在识别准确度上迎来一个拐点。

img

从上图的变化可以看出,2010—2015的五年时间,ASR 准确度得到大幅提升,这种变化超过了过去 30 年到 40 年的变化。事实上,我们现在已经接近一个时刻:机器对于语音的识别能力即将超过人类。

乔布斯看到了基于声音的交互才是人类天性的体现,而技术进步则帮助人类重新回到了最原始的声音交互时代。

Siri 在这种情况下成为苹果布局声音交互的重要产品,当时,乔布斯曾被问到收购 Siri 是否想与Google 竞争搜索业务,乔布斯给出的答案很明确:Siri 不是搜索产品,他们要做人工智能。(他原话是「 [Siri is] not a search company. They're an AI company. We have no plans to go into the search business. We don't care about it -- other people do it well.」)

只可惜,乔布斯并未看到搭载 Siri 的第一部 iPhone—— iPhone 4S 的发布仪式。彼时, Siri 给世界带来的惊喜随着一次次的恶作剧般的调侃趋于平淡,人们突然发现,Siri 几乎没有任何用处。她(他/它)常常答非所问,又经常无故跳出(不小心长按 home 健)…..

如乔布斯当年所言,语音交互正在成为人工智能最有可能爆发的领域。看看市面上的科技公司们,亚马逊、微软以及Google、Facebook,无一不在这个领域发力。

但苹果显然缺乏应对之策。自乔布斯逝世后,原来的 Siri 团队核心成员几乎都离开了苹果,包括Siri早期开发者的Dag Kittlaus 和Adam Cheyer 等人又创立了一家 Viv 的公司,其产品可以理解为新一代的 Siri。

2018 年 3月, 付费科技媒体 The Information 发表了一篇长文,详细展示了过去几年 Siri 是如何被苹果玩坏的。

文章提到了两个对立的原因,一方面是负责 Siri 的苹果老员工 Richard Williamson 被指责没有创新意识;另一方面 Richard Williamson 则不断强调 Siri 是一个不成熟的产品,自己作为维护者无法承担其如此大的责任,或者换句话说,这个锅应该由 Siri 创始团队来背。

文章同时还指出,苹果在 2013、2015 年做了两笔与 Siri 相关的收购,希望将两家创业公司 Topsy 的搜索能力以及 VocallQ 的自然语言理解能力整合到 Siri 里,但结果并不尽如人意。Information 获取的消息源称,Topsy 团队的成员表示不愿与 Siri 团队合作,原因是 Siri 的技术陈旧且无法满足当下的用户需求。

随后苹果内部做了一个「艰难」的决定:放弃对 Siri 的修修补补,重写 Siri。这也是一个艰巨的任务,此时的 Siri,已经成为数以亿计的苹果设备里的重要产品,颇具讽刺的是,或许是因为 Siri 太傻,或许 Siri 的打开率太低,重写 Siri 的过程并没有在如此庞大的用户群体掀起多大波澜。

撇开这些无法确定的事实来看,Siri 无法变得聪明也是苹果内部的必然结果。

首先,缺乏人才。有媒体盘点过 2015 年苹果的挖人名单:

  • 2015年年初,前苏黎世联邦理工学院自动系统实验室副主管Paul Furgale加入苹果;
  • 7月,前意大利经典汽车厂商菲亚特克莱斯勒集团质检总监Doug Betts加入苹果。
  • 8月,大众前工程师 Megan McClain、特拉斯前工程经理Hal Ockerse、前高级工程师Jamie Carlson加入苹果。
  • 9月,芯片制造商Nvidia公司人工智能专家、深度学习软件主管Jonathan Cohen 加入苹果;
  • 10月,电动摩托厂商Mission Motors申请破产,旗下一部分优秀工程师投奔到了苹果旗下;

上述几位除了Jonathan Cohen 之外都与苹果汽车项目相关(当然这个项目如今已经被大量裁员)。直到 2015 年 9 月,苹果才罕见发布招聘广告,大规模招募人工智能和机器学习方面的人才。

其次,苹果公司文化强调的保密原则,根本不适用于机器学习领域。这也可以解释,为何当 Google、Facebook 等公司的机器学习工程师发布论文,而难见苹果公司的原因。

这不禁让人发问:苹果在 AI 领域到底是毫无作为还是隐藏实力?

如果将时钟拨回到三年前的 WWDC ,苹果的 AI 探险之路也是从这个时候开始的。与历年 WWDC 类似,这一次同样发布了全新的 iOS——iOS 10。

iOS 10 里,苹果官方的照片应用可以自动识别人脸、物体,并能够相册里的人物自动分类,新加入的「回忆」,则可以通过对照片的位置信息、人脸照片信息、场景信息等聚集在一起,还支持插入音乐。

苹果将上述功能加入到一台运行 iOS 10 的iPhone中实属不易,要知道类似的功能在 Google 与微软那里,都是通过云端数据处理后的返回结果。

苹果之所以采用这种方法既有历史原因,也有诸多现实考量。

历史上看,乔布斯时代的苹果对人机交互有着异常的坚持,比如 iOS 曾经异常的简洁性——这也意味着毫无选择性的交互方式。乔布斯也曾表示,如果他来做一款DVD,那么唯一的按钮就是「烧录」,其他都可以舍弃。正是这样对于简洁性的追求,使得苹果的产品线长期以来在功能上的变化都极其克制。

乔帮主已仙逝多年,iOS 自 iOS 7 开始在交互上开始复杂,但将人工智能纳入到苹果产品的过程依然十分缓慢,摆在苹果面前的现实问题有两个,其一,苹果的云服务不如 Google 和微软,至今苹果 iCloud 的服务还有一部分跑在亚马逊 AWS 上,这也使得苹果无法像Google 微软那样通过云端强大的处理性能来处理照片分类、语音识别等。

其二,苹果长期以来的价值观就是对用户隐私的保护。以虚拟助理来说,Siri 早在 2011 年就已经发布,但比起Google Now、微软的 Cortana 来说,Siri 真的很不智能,原因就在于Siri对于用户数据的收集非常少,而另外两家公司的产品则有点「贪得无厌」,尤其是Google,默认的用户协议里,Google 可以收集用户几乎所有的数据为其所用。

但现实则是,时下流行的深度学习,迫切需要海量数据的「喂养」。这一年的 WWDC 上,苹果也重新定义了所谓「大数据」,正式启动苹果的「Differential Privacy」,这个概念由微软的C. Dwork 提出,其基本含义就是基于统计学原理,在一个群体层面收集数据,而非像FB、Google 那样收集个体的数据。

由于苹果的 iMessage、 FaceTime 早已部署了端到端的加密技术,因此能够让用户数据以加密的方式上传到苹果的服务器,然后苹果在对于这些群体层的数据进行分析和优化,从而改善用户的体验。

2016 年秋天,随着新 iPhone 设备的发布,iOS、macOS 等系统里也开始集成「Differential Privacy」。而到了这年冬天,在一个行业 AI 大会的非开放会场,新晋上任的苹果公司机器学习负责人 Russ Salakhutdinov 介绍了苹果在自动驾驶、神经网络、AI 芯片等领域的思考,这是几乎是苹果首次向外界(至少是学术界)透露自己的 AI 布局。

img

也是在 12 月,Russ Salakhutdinov 还代表苹果宣布了另一项重大决定:苹果将会允许自己的AI研发人员公布自己的论文研究成果!

紧接着,苹果在 2017 年 7 月正式发布了机器学习博客,利用这个平台发布一系列围绕 AI 的研究进展,其第一篇博客谈如何基于小规模数据训练,实现算法的提升,其中也提及使用 GANs 的思路。

2017 年可以说是苹果正式向外界展示 AI 能力的开始。这一年的 WWDC 大会上,苹果向世界展示了自己对于 AI 之于手机的新思考:帮助开发者将 AI 能力带入到智能手机里,或者说,帮助开发者将 AI 带入 iOS

这年的 WWDC 发布的 Core ML 野心巨大。坦率来说,Core ML 并不是第一个将机器学习引入智能手机的开发平台。2017 年的 5 月的 Google I/O 大会上,Google 发布了面向移动设备的机器学习框架 TensorFlow Lite,使得开发者可以方便地在移动端部署 AI 应用。

但苹果 CoreML 的出现,对于行业以及苹果而言有三重意义。

其一,相比于其他的机器学习框架,CoreML 坚持了苹果一贯以来的「设备智能」的原则,从训练到部署,都在设备端展开,这充分展现了苹果的「AI 价值观」,也因为苹果的巨大影响力,能够引发整个机器学习行业对于数据、隐私的关注。

img

其二,对于开发者而言,苹果的硬件生态依然拥有巨大的吸引力,基于 iOS 体系下的用户基础依然是一个金矿。上月的苹果软件服务发布会上,有一组数字足够震撼,如下图所示,iOS 上的游戏玩家已经突破 10 亿。

img

这样的硬件生态和用户基础,也将吸引更多开发者加入到苹果对于未来的应用体验定义之中,从 AR 到 AI,App Store 上的应用生态也在变得越来越多元化。

其三,对于苹果来说,正是 App Store 以及上面的开发者成就了苹果当下无可争议的「第一生态」,在当下 iPhone 销量下滑、iPad 无法接力的现实语境,Core ML 也成为提升 iOS 应用体验(讨好消费者)、推动 iOS 应用开发创新(讨好开发者)的重要产品。

img

2018 年的 WWDC 上,Core ML 进入 2.0 时代,提供了更小、更快也给更容易定制的机器学习模型,同时也大幅提升了训练、部署速度。可以预见,两个月之后的 WWDC 还会有更多的升级。

事实上,2018 年苹果在 AI 领域最大突破则是将 John Giannandrea 招致麾下。这位在 Google 工作 8 年,先后负责机器智能、搜索团队的大拿的到来,标志着苹果开始认真做起了 AI。

根据 TechCrunch 的报道,2018 年 7 月,苹果内部对于 AI 团队做了调整。将 Core ML 和 Siri 团队合并,由 John Giannandrea 统一领导,并直接向库克汇报。

这次人员调整也让这一年 WWDC 上推出的 Siri Shortcuts 具有更令人看好的前景。基于 Siri Shortcuts,第三方应用开发者可以将快速将自己应用的某些功能「输送」给 Siri,实现最快的语言唤醒。

而到了 2018 年 12 月,苹果官方宣布 John Giannandrea 晋升为管理团队成员,其职位名称为「机器学习和 AI 战略高级副总裁」。

在苹果官方新闻稿里,对 John Giannandrea 的工作范围做了这样的介绍:

Giannandrea oversees the strategy for AI and Machine Learning across all Apple products and services, as well as the development of Core ML and Siri technologies. His team's focus on advancing and tightly integrating machine learning into Apple products is delivering more personal, intelligent and natural interactions for customers while protecting user privacy. ......

Giannandrea’s team is also helping to enhance the developer experience with tools including Core ML and Create ML, making it easier and faster to integrate machine learning into apps.

通过上面的架构图以及对 John Giannandrea 职位范围的整理,可以清晰地看到苹果对于 AI 的重视程度,至此,AI 也成为苹果体系内与零售、服务、软件、设计并列的核心业务。而 John Giannandrea 在学术界以及工业届的号召力,也将进一步带动苹果 AI 领域的人才积累和研究突破,如今,随着 Ian Goodfellow 的到来,苹果在 AI 领域的话语权也越来越大。

那么问题来了,苹果会如何定义手机 AI?

过去五年,正是人工智能再一次成为主流技术潮流的五年,同时也是智能手机由盛而衰的五年,而智能手机于人工智能的结合,也是近两年来的新潮流。

正如我在今年初的一期会员通讯里所言,「包括苹果在内的智能手机行业,必须面对一个残酷的事实:尽管所有人都知道 AI 会给手机带来变革,但没有人知道到底从何处入手,以及如何去做。

如果结合苹果以及其他公司的实践,或许我可以提供几个值得关注的线索。

第一,操作系统。Google 与苹果,作为全球两大移动 OS 提供商,肩负着如何将 AI 植入 Android 和 iOS的重任,好在 5 月、6 月的两场开发者大会将让我们见识这两家公司的具体策略;

第二,语音。去年亮相的 Google Duplex 已经扩大到更多设备,这是语音技术的一次巨大突破,相比于更漂亮的实验室数据,基于实际应用场景的 Duplex 或许并不完美,但却提供了语音技术应用的新场景。

与此同时,苹果的 Siri Shortcuts 的确在一定程度上提高了 iOS 的自动化能力,但还没有完全激发出开发者、消费者的使用热情,随着苹果在越来越多设备里加入可随时唤醒的 Siri,Siri Shortcuts 可以提供更多应用空间。

第三,图像/摄像头。2018 年,Google 和华为分别从软件(计算机视觉)、硬件(面积更大的传感器)定义了两个不同的手机拍照路线(详见这期会员通讯),尽管苹果也在 2018 年用智能 HDR 予以还击,但在夜景上还是完败。

这也让外界好奇 2019 年 iPhone 的拍照能力是否可以实现新的突破,不管是硬件还是软件,苹果的确需要拿出一个好相机,挽回正在丢失的用户。(完)

张建锋万字访谈透露出阿里云发展的三个线索

钛媒体昨天发布了一篇阿里云智能总裁张建锋的专访(访谈全文在这里),这也是张出任阿里云智能总裁后的第一次专访。作为国内云计算领域无可争议的老大,阿里云的一举一动都令行业关注,张建锋的此次访谈也透露出诸多有用的消息。

值得一提的是,这个采访发生在 2019 年 3 月 21 日云栖大会之后,此次大会上,张建锋首次以阿里云智能总裁的身份站在舞台上,阐述阿里云未来十年的发展战略(演讲全文在这里),而他先谈了云计算的未来发展,主要包括三个方面。

其一,「IT 基础设施的云化」。这个论点更像是对传统 IT 基础设施服务商宣战,过往的 IT 硬件、软件采购正在成为历史,云化的 IT 基础设施将推动整个市场进入一个全新的竞争阶段。

其二,「核心技术互联网化」。如果说上一个论点是宣布旧时代的终结,那么这个论点强调了则是新时代的主要特征:互联网化。其出发点在于,阿里云拥有阿里巴巴体系里的核心技术,而阿里巴巴体系又是当下全球业务最复杂的一个巨头,也因此,张建锋可以理直气壮地说:

我们运营了全球最大的零售平台,也运营着全球最大的支付平台,我们通过这么多年的努力,把自己一整套的系统用互联网技术来构建的过程中,积累了丰富的经验和最佳实践,这都是经过双11、双12反复考验的一套系统,证明这套技术体系是可行的,也是一个未来。

其三,「定义云和智能的新关系」。这一个观点的核心是数据,没有数据的支持,所谓智能也无从谈起,张建锋这样讨论数据、云和智能:

那我们怎么来理解这个数据?很多人理解数据就是能源。数据其实是一个企业的血液,不仅是个简单的能源问题,只有把这个数据完全利用好了,才能做一个智能化的判断跟决策,才能把原来纯粹基于流程的公司改造成基于智能的公司。

上述三点也够成了张建锋对于阿里云未来的四个方向,如下图所示,包括技术、产品、商业和生态。

img

了解了这个背景,我们再来看钛媒体的访谈。

钛媒体给这篇访谈设置的题目是「最详解密阿里云顶层设计和底层逻辑」,其中最主要的是三个部分:云计算的竞争焦点;阿里云智能的架构设计(包括组织架构、产品策略)以及阿里云的生态策略。

首先,围绕云计算的竞争焦点,张建锋透露了四点思考:

  • 混合云;
  • 云安全;
  • 云数据库;
  • 容器;

这其中,云数据库也是包括亚马逊在内的云计算巨头努力的方向,摆脱 Oracle 的数据库,已经成为 AWS 的目标之一。Aurora 就是 AWS 为云计算而专门定制的一款关系型数据库。而根据 AWS 总裁 Andy Jassy 的数字,2018 年 11 月开始,亚马逊的消费者业务已经完全脱离了 Oracle 数据库。

张建锋也表达了类似的意思:

从产品角度来看,数据库发展非常快,大家都在想替代Oracle数据库,但是在关键核心应用上要1比1替代还是有挑战,所以现在完全基于云原生的数据库发展非常快,像AWS完全把数据库作为一个核心能力来做,目前国内也是发展非常快......

阿里云也在自研数据库产品 POLARDB,公开资料显示,这款产品在 2017 年开始内测,100TB的数据容量上提供了10倍于传统商业数据库的性价比,如今性能达到 AWS Aurora的2倍。

其次,关于阿里云智能的架构设计,张建锋谈了很多内容,但在我看来是在向外界传达一个理念:组织架构与产品策略将「重塑」阿里云。

比如,全新的组织架构调整:

现在所有CTO线的技术部门跟云的技术部门都整合。例如原来两个数据库部门,现在合并成一个数据库部门。原来两个网络部门,现在合并成一个网络部门。

与之相关的便是人员规模:

我觉得一个有1万人的平台公司是一个非常大的平台型公司了,像淘宝做的这么大,也就几千人的规模。如果一个公司的人数与业务线性相关,可能是做了太多自己不擅长的东西。

再比如 KPI:

我觉得第一个是规模,因为这个意味着你产业的竞争,这个肯定是非常核心。第二个我们还是非常关注公共云的份额,因为最终云的基础还是公共云的发展,当然也有混合云的发展这个也很关键。第三个提倡生态,到底在多少生态上,阿里巴巴有多高的竞争力?现在我们有几千家主要的合作伙伴,我们希望把主要业务放在阿里云上的,要占一个更大的比重。

而关于架构调整最重要的两个方面则是钉钉与中台。

对于钉钉,面对「是不是钉钉对阿里云的价值,类似于office365对于微软 Azure?」张建锋给出了一个不算否定的回答,「有一点类似,但是还是没有那么SaaS化。钉钉主要是一个协同沟通的平台。我们希望未来的企业既是数据的,又是智能的,还是在线协同的,这是我们对我们客户的一个主要未来的描述」。

关于中台架构,也是阿里巴巴内部长期实践的方法论——「大中台、小前台」。所谓大中台,是将全公司的产品、数据能力统一整合到一个平台上,形成一个规模庞大的技术中台。

「小前台」则是针对不同的业务创新需求,组建一支懂业务、会看数据的前方作战部队,利用大中台所积累产品和数据能力,可以大大减少前方作战部队在人力、时间的投入,阿里内部常常这样形容「小前台」的规模:「小到一顿宵夜只点3斤小龙虾就可够」。

「中台」瞄准的是企业数据、业务、流程之间的难题,张建锋对于中台的意义,给出了自己的思考:

中台不仅是个组织,中台是个理念,所以说这个中台的技术,如果放在高德是最适合的,就放在高德,但是对高德来说,这个技术一定要有一个定位,要为全体人负责,不仅是为自己服务。所以有些是中台的技术,但不一定在中台,例如智能机器人技术,那就是在客服部门,因为他最贴近现场。但是一些中心业务技术,要不在达摩院,要不在中台部门统一建设。

第三,围绕生态,张建锋正式宣布了阿里云从单一平台转型「被集成平台」的战略。

此举意义重大。一方面,对于阿里云内部而言,新的战略势必影响其产品和组织管理,过往的产品研发和交付都是阿里云内部完成,而接下来则是将产品封装,由合作伙伴完成交付。

另一方面,阿里云的未来生态打造,张建锋这样说:

生态一定还是一个分工协同。传统的生态不像想象中那么整合,他们也是分工协作的。比如说做一个传统企业的ERP系统,他们也是分工协作的,比如德勤做咨询,SAP做软件,埃森哲去实施。我们不去破坏大家的分工合作,只是我们的产品技术变成这个体系的一部分,是这么一个逻辑。

更进一步:

.......我们更希望合作伙伴理解这个行业,跟我们掌握的技术有一个共创。比如我们有一个很好的语音技术,我们不知道什么行业可以用。合作伙伴掌握这个技术,也懂得客户应该怎么用,比如人可以用在考勤上,或者用在什么门禁上。

相比于张建锋在云栖的演讲,这篇访谈透露了更多有用的线索,最后做一个小结。

战略层面,阿里云正在从一个单一平台转型到一个可以被集成的平台,这也将是观察阿里云未来发展的重要切入点,由这个切入点开始,才能理解其产品策略、人员架构甚至裁员优化。

进一步来细分,达摩院、钉钉以及阿里体系里其他与智能、数据相关的技术团队,也将进一步融入到阿里云智能的架构中;产品上,数据的重要性不言而喻,数据类的产品也将成为接下来阿里云的重要产品,而中台架构的实践,最终也将和上述战略、架构以及产品形成良性循环或恶性。(完)

持续增长的云计算巨头权力以及云服务宕机的新世界

上周六午夜到周日凌晨,阿里云出现了一次大规模故障。《新京报》的报道

位于华北地区的多家互联网公司的IT运维人员发现多个App和网站开始陷入卡顿。随后一批程序员赶往公司加班。58高级架构师沈剑在针对此次宕机的回忆文章中称,这场事故持续了三个小时左右,事后观察了两个小时。

随后阿里云在官方公告里对此事做了说明。

img

由于发生在周末午夜,此事引发社交媒体上广泛讨论,阿里云坐拥中国公有云市场第一的地位,也必须承担相应的技术保障责任。虽然有很多调侃、嘲讽,但我相信绝大多数的讨论和分析还是基于事实,毕竟这次宕机毁掉了很多程序员的周末。

不过一个不可回避的事实是,云计算宕机的时代才刚刚开始。

某种意义上说,公有云服务是一种「历史倒退」,这是因为互联网、个人电脑的出现和普及,是对过往大型机时代的颠覆,互联网的分布式架构与个人电脑的边缘计算性质,一度让人认为这是一个全新时代的开始,但公有云服务的发展,则将计算能力重新集中到某一个或某几个大公司之中,而掌握这些计算能力的大公司,也在一定程度上掌握了很多公司的生与死。

而透过全球云管理服务厂商 RightScale 的一份行业报告(你可以在这里下载这份报告),这些云计算巨头们正在获得越来越大的权力。

需要说明一点,这份分析报告主要面向的还是欧美市场,但欧美云计算市场在某种意义上也可以作为中国云计算发展的未来样子。

当下 AWS 所面临 Azure 与 IBM 的竞争,与中国未来的阿里云、华为、百度/腾讯等格局有一定相似之处,更重要的一点则是,阿里云、华为云在海外也会直接与 AWS、Azure 直接碰面,因此,这份报告依然有不少的参考意义。

要点1:企业越来越拥抱云业务

受访者中,94% 的企业至少使用一个公有云或私有云服务。这些采用云服务的企业里,91% 的企业采用公有云,72% 的企业使用的是私有 云。

img

同时报告还发现,有 31% 的企业表示将公有云列为企业云服务的首要工作,其次则是混合云业务,这个比例为 28%。至于本地自建私有云和托管私有云,其优先级是最低的。

img

这也意味着,企业市场对于公有云的接受程度继续升温,整个市场还有巨大的增长空间,中美的公有云巨头们还将持续受益。下图的这个数据,展现了企业在公有云上的年度消费。

img

其中有几个数字值得关注:

  • 23% 的企业在公有云的上消费超过 240 万美元;
  • 33% 的企业的消费超过 120 万美元;
  • 11% 中小企业的消费超过 120 万美元;

这些消费与下图所展现的业务云化相呼应,如下图所示,79% 的企业业务都运行到了云端,其中 38% 是公有云,41% 是私有云。

img

值得一提的是,中小企业对于公有云更积极,中小企业 78% 的业务跑在云端,其中 43% 的业务是放在公有云上。

要点2:多云已成趋势

多云战略的趋势越发明显,这一年的报告里,有 84% 的企业表示已开始落实多云战略,这个数字在一年前为 81%。

于此同时,制定混合云战略的企业比例,也从上一年的 51% 上升到今年的 58%。

对于中小企业而言,受限于成本考虑,他们依然优先选择公有云,报告显示,有 44% 的中小企业希望使用一个或多个公有云产品。

img

另外一组数据显示,受访企业平均使用 4.9 个云服务(包括公有云和私有云)。

img

越来越多的企业开始重视云产品,并组建专门的团队来制定战略并落地实践。

img

上图里有两个关注数据:

  • 51% 的企业拥有云计算团队,21% 的企业计划组建;
  • 在中小企业里,31% 的企业拥有专属团队。

要点3:云计算领域新技术趋势

尽管 AI 一直被认为是有望推动云计算的重要技术,但站在企业的角度去看,如果 AI 无法与自身现有的云业务融合,企业客户很难为所谓的「未来技术」买单。

下图里,机器学习的普及率不到 30%,远远低于「传统云业务」(如数据库、数据仓库等),而 Serverless 近几年俨然成为增长速度最快的「新技术」。

img

于此同时,容器技术的增长显而易见。其中,Docker 和 Kubernetes 成为企业使用最多的容器工具。

img

目前,Docker 的使用率从 2019 年的 49% 上升到 57%;而 Kubernets 的从 27% 增长到 48%,增长势头凶猛。

结语

这份报告还展示了当下欧美企业对于不同公有云云服务商的「认可」程度,如下图所示,AWS、Azure 依然占据绝对优势,但必须看到,作为唯一一个上榜的阿里云,企业对阿里云「计划部署」的比例并不低,甚至高于 AWS、IBM 和 Oracle,这也充分说明了阿里云作为全球云计算玩家的潜力。

img

上述这些数字充分展现了当下云计算市场的规模和潜力,在这个巨大市场里,无论是 AWS 还是阿里云,都无法完全占领美中市场,这也是一个巨头扎堆的战场。正如上文所言,这些巨头们也在一定程度上掌握了很多公司的生与死,一个最值得关注的问题便是公有云服务的中立性越发突出

在美国,沃尔玛规定其供应商的云服务不能选择 AWS,这是沃尔玛对其直接竞争对手亚马逊在云服务是否中立的最大质疑;而在中国,你不能想象腾讯系的产品会选择阿里云,也无法想象爱奇艺的云服务会选择腾讯视频的小伙伴腾讯云。不久前,百度智能云高调宣布携程成为其客户,从某种意义上说也是一种「战队」的信号。

而随着云计算(特别是公有云)越发普及,云服务商任何一个小故障都会引发一连串的连锁反应,2017 年 2 月,亚马逊 AWS 的一次故障,导致 Adobe、AIrbnb、Github、Netflix 等公司的业务受到影响;此次关于阿里云故障的新闻里,几乎都在反复提及一个数字:「目前中国有40%的网站都在阿里云上运营」,这个数字反映的,也是阿里云对于中国互联网的巨大统治力。

无论生活在哪里,无论从事哪种工作,无论接受与否,都欢迎来到一个云(宕机)计算的新世界。

从 Google Glass 到 HoloLens、为什么 Hololens 2 是微软云服务的延伸以及 AR 市场预测

本周的 MWC 上,微软发布了 HoloLens 2,下面这个官方视频可以提前感受一下(如果无法正常观看,可点击这里跳转到 Youtube 上观看)。

国内科技媒体爱范儿在现场的报道:

......全新的 HoloLens 拥有全新的外观。经过改进的锁扣装置不仅能使佩戴变得更加简单,也大幅度地加强了舒适度。根据微软的介绍,为了能够覆盖更多不同头颅形状的人群,微软通过扫面上千人的头部来帮助进行 HoloLens 2 的佩戴优化。结合轻质碳纤维材料以及全面的轻量化设计,所得出的结果就是三倍优于初代的佩戴舒适感。

......

HoloLens 2 首先被提到的升级点是沉浸感,除了视野范围翻倍以外,显示也更加细腻,每一度视角像素密度达到 47 像素。这是什么概念?Alex Kipman 在介绍时举了个例子,说这种视觉上的提升相当于视角从 720P 的屏幕转到 2K 屏幕。另外,微软还在鼻梁架中新加了一对摄像头,来帮助测算佩戴者的瞳距,以获取更优秀的视觉体验。

佩戴的样子大概是这样的,如下图所示:

img

爱范儿也注意到,微软很强调 HoloLens 的交互模式:「支持眼动追踪以及支持对全息投影进行点按、拖拽、缩放等交互操作......也正式支持语音操控,用户可以通过语音指令进行任务切换、系统操作甚至是对全息投影的操控。」

相比于第一代的产品,HoloLens 2 从设计到交互都有了大幅提升,尤其是微软将发布会放在 5G 热度奇高的 MWC 上,也足以看出微软对于这一代产品在 5G 时代正式落地的决心。

我曾不止一次地在会员通讯里提及,AR 将成为后移动互联网时代里的一个重要技术趋势(感兴趣的读者,可以查看《手机摄像头如何开启增强现实的伟大时代?》、《为什么 5G、折叠屏拯救不了智能手机市场?》),如今微软将 HoloLens 放在 5G 即将到来的背景下,更让人期待全新的硬件与交互,会定义一个怎样的计算时代。

但这个过程注定漫长。

从 Google Glass 到 HoloLens

广义上看,任何在现实世界进行的数字内容叠加都可以被看作是一种「增强现实」的产品。如果以这个标准去看,美国的 Snap、国内的美图秀秀以及无数数不胜数的滤镜类应用都具备了这一特点。我曾在一篇会员通讯里谈到这个趋势:

如今,手机摄像头已经具备了实时的增强现实能力,你打开摄像头,任意添加各种元素(滤镜),无论最后的产品是静态影像还是动态影像,都是一层对现实的增强、创造甚至伪装。科技公司们这个过程中,所扮演的角色并不都是「让你的生活更美好」这么简单,更像是让「你的生活看起来(感觉起来)更美好」。

但上述几个所谓的「增强现实」应用场景缺乏两点:

  • 硬件形态:几乎都是手机;
  • 交互模式:延续了智能手机的触控模式;

值得一提的是,Snap 曾经推出过一款眼镜 Snaptacle(如下图所示),这款产品的落脚点,是希望创造一种全新的「输入模式」,活跃 Snap 社区。

img

不过遗憾的是,自 2017 年开始,Snap 的这类尝试几乎宣告失败,不过这个失败与 AR 无关,而是其社交产品策略的问题。

另一个敢于在消费领域推出 AR 硬件的则是 Google。

2012 年的 Google I/O 上,Google Glass 的亮相绝对是一个惊喜。如下面视频所展示的(如果无法观看视频,请点击这里跳转到 Youtube),这款产品为「现实」叠加了无数「虚拟」的存在,以一种酷炫的方式一度让人以为触摸到了未来,不过仅仅三年,这个美梦就破灭了。

关于 Google Glass 的失败分析有很多,但我个人觉得以下几点最具代表性:

  • 行业趋势判断失误:2012 年的消费电子领域,智能手机还处在巨大的红利期,即便是强大 Google,也无法以一己之力改变行业发展潮流,这也意味着,Google Glass 所代表的 AR 只是 Google 的自嗨;
  • PR 策略失误:就像上面这个视频所展示的,Google Glass 异常高调的 PR 策略放大了公众的预期,而铺天盖地的科技媒体报道,进一步吸引了公众的关注,也为后面的各种差评埋下了伏笔;
  • Google 公司文化与硬件开发的冲突:Google 可以将 Gmail Beta 版本停留数年以修复各种 Bug,但这种软件、互联网开发的思路并不适用一款硬件,而当 Google Glass 以「Beta 版本」亮相,几乎也是以「Bata 版本」发售;

2015 年之后,Google Glass 也正式退出了消费市场,舞台的中央留给了微软,这年 1 月,微软在 Windows 10 预览版发布会上,正式发布了微软的 AR 设备——HoloLens。

从产品层面来说,HoloLens 与 Google Glass 并不是一类产品,一个最简单的区别,Google Glass 所显示的信息集中在眼镜的棱角上,相比之下,Hololens 则可以实现数字信息与现实世界的融合,尽管不完美,但已经具备了该有的样子。

另外,HoloLens 产品分发也一定程度上吸取了 Google Glass 的教训。

比如同时针对消费市场和企业市场,而消费市场高达 3000+ 美元的售价也高于 Google Glass 当初 1500 美元的价格;再比如,HoloLens 的时间周期也非常长,2015 年1 月发布,2016 年 3 月推出开发套件(非常少的开发者可以拿到),2016 年 8 月开始北美市场开售,2017 年进入中国市场,这样步步为营的策略,不仅能够不断打磨产品,还可以在生态建设上取得突破。

我们可以说 Google Glass 是一个失败的产品,但 Hololens 1 则是一个几乎成功的产品,它成功地为微软开辟了全新的计算平台,也随着 Hololens 2 的发布,微软的 AR 产品定位更加清晰:云。

微软 AR 策略的本质是云服务

来看一下 HoloLens 的定价策略:

  • 消费市场:Hololens 2 单机定价 3500 美元;
  • 企业市场:软件 Dynamics 365 Guides+硬件为订阅制,一年订阅的话,每位用户美元225 美元,三年订阅的则是每位用户美元125 美元;

微软在现场还展示了 Hololens 的「可定制性」,比如外观设计,微软为 Trimble 公司定制的 HoloLens 2 安全帽,外观上符合该公司的实际生产需要,还配备了为其所开发的行业应用。

事实上,如果环顾整个行业,AR/VR 的确在企业级市场有了丰富的应用案例,来看几个例子:

  • 数字试衣间:比如一家来自多伦多的 NextTech 公司,就利用 AR 帮助中小电商公司的用户直接在手机或电脑上看到自己的穿戴效果,虽然其效果不算最好,但对于中小电商而言,已经是一个巨大的技术突破;
  • 沃尔玛采购 17000 个 Oculus Go 的头盔:根据沃尔玛的说法,这些设备将用于员工培训,帮助员工理解新技术、更好地协作以及培养客户服务意识;
  • AR 会议室:Spatial 公司向企业提供了一套基于 AR 的会议解决方案,你可以在这里查看这个产品演示。

上述几个例子展现企业级市场 AR/VR 的丰富应用场景,也是微软为 HoloLens 设定的市场范围,微软 CEO 纳德拉更是援引多个行业(包括医疗、制造等)利用 Hololens 的应用案例,直接表示:「这正是我们开发技术的初衷.....」

img

与此同时,微软也为 HoloLens 打造了一系列周边。

  • 2018 年发布的 Dynamics 365 Remote Assist,可以让戴着 HoloLens 的现场工作人员与专家互动交流;
  • Dynamics 365 Layout,这是去年推出的3D布局应用程序
  • Dynamics 365 Guides 搭配Hololens 2 一起发布,这款应用能够赋能员工通过实践进行学习。通过逐步指示,Guides可指导员工学习他们在实际工作场景中需要了解和使用的相关工具和部件,强化了学习过程。
  • 上周,微软官方还宣布将推出适用于Android设备和 iOS 的 Dynamics 365 Remote Assist 应用程序;

这一系列以 Dynamics 365 为命名的产品组合,全部基于微软的云平台 Azure,从这个角度来说,企业如果想要用好 Hololens,也就必须采用 Dynamics 365,也必须使用 Azure 云平台。微软也利用这样一个全新的计算平台,进一步提升 Azure 云服务的市场竞争力。

AR 市场迷思

我曾在 2017 年苹果发布一款视频剪辑应用 Clips 时认为,这是苹果 AR 战略的重要布局,我在当时的会员计划里写道:

某种意义上说,Clips 肩负着 iOS 设备走向增强现实( AR )的艰巨任务。Bloomberg 梳理了苹果 AR 团队的重要成员......至于这个团队的最终目的,当然是押注 AR 的交互方式,研发新一代 AR 设备,比如 AR 眼镜, 但 Bloomberg 的线人也表示,这个产品上市还有很长的距离。这也意味着,现阶段的苹果的 AR 战略,基本还是围绕 iPhone、iPad 摄像头周边的计划,也是此次推出 Clips 的真正意义。

Clips 更像是一个官方试探,随后的 WWDC 上,苹果也首次发布了 ARkit,这是一个面向开发者的套件,开发者可以利用 ARKit 开发面向 iOS 的 AR 应用。

2018 年更新到 ARKit2,苹果与皮克斯密切合作,「打造了一种名为 usdz 的开放文件格式。这种经过优化的文件格式,在保留原有的强大图形和动画功能基础上,还能更好地支持使用信息、Safari 游览器、邮件、文件等 app 共享内容。usdz 文件格式支持Quick Look for AR 功能,可以让用户将 3D 物品搬到现实空间中查看。 」

这一系列布局也让 iOS 的应用生态有了一个新品类,AR 应用。

img

类似地,Google 基于 ARCore,也打造了一个 Android 平台的 AR 应用生态。

微软、苹果(Google 可以归于苹果一类),这三家公司在 AR 的策略选择,也从某种程度上暗示了当下整个市场的迷思。

首先,对于苹果而言,iPhone 依然是摇钱树,而 iOS 生态更是,这也意味着,苹果对于新技术的探索以及落地,始终都离不开 iPhone 或者 iOS,ARKit 就是苹果进一步增强 iOS 生态的重要布局,我们格外期待 iOS 13 会给 ARkit 带来怎样的升级。

其次,不管微软曝光了多少黑科技,它依然是一家 2B 的公司(关于微软的企业业务,我曾在今年的一篇会员通讯里做个详细分析),尤其是当云成为微软目前最主要的业务时,一切技术需求都会归结于云端能力的输出,Xbox 不例外,Office 不例外,HoloLens 也不例外,在微软云——边的策略里,HoloLens 扮演着重要的枢纽角色,同时也将是微软「入侵」垂直行业的利器。

第三,除了这两大类的巨头,这个领域还有巨大的机会和需求,尤其是各类行业的特殊应用,因此会催生一大批创业公司,而即将到来的 5G 则将加速整个行业的成熟。(完)

【开放文章】490 亿美元的市场诱惑,科技巨头如何押注语音领域(美国篇)?

如果以 2014 年 11 月亚马逊发布第一款 Echo 算起,以语音为主要甚至唯一交互入口的「新物种」已经有了四年多的历史。

四年时间成就了亚马逊无处不在的 Alexa,推动了 Google、微软在语音、 NLP 技术领域的研发突破,也让苹果体会到了「(语音)起了大早赶了晚集」的滋味。

根据此前的 CBinsights 的统计,全球语音领域的市场规模高达 490 亿美元。

下文将以美国四大巨头公司为例,详细介绍其产品布局以及技术研发特点。

Google

Google 正致力于提高搜索和人工智能对话的准确性,其中一个方面是人工智能的语言能力。截止 2018 年末,亚马逊的 Alexa 和 Google Assistant 支持的语言种类都不及苹果 Home Pod。

2019 年,Google 将赋予其语音助理 30 种语言能力,包括同时理解两种以上语言。

Google (包括苹果)有大量的智能手机用户群体,这一优势使其很好地掌握用户使用习惯,更容易完成产品整合,实现家庭、办公室和汽车等场景的无缝衔接。

通过对于大量用户数据的分析,Google 已经意识到用户使用智能语音不仅是完成打电话、导航等简单的任务,需求正在不断扩大。Google 运用人工智能理解用户使用文字搜索到语音搜索的转变,尝试准确判断意图。

Google的竞争力主要在搜索和任务要求的准确性方面(尤其与亚马逊相比)。

source:KPCB
source:KPCB

Google 准备用 Duplex 技术获得更多市场。

此项技术已被用于 Google Assistant,可以让人工智能代表用户打电话完成预订和邀约的任务。

Duplex 跟人的声音极为相似,甚至包括「恩……啊……」之类的语气词。这的确标志着语音智能助理在权限和准确性方面的突破,但也带来了一些伦理问题。

比如欺骗,当人类在跟各方面听起来酷似人的机器人说话时,人类应不应该知道真相呢?

初始版本中,机器人没有加入任何区分。但在收到一些负面反馈后,Google 发布了以下申明

我们在公开透明的情况下设计了这项技术,也将确保它被合理的认知和识别。我们在 I/O 大会上展示的只是技术样品,我们将会听取更多反馈以完成产品开发。

Google 正通过实现更自然和零错误的智能语音工具和搜索来获得优势。Google 收购 api.ai 就是一个很好的例子,以此将自然语言处理应用到真实世界的智能语音对话,并扩展到搜索功能。

Google 创立语音助理投资基金

最近 Google 创立了一个用于智能语音项目投资的风险基金。Google Assistant 基金目前投资了大约 10个项目,已经与酒店和医疗领域建立了合作。

从这些项目可以很直观地看出 Google 把重心放在了自然语言处理上,以下两项投资尤为明显。

医疗行业下一个前沿技术——患者语音助理

Google Assistant 基金和亚马逊 Alexa 基金共同投资了 Aiva Health 项目,这是一个应用在医院和疗养院的患者语音操作系统,患者用语音完成操作和任务,医生可通过手机 app 与患者沟通和跟进。

Google Assistant 还接入了 Novant 医疗系统,患者可通过语音获得诊室排队信息、预约安排和指导等,相关信息都会发送到用户的手机上。

Google 通过这些投资进入医疗领域,在 Google Home 和 Google Assistant 上为患者开启一条通道。

进入酒店的新方式

酒店行业是另一个 Google 语音关注的领域。 Google 投资的 GoMoment,是一个人工智能语音机器人,可以帮助酒店迎接客人、回答问题;还能评估用户的满意度,减少酒店服务的通话时间。

source: Google

Google 还在语音助手中加入了「翻译模式」,已经在几家连锁酒店试点,能实现对话的实时翻译。对话可以通过 Google Home 语音输入或者 Google Assistant app 完成翻译,也可显示在界面上。 

这是 Google 占领酒店行业市场份额的另一种方式。每个房间里都有一个接入酒店集团系统的 Google Home,客人可以通过语音轻松完成活动门票预订、客房服务预约、获取天气信息、查看行程信息等操作。

Amazon

虽然 Google 一直在发力,但亚马逊的 Alexa 仍然毫无争议地占据着智能语音市场的主导地位。 

显然亚马逊一直在通过电商渠道改善语音服务,这也是其在美国科技五巨头(FAMGA: Facebook, Amazon, Microsoft, Google, Apple)中最突出的优势:每个 Alexa 都能连接到世界最大的网上商城。

Source: Forbes

亚马逊通过「亚马逊精选( Amazon Choice)」连接语音与电商平台,选出了一些「排名较高、价格更优、立即配送」的产品加上此标签。 

根据 OC&C 战略咨询的调查,亚马逊精选和语音搜索结合的模式中有两个非常有趣的数据:亚马逊精选的产品往往比其他产品的销量高出 3 倍;更重要的是,85% 的消费者最终选择购买亚马逊推荐的产品。

亚马逊精选所带来的潜在商机代表了电商平台发展的新转折点。

但研究表明,目前只有30%的用户使用智能语音进行购物。

source:recode
source:recode

2018年只有2%的 Echo 用户尝试通过 Alexa 购物,这对于亚马逊来说,远没有达到原本的预期。

然而,这并不代表没有潜力。

亚马逊尝试通过内置零售、电商渠道占领语音购买市场,想把更多内置 Alexa 的智能产品放进用户家里;同时联合微软,借助其可以匹敌苹果和 Google 的操作系统。此外,亚马逊跟快销品公司合作推广 Alexa。

此后,亚马逊又开始向新的领域扩张。在家庭以外的场景,跟 Google 和苹果相比,亚马逊一直处于弱势。它目前正在计划新的语音设备,更好地完成数据收集,以扭转劣势。

Alexa,我们一起出发吧

Voicebot.ai

亚马逊并不想把 Alexa 局限在家中,但是在户外环境,Alexa 一直处于弱势。Google 和苹果都在手机中内置了智能语音,走到哪都能用,而 Alexa 一直是个家庭产品。 但是,这一情形将被打破。 最近亚马逊发布了 Echo Auto,并称预售已超过100万台,这个公司正在给消费者提供更多使用语音助手的方式。 

在 Echo Auto 中,用户可以使用 Alexa 的所有功能,不用任何手部操作就可以轻松打电话、导航、听播客、播放音乐和控制智能家居设备。

研究数据显示,在车里使用语音助手已经非常普遍,所以 Echo Auto 符合人们的需求。

目前亚马逊正在与各大汽车制造商接洽,包括宝马、丰田、福特等,有望将 Alexa 整合到他们的智能车载系统中。而英菲尼迪、捷豹、梅赛德斯奔驰等厂商也计划在新推出的车型中加入 Alexa。

智能家电来了

消费者想跟他们的家用电器说话吗?亚马逊认为是这样的。

亚马逊开发了 Amazon Connect Kit(ACK),让其他开发者可以将 Alexa 接入新的家用设备和电器。

在语音助手爆发的 2018 年,Alexa 已成为亚马逊的核心增长点,根据其智能家电的装载量可以看出 Alexa 巨大的增长潜力。

在 2018 年第二季度的收益报告中,贝佐斯强调了智能语音对亚马逊未来发展的重要性:

全球有超过150个国家的数以万计的开发者在他们的产品中加入了 Alexa 智能语音助手,去年 Alexa 的装载量翻了3倍,我们的合作伙伴正在不断扩大和增强 Alexa 的使用体验。

亚马逊称,目前已有 4500 个独立品牌的 28000 种智能家庭设备使用了 Alexa。

US smart appliances market revenue
US smart appliances market revenue

小家电的营收通常在市场份额扩大的情况下才会增加。LG、三星、惠而浦、肯摩尔、博世、通用等智能家电为 Alexa 和 Google Home 提供了巨大的市场占比。

一款智能微波炉目前已经在 AmazonBasics 上架,与摩恩和 iRobot 的合作也让用户可用语音打开淋浴和激活扫地机器人。

亚马逊正用 ACK 全面打造 Alexa 控制的智能家居系统。

苹果

2011年,苹果发布 Siri,打开了智能语音助手的新世界;但直到发布智能音箱 HomePod,苹果才算进入到智能音箱阵营。在与早已占有一席之地的 Google 和亚马逊竞争时,略显艰难。

行业分析师明确指出了 Homepod 的缺陷:不像 Alexa 那样「多才多艺」,又不及 Google 的语音助手智能。

source: Statisa
source: Statisa

对于苹果的死忠粉来说,这些都不是问题。但如果你没有苹果「全家桶」,也许会觉得 HomePod 没有那么好用。

HomePod 最大的优点也许是安全性和私密性。苹果在2018年收购了 Silk Labs,这家公司开发了无需接入云处理的人工智能操作系统。

无需接入线上的语音助手

安全性和私密性对于语音助手来说越来越重要了。苹果最近申请了两项专利,都是针对语音安全性。

第一项是「线下个人助手」,不接入网络时也可以唤醒 Siri。使用 HomePod 时,语音对话不会被记录,因为大多数指令都不用连接云端。

这与 Google 和亚马逊的做法很不同,用户不用再担心数据安全的问题,但也很想知道数据储存到了哪里。

苹果尝试在设备内部完成语音指令激活。

苹果的此项专利是语音能在设备内部转化为文字指令,不用通过苹果服务器。设备的系统中预先存储了大量的指令,使其听到语音就能马上执行,用户在联网或离线时都能使用。

Source: USPTO
Source: USPTO

另一项跟语音安全相关的专利是「声纹识别」,使 Siri 能够识别多个用户的声音,实现一个设备多人操作。

与 Salesforce 合作

苹果不止希望用户在家里使用语音助手,它正与 Salesforce 合作将语音技术放进各个应用,这样用户只需让 Siri 完成更新和操作,不用在各个系统之间切换。

Salesforce 是目前最有名的企业级销售和市场工具之一,还拥有海量的第三方软件开发者,他们可以进入后端,找到更好的与 iPhone 和 iPad 结合的方式。

苹果 CEO 蒂姆·库克在接受路透社采访时谈到,「企业级语音的使用规模还远不及消费级,我们正在改变人们工作的方式,这与苹果『将事物变得更好』的核心理念一致。」

微软

虽然微软很早就发布了 Cortana 进入智能语音市场,但很难与 Google 和亚马逊竞争。

比起正面较量,微软更倾向于寻求合作。现在,Win10 和 Alexa 用户可以共享一些功能,Cortana 可以在 Win10 里与 Alexa 对话,Alexa 用户可以通过 Cortana 读取 Outlook 的邮件。

两大科技巨头的战略合作,使他们在原本难以进入的领域有了立足之地。微软赢得了看好 Cortana 和 Alexa 结合的用户,而在企业层面,Alexa 可以用于简单的任务操作。

Source: Voicebot.ai

今后几年,Cortana 有望将智能语音带进企业办公。 

微软最近收购了对话式人工智能的开发团队 Semantic Machines,看来与Alexa 的合作对微软来说尤为重要,有望推出智能语音驱动的办公套组。

低声语音专利

最近,微软申请了一项「低声语音输入」的专利,让用户可以低声激活语音助手,方便在公共场合使用。 

目前,人们只习惯在家中或者车里使用语音助手,尽量避免在公共场合使用。该项技术将在一些手机、智能手表和远程控制设备使用。对着智能手表小声说话,会不会让人有「007」的即视感呢?

微软显然对语音生物识别技术方面的尝试很感兴趣,最近更是将一家名为 ID R&D 的语音生物识别公司纳入其「物联网-人工智能内部实验室」项目。

结语

经过四年多的发展,美国的语音市场竞争已经进入到一个新的阶段。一方面,消费领域的竞争已经成为亚马逊、Google 和苹果的「三国演义」;另一方面,在企业领域,语音交互所带来的价值正在显现,这也是微软、Google 所看重的领域。

语音技术的发展、大量场景化的应用,正在催生一场全新的人机交互革命,这或许才是当下最重要的技术变革领域。(完)

Google Cloud 的四个变化、百度财报首提云服务以及 BAT 云博弈的三条线索

这期会员通讯讨论两个话题:

  • Google Cloud 新 CEO 带来的四大变化;
  • 百度财报首次提及云计算收入以及观察 BAT 云服务的三条线索;

Google Cloud 新收购背后的野心

上周,Google Cloud 完成一笔重要收购,该公司在 2 月 19 日的官方声明里提及,计划收购 硅谷的数据公司 Alooma,Google Cloud 声明里写道:

Leading companies across every industry and around the world are moving to the cloud to be more agile, secure and scalable. As organizations modernize their infrastructure to digitally transform themselves, migrating mission critical systems and the data that powers their business success can be daunting. No matter where your data is stored—on premises, in our cloud, or multiple clouds—we want to make that information accessible, valuable, and actionable.

That’s why today we’re announcing our intent to acquire Alooma, a leader in data migration. Alooma helps enterprise companies streamline database migration in the cloud with an innovative data pipeline tool that enables them to move their data from multiple sources to a single data warehouse.

上述两段话基本解释了此次收购的逻辑,也反应出当下云服务领域的几个趋势,主要包括以下几点:

  • 全球范围内的云计算需求依然旺盛,但企业客户的需求正在变得多样化;
  • 企业上云的主要困境不仅是业务迁移,还有数据迁移;
  • 数据是企业的核心资产,云计算公司需要提供更多的数据产品供企业客户做选择。

另外,Alooma 也是 Google Cloud 长期的合作伙伴,该公司主要提供数据集成和迁移业务,帮助企业快速将本地数据迁移到不同的数据仓库,包括亚马逊 AWS、微软的 Azure 以及 Google Cloud 等。从这个角度上说,Alooma 不仅拥有丰富的企业服务经验和客户资源,而且也对 Google Cloud 的友商们十分了解,这也让这笔收购具备了极其重要的战略意义。

值得一提的是,这是 Google Cloud 新任 CEO Thomas Kurian 的第一笔收购,他在上月正式上任,但他所面临的激烈竞争格局,丝毫不亚于当初他在 Oracle 启动云服务时行业态势。

月初的财报会议上,皮查伊主要分享了一组关于 Google Cloud 客户的数字,但相当模糊:

  • 100 万美元的客户单子相比去年翻倍;
  • 多年合同的客户数量翻倍;
  • G Suite 付费用户达到 500 万;

而路透社在上周发布的一个报告则显示,Google Cloud 的客户数量,尤其是大客户数量远远不及亚马逊

路透社的这份报告汇总的是全球大型上市公司公开披露文件里对于云服务商的介绍,虽然企业一般都不需要披露云服务商,但路透社还是从 5000 家企业里找到了 311 家,虽然样本数据不大,但依然可以作为观察当下云计算客户数量和分布的参考:

  • 共有 5 家公司明确指出,他们采用了 Google Cloud 的云服务,其中市值最大的是来自法国的道达尔石油公司(全球六大石油公司之一)和汇丰银行;
  • 采用 AWS 的企业高达 227 个,包括在线旅行服务公司 Expedia、工业巨头西门子;
  • 采用微软 Azure 的企业共有 69 家,包括武器制造商 Azon Enterprise 和数据公司 Dun&Bradstreet;
  • 还有 34 家公司表示采用了多云战略;

这也意味着,对于 Thomas Kurian 而言,如果说当初 Oracle 的云服务是无法赢得行业信任,那么当下的 Google Cloud 则是无法得到大公司的认可。

这也是 Google 长期以来所推崇的企业文化的「恶果」,我曾在去年的一期会员通讯里提及:

过去三年时间,Google Cloud 一直希望通过机器学习作为突围而出的捷径,上述一系列布局和整合,的确让 Google Cloud 拥有了人工智能领域的号召力,但 Google Cloud 的这些成绩,更多的是「Google」的生意,而非「Cloud」的生意,或者换句话说,Google Cloud 的企业级服务能力,尤其是大企业的服务能力,始终是一个无法跨越的坎。

某种意义上说,这更像是一个企业文化或企业基因的玄学问题。Google 长期以来形成的工程师文化,促使这家公司在新技术上不断创新,以云服务为例,早在 2008 年,这家公司就发布了面向 PaaS 服务的 Google App Engine(以下简称 GAE)。

简而言之,GAE 提供了一个利用 Google 底层技术来构建 Web 应用的平台,开发者可以方便地部署自己的应用。

这在遥远的 2008 年是一件非常炫酷的事情。彼时,亚马逊 AWS 只能提供最底层的 IaaS 服务,而微软的 Azure 还要至少两年才会发布,但 GAE 作为一款典型的 Google 产品,迷失在炫酷的技术与实用的功能之中,忽略了企业客户的核心诉求:稳定性

Google 越成功,其内部的文化惯性也越大......

不管是 Vmware 创始人 Diane Greene 还是英特尔数据中心部门负责人 Diane Bryant,都无法从根本上给 Google Cloud 带来质的变化,前者三年后黯然离开,后者不过在 Google 呆了七个月。

而在 Thomas Kurian 成为 Google Cloud CEO 的这几周,外界看到了一些新的变化。

首先,确定 Google Cloud 重点发力的几个行业,包括零售、医疗、制造、媒体以及金融。以医疗为例,Google Cloud 展示了一个基于云端的医疗信息 Demo,该功能将允许医生随时「无障碍」访问信息,目前产品还未上线。

其次,扩建 Google Cloud 的销售团队,尤其是推进面向大企业的云服务销售。Kurian 曾在之前的高盛投资者会议上指出:「目前大公司们对于 Google Cloud 十分感兴趣」。

根据之前ZDnet 的报道,NBA 球队金州勇士队已经开始使用 Google Cloud 作为其官方云服务,Google Cloud 将为其提供云基础设施、数据数据以及面向球迷的用户体验服务等。而 Google Cloud 另一个新客户则是英国报纸《电讯报》,据了解,《电讯报》早在 10 年前就开始使用 Google 文档服务,最新的消息则是,《电讯报》正式将自己的基础设施迁移到 Google Cloud 上。

第三,加速投资和并购。也是在 2 月份,皮查伊通过 Google 官方博客宣布了 Google 2019 年的投资计划,其中就提及了关于云服务的相关投资,主要包括以下两点点:

  • 资金:2019 年数据中心和办公楼建设的预算为 130 亿美元;
  • 数据中心:在内华达州、俄亥俄州、德克萨斯州和内布拉斯加州新建数据中心;

目前 Google Cloud 已在美国有 9 个数据中心,再加上 4 个后,Google Cloud 的数据中心将达到 13 个。

另外,在几大云服务公司里,Google Cloud 在收购上一直不活跃,随着 Kurian 的到来,外界也普遍认为,Google Cloud 的收购步伐会加快,其原因就在于 Kurian 曾在 Oracle 主导了多笔收购,包括 2004 年收购人力资源技术公司 PeopleSoft 以及 2005 年收购 CRM 公司 Siebel 等。

事实上,至少还有两家公司可能被收购:

  • 开发与协作公司 Atlassian:在 GitHub 被收购后,Atlassian 会成为市场上争夺开发者资源的焦点;
  • SaaS 公司 ServiceNow:这是一家扎根 SaaS领域的老牌云计算公司,提供企业服务管理和 IT 运营,一旦被收购,无疑将大大增加 Google Cloud 在企业市场的信任 ;

第四,或许也是最重要的一点变化,是加速 Google Cloud 对于企业业务需求的认识,比如加快推进混合云策略,其最新发布的混合云平台测试版被命名为「Cloud Services Platform」,旨在为不同需求的客户提供云服务。作为此次测试版的一部分,该混合云平台将利用 Kubernetes 帮助企业更好地创建和管理微服务。

CNBC 援引消息人士的话称,Kurian 希望能进一步开发或收购面向特定行业、更易用的应用程序,以此为切入点,逐步赢得大公司的信任。

百度公布云业务规模、BAT 云服务博弈的三条线索

上周,百度发布 2018 年第四季度财报,其中首次提及了百度云业务的规模,官方透露的数字显示,第四季度百度云业务营收为 11 亿元人民币。

对比阿里云此前公布的 66.11 亿人民币季度营收以及腾讯云 2018 前三季度的 60 亿元营收,营收 11 亿的百度云业务也跻身到国内公有云营收的前三。

在财报的要点里,如下图所示,百度介绍了云业务的几个关键词,比如支撑春晚红包、开源边缘计算以及区块链等。

img

在中国云计算的历史上,BAT 的当家人曾有一次,也可能是唯一一次公开讨论云计算,在那个略显「遥远」的 2010 年,当李彦宏不相信云计算、马化腾云计算觉得太早的背景下,事实上也只有阿里将云计算看作下一步的重点发展战略。马云当着李彦宏、马化腾的面说道:「我们自己公司对云计算是充满信心和希望……阿里巴巴拥有大量消费数据、支付宝交易数据,我们觉得这些数据对我们有用,对社会更有用。」

这也左右了随后 8 年 BAT 的云计算发展方向。握有先发优势的阿里云依然是国内第一、全球前列的云计算巨头,腾讯、百度则在摇摆不定的战略面前失去了方向,甚至公众一度将百度云归类于百度网盘......

2018 年,百度和腾讯都在云服务上做出了巨大调整。腾讯成立了云与智慧产业事业群(CSIG),百度则将智能云事业部(ACU)升级为智能云事业群组(ACG),同时将企业 AI 技术的输出放在了这个部门。

如果再加上阿里云的架构升级,云和 AI 也将成为 BAT 的新战场,而百度首次公布云业务规模,进一步放大了自己在行业里的声音,也让这个战场的充满了各种变数。

但依然有几条线索。

其一,云计算的市场规模还有巨大潜力。更烦上 IDC 的一份关于中国公有云市场的报告,2018上半年中国公有云服务整体市场规模(包括IaaS、PaaS、SaaS)超过 30 亿美金,这也给了腾讯、百度等企业抢占市场的机会。

其二,云和 AI 的结合依然是 BAT 的 PR 与产品争夺的焦点。将 AI 融入到云服务里,也可以在 BAT 各自云部门的名字里体会到,百度的智能云事业群、阿里云智能事业群以及腾讯的云与智慧产业事业群。

而从 PR 宣传与产品方向,AI 都将是 2019 年 BAT 云服务的重要命题。事实上,将 AI 应用到企业领域,也是当下 AI 落地与商业化的重要途径,BAT 会在 2019 年如何布局值得长期关注。

其三,如果回归到云服务本身,BAT,尤其是百度、腾讯,必须在云基础设施上持续发力,包括数据中心建设、数据库、存储等基础能力的比拼,也会成为贯穿 2019 年的焦点话题。

另外值得一提的是,云服务本身是一种服务,这也考验着这些互联网公司的企业服务能力。如何更好地理解企业客户的需求、并用合适的技术满足这些需求,而且,中国市场广泛存在的私有云、混合云需求,也极大考验着这些互联网公司的技术落地能力,这一切对于曾经躺着赚钱的互联网公司而言,显然进入到了另一个模式里。

综上,在阿里云耕耘多年后,2019 年的中国云计算市场也将进入 BAT 三大巨头博弈的新时代,作为行业第一的阿里云,也需要拿出更多技术和服务的创新,以继续领先行业;而百度、腾讯的追赶以及华为的努力,也势必加速整个行业的成熟。