← Dailyio 历史存档 | 搜索

标签: 人工智能

共有 76 篇文章

Google 如何让 AI 与云结合、阿里华为AWS的同一布局以及 2019 年的新趋势

云计算与人工智能结合的口号已经喊了很多年,但站在 2018 年末的时间点去看,这个趋势正在成为现实。

让我们先来简单回顾一下过往巨头公司们是如何将两者绑定的。

2016 年 3 月,Google 旗下的 DeepMind 利用 AlaphGo 展现了 Google 的人工智能能力,几乎与此同时,Google Cloud Platform(以下简称 GCP)召开了一场低调的会议,之所以说低调,一方面是因为当时整个行业的热点都聚焦在 DeepMind 身上,另一方面则是,Google Cloud 在当时还非常弱小。

但为期两天的会议还是发布了一些令人眼前一亮的产品(或者说理念),这其中的关键词就是机器学习,尤其是基于云端的机器学习,官方的新闻稿写道:

Cloud Machine Learning will take machine learning mainstream, giving data scientists and developers a way to build a new class of intelligent applications. It provides access to the same technologies that power Google Now, Google Photos and voice recognition in Google Search as easy to use REST APIs…..

这一次会议是 Google 全面将人工智能与云绑定在一起的开始,然而外界并不能明白,GCP 上的机器学习到底和亚马逊 AWS、微软 Azure 上有什么区别以及优势在哪里,当时的一位参会者在其博客里直言:

There’s no doubt about both Google and Amazon being good at what they do, but exactly because of that fact, the answer “because we’re Google” just doesn’t cut it anymore.

“Why is GCP’s Machine Learning better than Amazon’s and Microsoft’s?” “Because we’re Google and they are not”.

“Why is GCP more secure than AWS?” “Because GCP is Google, and AWS is not”.

而到了 2016 年 5 月,Google 又召开了一场高调的大会:Google I/O。这次会议进一步展现了 Google 对「云计算+人工智能」的决心,在这次会议上,Google 推出了为机器学习独家定制的芯片,Tensor Processing Unit(以下简称为 TPU)。

img
Google 不对外出售 TPU,将其与 GCP 紧密结合在一起,并且也为 Google 开源的深度学习框架 Tersorflow 进行了优化,考虑到 Tensorflow 自开源以来所形成的强大生态,这也进一步增强了 Google 在云服务领域的话语权,Google 希望以人工智能打破云计算领域的僵局,

随后的 2017、2018 年,GCP 的机器学习产品进一步与 TPU 绑定,尤其在 2018 年 2 月,Google 宣布开放 TPU 云服务,这也让 GCP 形成了独特的人工智能+云的产品架构:

  • 硬件:TPU;
  • 框架:TensorFlow;
  • 社区:Kaggle;
  • 计算/存储平台:GCP;

Google 的这一系列举措也进一步引发了云计算领域的人工智能热,2016 年的 AWS re:Invent 大会上,AWS 发布了多款机器学习 API 产品,而这年早些时候,阿里云推出基于人工智能的城市解决产品:杭州城市大脑。

2017 年的 Bulid 大会上,微软也发布了一系列机器学习产品,在微软看来:「(Azure 云)既是孕育和发展人工智能的平台和基础,同时也在以多样化的云服务的形式,为全球开发者和企业提供触手可及的人工智能平台与工具。」

在这样的理念之下,微软增加了多个智能 API 接口,「利用这些 API,开发者能够将视觉、语音、语言、知识和搜索等智能应用加入到任何应用场景中」。

2017 年末,AWS 继续在云端增加机器学习的能力,Amazon SageMaker 亮相这一年的 re:Invent 大会,SageMaker 是一个端到端的机器学习服务,不仅可以简化开发者的工作内容,你只需输入数据,就可以自由选择算法、模型进行训练,同时还具备迁移、部署的灵活性。

img

如果从技术的创新性来看,Google 无疑是最具引领效应的,而这种引领效应也被其市场部门不断扩大,最终也塑造 Google 是「云端人工智能最强」的公众印象。

但事实的另一面则是,由于机器学习的早期的实践者并非大企业,更多是研究者或开发者,GCP 早期的技术创新的确满足了这些人的需求,但随着机器学习开始步入企业,尤其是大企业开始部署相关技术,GCP 企业级的服务缺陷彰显无遗。而此时,Azure 与 AWS 则通过将机器学习产品与现有的客户需求相结合,进一步释放了云平台的号召力,这也就不难理解为何 GCP 这一年举步维艰了。

过去的 2018 年,从国内的阿里云、华为到 AWS,在不断强化云服务的同时,还在做同一件事情,也是一年半之前 Google 做的事情:研发 AI 芯片。

9 月的杭州云栖大会上,阿里巴巴 CTO 张建锋透露了阿里巴巴的芯片计划:

  • 成立平头哥半导体有限公司;
  • 2019 年发布第一款神经网络芯片;
  • 正在研发量子芯片;

11 月,随着阿里云架构调整,张建锋出任全新的阿里云智能事业群总裁,也将进一步整合AI 芯片、达摩院与阿里云平台,部分意义上与 GCP 之前的架构类似。

10 月,华为也在其全连接大会上全面发布了公司的 AI 战略,并首次公开了 AI 芯片计划:我曾在当时的会员通讯里做过分析:

…..此次外界更多的关注点,还是聚焦在华为发布的人工智能芯片:Ascend 910。这是一款面向数据中心的人工智能芯片,华为官方将其性能定义为「目前全球已发布的单芯片计算密度最大的AI芯片」,将在明年二季度通过华为的公有云提供相关服务。

这是一个与 Google Cloud 的 TPU 颇为类似的做法,2016 年,Google 率先发布了一款基于云端的人工智能专用芯片 TPU(tensor processing unit),截止到 2018 年 5 月,Google TPU 已经更新到第三代。
……
回到此次华为发布的人工智能专属芯片上,目前可以确定的消息是,华为不会直接售卖这款芯片,而是将其打包到整个人工智能开发框架之中,也就是上文提及的全栈全场景的人工智能平台。开发者或者企业,只有在这个平台上,才能使用华为的这款芯片,这也让未来华为人工智能的商业模式愈发和公有云绑定在一起,或者可以这么理解:华为希望依靠人工智能来实现快速追赶阿里云的目标。

从服务企业客户的经验上说,华为远胜于 GCP,不过两者在云服务上都处在相对早期的阶段,未来如何突破还是未知数。

而上周,AWS 又一次点燃了云端人工智能的热情。此次 AWS 发布了机器学习推理芯片 Inferentia,如果从功能上看,Inferrntia 并不支持机器学习的训练,而只能实现推理,但相比于 TPU 只支持 TensorFlow,几乎所有的主流机器学习框架都可以运行在 Inferentia 之上,这也意味着,AWS 又一次在技术炫酷与客户需求之间毫不犹豫地选择了后者。

至此,2018 年云端人工智能的布局已基本落幕,当人工智能需求从 API 服务逐步延伸到芯片层面的时候,你也可以明显感觉到行业对于人工智能的接受度越来越高,展望 2019 年,有三个趋势值得关注。

其一,云端机器学习平台之争会更加激烈。目前除了 AWS、Azure 和 GCP 的机器学习平台,阿里云也拥有 PAI 的机器学习平台,今年杭州云栖大会期间,这个平台也展示了其一系列新产品。

其二,从平台到服务,云计算公司的 AI 产品会越来越丰富。IBM 的 Wstson、Google Cloud 的视觉服务、微软的认知计算服务以及阿里云的「XX 大脑」,这些产品更多围绕大客户,也是面向更具实战意义的生产场景。

其三,专属芯片之争还会持续,这也将是一个长期战场。然而各大巨头的不同战略思考,也将左右着其芯片在「人工智能+云计算」中的地位。

综上,人工智能与云服务的结合正在形成一股强大的变革力量,它将让人工智能的影响范围进一步扩展到大企业,并有可能重新塑造云计算的格局版图。

半导体潮流与反潮流、人工智能芯片以及产业的新机会

某种意义上说,过去 50 年半导体行业的发展成为人类计算革命的燃料来源。

从概念上看,半导体又被理解为芯片,是一种高度小型化的电子产品,它可以非常快速地完成大量数学运算,利用这种计算可以在现实物理世界里完成目标。

简而言之,芯片是为我们的电子设备的大脑。它们帮助计算机和其他机器评估替代品,为电话、计算机、汽车、飞机、互联网提供计算能力。

半导体是在硅晶片上制造的非常复杂的物体。 这些晶圆的制造非常昂贵,前期投资需要数十亿美元。人类社会过去 60 多年的伟大技术奇迹之一,就是不断缩小芯片尺寸并不断提升计算性能,也就是我们常说的「摩尔定律」。

在这个行业,能够生产制造半导体的公司屈指可数,而且由于技术复杂,导致建造半导体工厂的成本直线上升,这也让半导体行业形成独特的商业模型,在整个链条上只有两类公司:一类是芯片设计公司,如英特尔,另一类则是芯片设计公司和芯片代工公司,或者晶圆代工公司,下图是 2018 年上半年全球十大代工厂。

img

不管摩尔定律是否失效,半导体行业依然在发展中,在通往 7 纳米制程的道路上,目前只有台积电、英特尔和三星,当然,英特尔目前也遭遇相当多的困难,这也意味着,从 PC 到互联网,再到智能手机,随着对计算性能要求的不断提升,整个半导体行业的集中化趋势,已经基本成定局。

从产业的角度去看,如今的半导体行业越来越像汽车行业,并购整合正在加速,尽管今年博通收购高通、高通收购恩智浦都宣告失败,但产业发展的趋势不可避免,只有足够的垄断才能形成更大的议价权,未来三到五年,新的并购整合还将继续。

这两年来,一股半导体行业的「反潮流」开始出现:自研芯片

智能手机领域,苹果在 2008 年悄然收购了芯片制造商 P.A. Semi 公司,并在两年后推出自研的第一代芯片 A4 处理器,这款处理器很快成为 iPhone、iPad 的标配产品,随后,苹果又在 Apple Watch、Apple TV 等产品里加入自主研发的处理器。另外,根据著名苹果分析师郭明錤透露的消息,2020 年之后,苹果将在 Mac 系列电脑里集成自己的芯片。

而 Google,则一直在推进数据中心的芯片研发。截止到 2018 年 11 月,Google 已经推出了三代 Tensor Process Unit(以下简称为 TPU),这些产品瞄准的是日益强烈的机器学习需求,从而也增加了 Google 在云端服务上的特定能力。

上述现象与半导体行业刚起步时非常相似,当时,所有的公司都在内部研发、制造芯片,随着企业研发成本的上升,有的企业开始将芯片设计、生产分开,或者直接外包给第三方公司,这样的分工协作也大大降低了成本。

但现在,越来越多的公司成为加入到「反潮流」的大军里,苹果、Google 除外,亚马逊、微软以及华为、阿里巴巴,都在暗自进行芯片的研发。

人工智能,也正在给半导体行业带来新的变革机遇。

从最基本的角度去理解人工智能,或者准确说机器学习,它更像是一种高级的软件形态,这个软件上可以进行大量专业数学计算。以深度神经网络来说,它是一种非常复杂的「投票」算法,通过对各个变量的权重进行复杂的计算,来实现决策。

机器学习或深度学习的过程,就是一次次的计算过程,如何才能提升计算速度呢?当然是让计算并行化,这种需求也和图像计算非常相似,尽管原理不一定相同,但事实也的确证明了,将图像计算的处理器 GPU 放在机器学习之中,效果非常好,由此也造就了过去四年英伟达的「奇迹」。

但行业内除了英伟达之外,没有人愿意看到只有 GPU 适合机器学习,从传统芯片企业英特尔到互联网巨头 Google、Facebook、亚马逊,都有着自己的考量。

而如果从 AI 芯片的功能层面来看,人工智能芯片主要有两个方面的需求:训练和推理。这两个需求相互联系,构成了人工智能芯片的完整流程。

先说训练,当海量被标注的数据被收集到数据中心,工程师们就要开始「训练」数据,简而言之,就是在海量的数据中寻找可用的模型。

而推理,则是将模型反应出结果呈现出来,我们常常说所谓「机器决策」,也就是说,当用户输入一个不太明确的指令后,机器能够给出一个看似合理的答案。

上面的两段话有点复杂,不妨来看两个案例,如果你在手机上用过 Google Photo,你会发现这个产品不仅会让你照片备份起来,还会提供一系列有趣的功能,如下图所示,你可以看到「往年今日」的推荐、以及可以直接用自然语言搜索图片。

img

要实现 Google Photo 的上述功能,你需要将数据,也就是照片先上传到 Google 服务器,经过一段时间之后才能看到上图的推荐,这是因为,Google 的数据训练都是在云端,而推理的结果则需要网络的支持才能呈现出来。换句话说,你需要联网才能使用。

苹果的做法则完全不同。基于苹果自主研发的芯片以及神经网络处理引擎,目前 iPhone、iPad 都可以实现本地的 AI 计算,同样是照片数据的训练和推理,苹果将所有的过程都放在本地设备,如下图所示,你会看到也是类似的照片推荐、自然语言搜索等功能。

img

事实上,我们很难直接判断哪种方式跟好,因为每一种方式都有着一定的使用范围,比如在自动驾驶汽车上,人工智能芯片的处理过程必须放在本地,只有这样,才能避免与云端交换数据的延时,也能避免车祸的发生。

从上述角度出发,AI 芯片领域有三类大市场:数据中心训练、数据中心推理、设备/边缘推理。

如果说过去的芯片行业像极了汽车行业,导致没有后来者、创业者的机会,那么在 AI 芯片开创的三个领域里,却提供了足够多的想象空间,也让资本市场看到了可能性,下图还仅仅是截止到 2017 年的数据

img
如果从 AI 芯片的三个大市场的角度去看未来的机会。

首先,数据中心 AI 芯片市场的竞争会非常激烈,一方面,CPU 不会轻易退出市场,另一方面,数据中心所有者都是全球云计算巨头,包括亚马逊、Google、微软、阿里巴巴,他们对于 AI 芯片的需求当然非常强烈,但正如上文所言,他们正在自主研发自己的芯片,虽然这不代表这些公司不会采购第三方芯片,却也展现出这个市场的特殊性。

其次,设备推理市场虽然规模巨大,但却有着非常细分的领域,比如设备形态不同,导致应用场景、能耗的区别非常大,手机的推理能力与汽车显然是不同的,这也导致这个市场最终会非常庞杂,当然,巨头、创业公司都有机会在这个领域获得一席之地。

当然,与传统半导体行业类似,AI 芯片最终的走向依然会是寡头化,未来 5 年,全球范围内一大批 AI 芯片创业公司都会成为巨头们收割的对象,最终也将重写半导体行业规则,如今,这场战役也才刚刚开始。(完)

扒开「AI 合成主播」的外衣后,现实格外残酷

本月初,新华社与搜狗公司共同发布了一个「AI 合成主播」,引发行业热议,并从人工智能领域延伸到新闻领域。透过全球主流媒体的报道,这个「AI 主播」更是得到欧美民众的关注,但与国内几乎一致的「厉害了我的国」声音形成对比的,国外媒体的声音比较多元化,比如英国《卫报》就提及社交媒体上的担忧:

For Xinhua’s already tightly-scripted and controlled state news presenters, the AI anchors take things a step further. Video of the Chinese anchor quickly spread on social media in China, with many viewers impressed as they were alarmed. “A little bit horrible,” one said, to which another responded: “Really scary.”

其次,「AI 主播」到底是不是中国人工智能领域的又一次创新呢?不妨先来看看这个「AI 合成主播」。根据新华社官方透露的消息,这位主播模仿的是新华社主持人邱浩,从外形、声音、眼神到脸部动作,都与真人十分相似。

新华社的新闻稿还指出:AI 合成主播是开了「外挂」,因为真人主播每天工作 8 小时,而这个「分身」却能不知疲倦地工作 24 小时......

虽然目前尚无法确认这个 AI 主播到底用了什么「黑科技」,但如果将当下的 AI 主流技术一一对照,也可以大概得出一个结论。

首先,利用图像生成引擎,通过对人类主播脸部图像、动作的抓取,生成「AI 主播」的脸部动作特点;其次,通过人类主播大量语音数据的训练,并将韵律、情感等多维度的特征加入其中。

最后,通过图像、声音的多模态合成,最终形成一位 AI 主播。雷锋网在一篇分析里指出:

......AI合成主播的核心技术是搜狗分身技术。

搜狗分身技术是搜狗人工智能推出的多模态合成技术,可以基于少量真实音视频数据,快速迁移生成虚拟的分身模型。使用时输入一段文本,即可生成与真人无异的同步音视频。

但不管是新华社还是搜狗,都有意无意在避开一个事实:这个「AI 主播」到底没有「智能」。

答案也显而易见,没有。

从技术上看,「AI 主播」的技术含量的确不错,尤其是能在少量数据的支持下实现快速生成。但由于新闻这样的特定领域,所谓「主播」的工作定义就是播新闻,尤其在中国这个更特殊的新闻环境里,新闻机构的新闻内容更是严格把控,这也意味着,即便是人类主播,其自主性的概率也几乎为零,那这样一个「AI 主播」也无法具备自主决策的能力,也从根本上决定了这个「AI 主播」 的地位:不过是官方新闻里的虚拟形象罢了。

海外媒体的确很关注「AI 主播」,但他们同样看到了其背后隐藏的缺陷。比如《MIT 科技评论》高级编辑 Will Knight 在接受 CNBC 采访时表示,场景化的设置以及虚拟形象的创造,让这个「AI 主播」具备了很大欺骗性,真正的 AI 主播应该是这样的:

If it were to get a bunch of reports, take some phone calls and then reproduce it, that would be incredible, but that’s way beyond what machines can do

伦敦帝国学院 AI 机器人助理研究员 Ali Shafti 则进一步指出:

What actually creates those images and the movement of the lips and the voice of this anchor is using algorithms that are related to artificial intelligence. But to call this an AI anchor is slightly overselling it

自此,所谓「AI 主播」的噱头也就清理干净了。

过去几年,人工智能的红火,引发了全球范围的炒作,从巨头到创业者,从资本市场到大众媒体,无一例外投入到这场「事关未来人类命运」的运动中去,Elon Musk 的「人工智能邪恶论」、波斯特罗姆的「超级智能」,这些鼎鼎大名的公众人物成为贩卖焦虑的主力军,我曾多次在会员通讯和社交媒体上强调一点:是否封杀 Elon Musk,是判断一家人工智能是否专业的重要标准

对普通消费者,面对一窝蜂的所谓「人工智能产品宣传」,又该如何判断呢?《MIT 科技评论》一位作者手绘了一张图,用于帮助大家分析某个产品是否使用了人工智能。

与消费者所面临的情况相比,企业需要解决的 AI 焦虑更多。过去的三年时间内,各个行业都感受到了 AI 带来的「压力」,不久前我曾在会员计划里分析了德勤的企业人工智能适应报告,其中就提到,尽管远期来看,每个行业都会从 AI 技术中获益,但每个行业的回报肯定是不一样的,尤其是在目前这个初级阶段。

那么,对于企业而言,是否应该选择人工智能呢?在日前举行的 VentureBeat 峰会上,一位企业家也手绘了一张图,试图帮助企业回答这个问题,如下图所示,这是一个看起来简单、却也是最难的企业发展方向思考框架。

以新闻行业为例,人工智能能带来价值吗?当然可以!《纽约时报》与 Google 合作,利用计算机视觉技术来分析《纽约时报》过去一百多年里积累的 500 多万张照片,通过将照片识别、归类,帮助人类记者在写稿时可以更好地利用历史照片。

另一个案例里,新闻网站 Quartz 也在将人工智能纳入新闻生产发行的多个环节。早先 Quartz 曾利用自然语言处理的技术,打造了一个聊天机器人,如下图所示,通过和用户的对话来推荐相应的新闻。

本周,Quartz 宣布成立 AI 工作室,更进一步推进机器学习在新闻生产中的应用,比如利用机器学习算法,帮助人类记者在复杂的材料、数据中寻找到基本线索,从而提升记者的工作效率。

但即便是 Quartz 也承认,机器学习并不适合每一个新新闻报道的制作,而且,对于未来一年的发展前景也非常保守,Quartz 计划在未来一年通过机器学习的帮助,完成 6 篇新闻报道。

上述这些宣传噱头与产业困境是中文人工智能领域每天都在上演的故事,不由得用这样一句烂大街的话来结尾:这是人工智能最好的时代,也是人工智能最坏的时代......

Google 云服务负责人易主、为什么 Google 玩不转云、押注 AI 三年的 Google 云计算又何去何从?

今年 2 月的时候,Google CEO 皮查伊在财报分析师会议上透露,包括 Gmail 企业服务、Google Drive 企业服务在内的整个云服务,已经是一个每季度 10 亿美元的业务。

这个数字当时引发行业热议,尽管并未公布具体云服务的营收规模,但众多行业分析师还是将 Google Cloud 放在亚马逊 AWS 和微软 Azure 之后。今年 5 月份,Gartner 发布全球云计算基础设施即服务的魔力象限,如下图所示:

Gartner 的魔力象限包括纵轴和横轴两个指标,其中横轴是前瞻性(Completeness of Vision),反应的是企业的产技术能力、市场领导力、创新能力等;纵轴是执行力(Ability to Execute),主要考量产品的易用性、服务能力和技术支持能力。

通过两个指标,Gartner 划分出四个象限,从而形成了对市场格局的基本判断。Google Cloud 虽然和 AWS 和 Azure 有一定差距,但还是踏入 Leaders 象限。而去年的时候,Google Cloud 还处在 Visionaries 显现,这个象限里的公司,技术前瞻性上颇具潜力,但产品打磨以及服务能力还比较欠缺。
img

但在 10 月财报公布后,皮查伊用一系列含糊的回答来应对分析师对于云业务营收的问题,他表示,云业务的投资效应正在显现,营收增长还需要一定时间。

这个回答让很多分析师感到不快,由于没有透露任何最新数字,这也导致分析师们无法预估出当下 Google Cloud 的营收规模,来自大西洋证券的一位分析师随后写道:

There were notably no metrics in relation to the cloud business, which we view as not an overly encouraging sign……

现在来看,这位分析师的判断或许是正确的。至少,Google Cloud 的发展状况并没有得到 Google 认可。上周五,Google Cloud CEO Diane Greene 正式宣布将在明年 1 月离职,并将由前 Oracle 高管 Thomas Kurian 接任。

这也再次将 Google Cloud 放在了聚光灯面前。

在咨询机构 Synergy 10 月份发布的第三季度全球云计算基础设施服务市场份额中,Google Cloud 的份额虽然增长了 1%,但排在全球第四的位置,其市场份额增速也低于微软 Azure,与 AWS 持平。

img

显然,这个成绩并没有达到 Google 的预期,事实上,Google 开始「认真」做云服务,不过三年光景。2015 年 Google 整合旗下三大云相关的业务,正式成立全新的云端服务部门,并邀请 Vmware 创始人 Diane Greene 为该部门负责人。

此举意义重大,这是 Google Cloud 各项服务整合的起点,包括 Google for Work(SaaS 产品)、Cloud Platform(IaaS 产品)、Google Apps(PaaS 产品),从而也将 Google 所有云服务的研发、销售、客服整合在一起。

另一方面,Diane Greene 作为企业级市场的「老兵」,她的到来也正式宣告了 Google 云服务不再是小打小闹,而是要真正切入到企业级市场,Diane 的经验和人脉也成为 Google Cloud 最大的保证。

2015 年开始,人工智能开始逐步被公众熟知,2016 年,Google Cloud 顺势而为,推出一系列基于 Google 云端服务的机器学习产品,一时间吸睛无数。与此同时,Google 还将图像识别大拿李飞飞招致麾下,出任首席科学家,进一步推动了人工智能在 Google Cloud 产品线中的影响力。

目前 Google Cloud 里的人工智能产品包括:

  1. Cloud AutoML:这是一个面向开发者的云端自动化机器学习产品组合,包括神经架构搜索技术(Neural Architecture Search Technology)、learning2learn以及迁移学习(transfer learning)等,旨在进一步降低机器学习的门槛,吸引更多人加入其中。
  2. Tensor processing units:这是 Google 自主研发的机器学习专属处理器,今年已经更新到第三代,并且推出了面向边缘计算的 TPU Edge 处理器。
  3. 基于 Kubernetes 的混合云:Google 今年开源了 Kubeflow 产品,旨在提供混合云和分布式的机器学习能力。
  4. Kaggle:这是一个超过 200万用户并且拥有 12000 个数据集的平台,也是目前全球数据科学家最多的社区,2017 年,Google 正式收购了这个社区。
  5. 基础研究。Google 目前拥有 Google Brain 和 DeepMind 两大研究机构,也是全球两个人工智能顶尖研究机构,不过目前并没有太多信号证明这些研究如何应用到企业级产品里。

过去三年时间,Google Cloud 一直希望通过机器学习作为突围而出的捷径,上述一系列布局和整合,的确让 Google Cloud 拥有了人工智能领域的号召力,但 Google Cloud 的这些成绩,更多的是「Google」的生意,而非「Cloud」的生意,或者换句话说,Google Cloud 的企业级服务能力,尤其是大企业的服务能力,始终是一个无法跨越的坎。

某种意义上说,这更像是一个企业文化或企业基因的玄学问题。Google 长期以来形成的工程师文化,促使这家公司在新技术上不断创新,以云服务为例,早在 2008 年,这家公司就发布了面向 PaaS 服务的 Google App Engine(以下简称 GAE)。

简而言之,GAE 提供了一个利用 Google 底层技术来构建 Web 应用的平台,开发者可以方便地部署自己的应用。

这在遥远的 2008 年是一件非常炫酷的事情。彼时,亚马逊 AWS 只能提供最底层的 IaaS 服务,而微软的 Azure 还要至少两年才会发布,但 GAE 作为一款典型的 Google 产品,迷失在炫酷的技术与实用的功能之中,忽略了企业客户的核心诉求:稳定性

Google 越成功,其内部的文化惯性也越大。一年前,Diane Greene 曾邀请前英特尔数据中心部门负责人 Diane Bryant 出任 COO,外界当时普遍认为,如此两位在企业级市场拼杀多年的人在一起,或许可以加速 Google Cloud 与 Google 的「切割」。

img

但事实却也非常残酷,仅仅七个月后,Diane Bryant 就离开了 Google Cloud。

如今,所有的难题都摆在了 Thomas Kurian 面前,他同样是企业级市场的「老兵」,过去的 20 多年时间,他都在 Oracle 工作,已经做到了 Oracle 2 号人物,若不是和创始人拉里·埃里森之间的矛盾,他或许将成为这家全球第二大软件公司(第一大是微软)的掌门人。

img

对 Thomas Kurian 而言,他首先要做的,是调整整个云服务的产品理念:技术含金量高的产品并不是企业所需要的产品

人工智能同样如此。人工智能当然还将是 Google Cloud 关注的领域,但 Thomas Kurian 的到来,会更进一步关注这些人工智能产品的落地场景,从而让企业心甘情愿地掏钱。

这也是最难的一步,如果你关注 Google Cloud 的官方博客或者其在 Youtube 的官方频道,你会不断看到这支团队又有哪些新产品和新理念,但真实用户,尤其是大客户的的反馈却非常少。

其次,Google Cloud 里的产品整合。目前 Google Cloud 包括涵盖了 IaaS、PaaS 和 SaaS 等多个产品,这些产品理应成为 Google 云技术整体输出的出口,不过情况并不乐观。

7 月份,Google Cloud 迎来一个重磅客户 Target 连锁超市,引发行业轰动,但 Bloomberg 记者 Mark Bergen 却在随后的 Google Cloud Next 大会上注意到一个细节

Case in point: The bulk of Target’s cloud spending goes to Google, McNamara said, but the company hasn’t bought G Suite apps like Gmail and Drive, despite all the new bells and whistles unfurled this week. “It’s never been on my priority list,” McNamara said. “Our business is selling dresses and cornflakes, it’s not collaborating on documents.” Target pays for Microsoft’s office productivity software instead.

而 Thomas Kurian 在 Oracle 先后管理过数据中心、硬件以及应用软件等多个团队,这些管理经验有助于其在 Google Cloud 的产品整合。

第三,Thomas Kurian 需要再次向企业级市场重建 Google Cloud 的品牌。需要注意的是,尽管 AWS、Azure 拥有不小的市场份额,但即便是美国云服务市场,也依然在高速增长中,尤其是在企业「多云」策略的影响下,企业对于云服务的需求也会越来越多样化,这些新的需求会促使包括 Google Cloud 在内的云服务商继续开拓新的产品线,从而抢占更多市场机会。

随着 IBM 收购红帽,从而进一步推进其混合云的策略后,阿里云也在这一年持续推进其国际化步伐,在东南亚和欧洲市场持续发力。2019 年,Google Cloud 也会面临不少压力,能否力挽狂澜,值得长期关注。

微软连续收购 AI 创业公司、巨头押注的「对话平台」以及阿里百度的优势

本周,微软又又又卖下了一家人工智能创业公司。本周三,微软宣布收购对话机器人创业公司 XOXCO。该公司的主要产品包括 Slack 上的对话机器人Howdy,它可以帮助用户安排会议,另外,该公司也在 GitHub 上想开发者提供开发工具 Botkit。

收购金额并没有具体透露,但此举也进一步展现出微软在 AI 战略中的战术,收购。

算是这次收购,仅在 2018 年,微软已经在人工智能领域完成了 4 笔收购:

  • 2018 年 5 月,收购 Semantic Machines,这是一家语音和对话机器人的创业公司,创始人为前 Siri 首席语音科学家 Larry Gillick;
  • 2018 年 7 月,收购 Bonsai,一家基于 Google Tensorflow 进行开发的 AI 软件公司;
  • 2018 年 9 月,收购 Lobe,这是一家研发 AI 开发工具的公司,最重要的是,Lobe 的理念是要让普通人都可以快速上手人工智能开发。
  • 2018 年 11 月,收购 XOXCO;

与其他领域不同,AI 创业公司在专利、产品以及客户方面几乎没有多少积累,以微软上述收购的案例来看,Lobe 在收购时只有一个 Beta 版本的产品,用户通过网页来进行机器学习模型组装,别说客户,甚至连商业模式都谈不上。

因此,巨头在 AI 领域的收购,更多还是看重其背后的人才积累。在人工智能相对宏大的领域里,这些创业者能够定义 AI 需求,从而开发出一个相对粗糙的产品,这本身就足以展现创业者的能力。

上述收购也多少反应出微软在 AI 方向的思考:对话。其中,Semantic Machines、XOXCO 都是该领域顶尖的创业公司。

「对话」绝不仅仅只是语音助手或智能音箱这么简单,站在一个产业层面的角度去理解,「对话」将成为驱动新一轮人机交互或者计算革命的重要「窗口」——一如当年微软核心产品「Windows」所扮演的角色那样。

咨询机构 Gartner 将「对话平台」纳入 2018 年 10 大战略科技趋势。

img

Gartner 认为,利用「对话平台」,企业可以和客户建立新型关系,而这种新型关系可以大幅提升获取新客户的效率,并进一步提升客户转化率,最终也给企业带来巨大盈利空间。

今年的 5 月的 Google I/O 大会上,Google 演示的人工智能打电话场景震惊世界,但这个技术并不是为了炫酷,而是 Google 在展现自己对于对话技术的积累和探索。而到了今年的 Google Next 大会,Google 就将这些技术整合到「Contact Center AI(呼叫中心AI客服)」解决方案里。

微软的目的,也是要成为「对话平台」底层技术的提供者。

2016 年微软在 Build 大会上正式发布 Bot FrameWork,这是一套用于开发和部署对话机器人或者 Chatbot 的服务框架,通过这个框架,开发者可以快速开发对话机器人,并将其接入到相关应用中。

img

当时的 Bloomberg Businessweek 还在封面报道了这个产品(如上图所示)。文章提到,微软的对话机器人设想,也受到微信服务号、订阅号的启发:

The technology that most impressed him was WeChat, which started out as a chat app but has grown into something much bigger. Users make
hotel reservations, split bills, make doctor appointments, buy movie tickets, and shop via text message.

The power of chatbots “was somewhat accidentally invented by WeChat, but now Facebook sees it and everybody is building similar experiences,” he says. “I think Microsoft has a leadership role to play.

这并不为过,自 2007 年开始,iPhone 与 Android 「联合」制定了手机体验的方式,也就是通过各种各样的 App 来获取服务。基于庞大的用户基础,微信通过订阅号改变了内容分发的方式,利用服务号一定程度上也影响到用户获取服务的习惯,小程序的出现,则是微信更具野心的尝试,我在 2017 年的一期会员通讯里写道:

……当 iPhone 重新定义了手机,App Store重新定义了移动互联网的应用使用方式,一个个 App 就成为用户与手机产生交互的唯一触点,在移动互联网时代,传统的浏览器,如 Chrome、Safari 变得无足轻重,用户不会在浏览器上输入「taobao.com」购物,也不会打开12306 的网站买车票,这些需求都可以在相应的 App 中完成,而微信接下来要做的,就是改变用户使用移动应用的习惯,从打开一个个 App 到打开微信,扫描二维码,进入相应的小程序。

相对于微信在对话领域的「攻城把寨」微软则低调的多,部分原因在于,微软希望用工具、平台、生态来打造一股技术潮流,这是典型的前互联网时代科技公司的做法。

而从技术上看,对话机器人的发展并不顺利,受限于自然语言理解的瓶颈,当下对话机器人也无法实现真正意义的「对话」,下图是 Facebook 对话机器人的表演。

img

2017 年开始,随着智能音箱市场的爆发,「对话」也进一步延伸到语音领域,无论是亚马逊 Echo 还是 Google Home,其以声音带来的情感交互短时间内赢得市场认可。

更进一步,从文本、语音再到图像,更多方式的对话交互将加速对话平台的发展,这个领域的竞争也会继续升级,Google、微软之外,亚马逊早已发布了对话平台 Lex,本月底,AWS 将召开一年一度的 AWS re:Invent 大会,届时,亚马逊会给 Lex 带来怎样的升级,非常值得关注。

在中国,阿里巴巴和百度都有一定优势。阿里坐拥海量的电商交易、客户服务数据,并有完善的商业化应用场景,在阿里云产品库里,,有一款名叫「云小蜜」的对话平台:

云小蜜是一款面向开发者的会话机器人,支持在不同的消息端上实现基于自然语言处理(NLP)的智能会话,如网站、APP及实体机器人等。用户可以在云小蜜中配置自己特有的知识库实现智能问答,也可以通过多轮对话与第三方API集成实现自助服务,如:订单查询,物流跟踪,自助退货机器人等。

百度的优势则来自自身多年积累的自然语言理解和语音技术。2017 年,陆奇加入百度后,迅速整合并以 DuerOS 为对话技术的统一输出平台。

官方宣传里,DuerOS 开放平台被定义为「为企业及开发者提供的一整套对话式人工智能解决方案的开放平台」。不过目前来看,企业对于该平台的需求,更多还停留在消费级产品层面上,也就是将 DuerOS 的相关技术整合到消费设备里,作为一个新卖点,鲜有企业利用对话平台开发面向企业的服务。

当然,必须声明一点,「对话」以及「对话平台」的发展,还处在相对早期阶段,当技术的进步速度以及用户对于「对话」的接受能力不容低估,尤其是当微软、Google、阿里巴巴等巨头都在布局这个领域的时候,这个领域的发展脉络更值得跟进。

最后看一个围绕语音、对话的采访,来自 Bloomberg 科技节目当家主持人 Emily Chan 与 Siri 创始人之一的 Dag Kittlaus,版权限制,请点击这里前往 YouTube 观看。(完)

百度的星辰与苟且

上周四,百度举办了一年一度的百度世界大会,这是一个集中展示百度产品发展成果的平台。外界也十分关注,随着「陆奇时代」的正式终结,百度的产品规划和创新是否能继续保持下去。

在李彦宏大概 40 分钟的开场演讲中,他几乎没有提及任何百度在互联网领域的发展情况,而是花了大量篇幅介绍百度人工智能与三大产业结合后的落地情况,比如在农业领域,基于百度大脑的解决方案可以智能遥感监测病虫害,从而可以制定更科学的施药计划;在制造业,百度人工智能赋能工程机械,在挖掘机的场景里,大幅减少人力成本等等。

其次,李彦宏近两年来一直推动的自动驾驶也有新突破。百度将和一汽红旗共同研发国内首款 L4 级别的自动驾驶乘用车,这款车将在 2019 年年底小批量生产,2020 年年底实现大规模量产。

第三,李彦宏代表百度发布了面向智能城市的 ACE(Autonomous、Connected、Efficiency)计划。简而言之,包括自动驾驶(此次推出的自动泊车技术)、智能道路网(此次主要侧重车路协同)、效率城市三大子项目。

值得关注的是,此次百度世界大会主论坛的演讲顺序也有一番考量。李彦宏开场演讲毫无争议,第二、第三个演讲是谈自动驾驶 Apollo 与 ACE,第四个上台的是 DuerOS 负责人景鲲,主论坛的最后一个人是沈抖,他是百度 App与信息流业务的负责人。

事实上,不管是 Apollo 还是 DuerOS,尤其是 Apollo 广告宣传片里的场景,这些听起来、看起来都无比令人激动的产品,距离商业化运作还有相当长的距离。

以语音交互系统 DuerOS 为例,这款对标 Alexa 的操作系统,已经成为中国规模最大的对话式人工智能操作系统,百度官方的数字显示:DuerOS 月活跃设备数达到 3500万、激活设备数量 1.5 亿,合作伙伴 280+、落地主控设备 160+、技能开发者超过 2.4 万。

上述这些数字无法回答一个如何商业化的命题,这同样也是亚马逊 Alexa 所面临的困境。从产品逻辑上看,语音交互作为入口,背后需要一系列服务作为支撑,而这些服务与百度的其他产品,如信息流、视频业务几乎没有任何协同效应,这也决定了基于 DuerOS 的百度音箱以及安装到其他公司其他类型的产品,目前只能成为一种全新的交互产品,还无法形成新的业务平台。

今年 4 月,在陆奇离开百度前的最后一次财报分析师会议上,陆奇解释了自动驾驶业务和 DuerOS 业务的商业模式:

(自动驾驶)我们的商业模式是提供免费开放的平台,但是我们的合作伙伴需要使用我们的一些服务,比如地图,我所说的地图是供传感器使用的高精度地图,而非平时普通用户使用的手机地图,这是我们的商业模式,而且成长非常不错。
……

百度开放平台的创收模式是多层次的,第一,各类设备为百度提供了入口,比如我们可以通过这些设备提供信息,服务和内容,加入广告也是自然而然的事情,事实上我们也已经与设备商开始这种合作;第二,我们可以通过授权和收取佣金的方式获得营收,但这些都是远期的目标,短期来看还是专注于产品的开发。

好消息是,至少这半年时间里,百度内部没有对这两个产品作出所谓「战略调整」,坏消息则是,至少在短期内,自动驾驶和语音交互都无法真正成为百度营收的主要来源,AI 之于百度转型,还有较长的一段路要走。

如果说自动驾驶、语音交互是百度星辰大海,那么现在百度必须面对眼前的苟且。

如今支撑百度业务发展,或者说让百度挣钱的正是百度 App 和信息流业务,而智能小程序的快速爆发则让百度看到了新希望。

根据沈抖在此次会议上透露的消息,百度智能小程序正式成立开源联盟,百度希望通过这样的生态架构,形成全新的流量分发体系;与此同时,百度还面向开发者推出「开发者共筑计划」,旨在从流量和资金上帮助开发者快速接入智能小程序。

百度的智能小程序与微信类似,前者基于百度 App 进行流量引导和分发,这对增加百度 App 的用户规模、用户粘性意义重大。

此次世界大会前一天,百度发布了第三季度财报,总营收 282 亿人民币,基本符合分析师预期。这其中,网络营销收入,主要是搜索广告收入同比增长 12%,环比增长 7%,达到 225 亿人民币,占总营收比重为 79%。

img

虽然在中文搜索广告领域,百度依然具有绝对话语权,但这几年随着信息流广告的兴起,搜索广告份额正在逐渐下降,从这个角度去看,今日头条才是目前百度最大的竞争对手,魏武挥不久前在一篇分析今日头条的文章里对比了两类产品里的广告商机:

对于搜索引擎而言,用户需要主动给出一个关键词,然后系统返回结果。而这种主动给出一个关键词的动作,其实就是告知系统:我现在对什么感兴趣。

头条看上去不需要用户给出任何东西,但围绕兴趣给出结果,和搜索引擎并无二致。

当然,很少有用户会在搜索引擎连刷十页,所以搜索引擎也只能卖出前排位置(无论左侧右侧,是的,以为谷歌从来不卖左侧也是一种无知),而头条的用户可以连刷十屏甚至更多,虽然无法售卖什么关键词广告但它可以售卖信息流广告,广告位置同样是无穷的。

更重要一点,短视频在信息流里的作用愈发明显。财报分析师会议上,百度 CFO 余正钧透露,百度正致力于将信息流业务模式复制到其他产品上,比如百度的短视频产品「好看视频」。

这同样也是今日头条挤压百度的领域,目前百度旗下的短视频产品「好看」,在 Questmobile 的报告里有这样的评价「国内日活 500 万以上的 App 中增长最快的 App」,但如果与市场领先者如快手、抖音相比,还有不小的差距。

img

另一组来自 Questmobile 的数据则显示,百度 App 的日活跃用户增速已经开始下降,从 18% 下降到 8%,结合财报数字去看,8 月的日活用户为 1.61 亿,9 月份为 1.51 亿。

综上来看,百度在信息流领域面临用户增长放缓、用户粘性不足,尤其是在短时频领域还有较大差距,智能小程序目前对于提升百度 App 的作用还非常有限,这一切在 AI 短期内无法落地的现实语境里,也让百度未来三个月的业绩蒙上了一层阴影。

在上周财报会议上,李彦宏还有一番意味深长的表态,国内媒体鲜有提及,或者说不敢引用:

“On the pos­si­ble mas­sive slow-down, right now, what we have been say­ing is that the con­fi­dence level from the pri­vate sec­tor, from the en­tre­pre-neurs, are not that high……If, let’s say, dur­ing the next cou­ple of months, the con­fi­dence level changes, things will change to the pos­i­tive di­rec­tion,” Mr. Li said. “But we don’t know ex­actly what is go­ing to hap­pen.”

《华尔街日报》认为,由于百度在中国广告市场的重要位置,因此这段表述也是中国经济下滑的又一个显著标志。

另一个值得关注的是,在百度世界大会同一天,民营企业座谈会在人民大会堂召开,最高决策层对于民营企业的表态是否能够释放当下民营企业对于未来的不确定性,也会在一定程度上左右百度下一季度的广告营收。

一如我在 4 月份一期会员通讯里所言,2018 年百度所面临的压力和挑战,一点也不少于 2017 年。如今,距离 2019 年只剩下不到两个月,留给百度的时间和机会窗口,尤其是短时频突围的时间窗口,真的不多了。