← Dailyio 历史存档 | 搜索

标签: Google

共有 27 篇文章

详解 Google Duplex 争议、微软开发者大会的潜台词以及 DeepMind 新论文

本周的「人工智能商业内参 」,你会看到:

  • Google Duplex 争议背后的产品理念和 AI 伦理;
  • 微软发力边缘计算;
  • DeepMind 新论文;
  • Google 发布第三代 TPU;

Google Duplex 的两个议题

本周,微软、Google 前后脚召开了年度开发者大会,两家公司向各自平台的开发者以及全球的用户、粉丝们传递了公司最近的技术进展,我在 Google I/O 大会后发了一条推文,或许能代表很多人的心声:

Google I/O 大会上放出的各种黑科技都是以「哇」开始,若干个月后,都是以「唉」结束,一年又一年。

这当然不是 Google 的「专利」,事实上,包括微软、苹果都有过类似的做法。究其原因,一来是很多技术的炫酷功能远大于实用价值;二来则是媒体并不太负责的传播,导致公众期待值很高,但最后去发现和演示 Demo 相距甚远,只能发出一声叹息。

这次 I/O 大会上,Google Duplex 绝对是主角,这个内置在 Google Assistant 里的功能演示视频在过去一周成为全球关注的焦点,如果你还没有看过,我强烈建议你先看看下面的这则视频:

围绕这个视频的讨论还在发酵中,但我觉得有几个讨论框架值得去关注。其一,从产品层面,Google 在此次大会上展现出清晰的产品价值观,科技博客主 Ben Thompson 的分析很到位:

In Google’s view, computers help you get things done — and save you time — by doing things for you. Duplex was the most impressive example — a computer talking on the phone for you — but the general concept applied to many of Google’s other demonstrations, particularly those predicated on AI: Google Photos will not only sort and tag your photos, but now propose specific edits; Google News will find your news for you, and Maps will find you new restaurants and shops in your neighborhood. And, appropriately enough, the keynote closed with a presentation from Waymo, which will drive you.

在 Thompson 看来,Google 与微软是两个几乎完全不同的公司,谈到微软时,Thompson 写道:

This is technology’s second philosophy, and it is orthogonal to the other: the expectation is not that the computer does your work for you, but rather that the computer enables you to do your work better and more efficiently. And, with this philosophy, comes a different take on responsibility. Pichai, in the opening of Google’s keynote, acknowledged that “we feel a deep sense of responsibility to get this right”, but inherent in that statement is the centrality of Google generally and the direct culpability of its managers. Nadella, on the other hand, insists that responsibility lies with the tech industry collectively, and all of us who seek to leverage it individually.

关于哪家公司更有「良心」并非本文讨论范围,这里这涉及到对于 Google 商业模式的认知,作为一家互联网公司,Google 的商业模式都是建立在数据之上,上文中提到的 Google 的各项产品更新,从相册到新闻再到地图以及 Google Duplex,每个产品的「免费升级」,都需要用户用数据来换取。《连线》杂志在大会当天一片欢呼声中也出这个质疑

All this free personalization comes at a price: these services count on users handing over even more data about themselves and their lives, and on Google mining that data, giving the search giant more influence and control over our daily choices.

其二,从伦理层面,Google Duplex 的隐忧更大。 在该产品发布后,硅谷资深记者 Steven Levy 在 Twitter 上写道:

Is it ethical to have a human-sounding robot interact with someone without informing the other party that he or she is in conversation with an it? Real question.

而在上周新一集的《西部世界》里,有个细节令我印象深刻:一个新出场的妹子在园区被男子搭讪,两人在上床前,女子要用游戏枪来「检验」这个男子到底是不是机器人。

两个场景放在一起来看,一实一虚,却构成了一个宏大的命题:我们还能相信电话那头的声音吗?

Cnet 这个视频的观点颇具代表性。

类似的讨论也让 Google 官方做出了回应,多家媒体都获得了 Google 的同一份声明:

“We understand and value the discussion around Google Duplex — as we’ve said from the beginning, transparency in the technology is important……We are designing this feature with disclosure built-in, and we’ll make sure the system is appropriately identified. What we showed at I/O was an early technology demo, and we look forward to incorporating feedback as we develop this into a product.”

注意这段回应的最后加粗部分,这也部分印证了我之前的吐槽,或许这又是一个以「唉」结尾的产品。

微软的 Build 大会的潜台词

尽管被 Google 开发者大会抢了一定风头,但微软 Build 大会依然有诸多潜台词。

首先必须认识到一点,微软已不再是一家 Windows 公司。这也是不久前微软架构调整所释放出的信号,而在此次 Build 大会上,微软继续向外界释放一个强烈的信号:微软更是一家人工智能公司

当然,所谓「人工智能公司」更多是个噱头,微软的野心是希望通过构建一个「云—端」的协同产品通道,将人工智能的各项能力输出到各个产品中,比如今年的主旨就是边缘计算。

为此,微软在边缘计算领域持续发力。比如开源了 Azure IoT Edge Runtime,这是一个连接云和物联网设备的开发框架。开发者通过这个框架可以直接在设备端开发拥有机器学习能力的应用,比如第一批合作伙伴里的大疆,就利用这个框架实现无人机本地的图像识别功能。

同时,微软还将高通拉入自己的阵营,合作的主旨也是视觉领域的边缘计算,快速构建移动终端设备上的图像处理能力。

接着,微软也将几乎放弃的 Kinect 项目重新启动,但只面向开发者,希望开发者利用这个工具包中的深度摄像头和边缘计算能力,开发出更多有趣而实用的应用。

微软此举也展现出边缘计算的潜在价值。广义上说,边缘计算不仅是物联网设备增多后的必然趋势同时也是智能手机最近两年进化的表现之一,基于本地的图像处理能力,智能手机在拍照体验和相册体验都在大幅提升,而随着自动驾驶汽车的到来,基于本地的计算需求,也将有大幅增长。

从这一点来看,微软这次可谓起了大早,会不会赶个晚集呢?

其他

本周除了 Google DuPlex 争议和微软大会之外,人工智能领域还有众多值得关注的话题。

Google 第三代 TPU 问世。自 2016 年开始,Google 每年升级一代用于云端机器学习的芯片 TPU(Tensor Processing Units),Google 表示,此次发布的第三代产品相较于上一代又有巨大提升,但在具体细节方面并没有透露太多,Extremetech 根据前两代 TPU 的性能和表现做了一番预测,感兴趣的朋友可以研究一下。

DeepMind 又在《自然》杂志上发了篇重磅论文,这篇论文标题为 Vector-based navigation using grid-like representations in artificial agents,在这项研究中,研究团队通过深度学习方法,来训练计算机模拟大鼠在虚拟环境下追踪自己的位置。

你可以在这里阅读该论文。简言之,这篇论文提供了一种用人工智能解决大脑判断方向时的决策难题,或许这并不是揭开大脑运作的重大发现,但已经为大脑研究提供了新的方向。

卡内基梅隆大学计划从今天秋天开始为本科生提供 AI 学位。根据该学校的官方报道,这个阶段的课程主要围绕 AI 伦理和 AI 在社会福祉方面的应用,更多细节可以参见该校网站

英特尔野心勃勃的投资计划。英特尔在新技术领域的投资一向非常开放和大胆,仅在 2018 年,就已经完成 1.15 亿美元的各种投资。最新的消息称,英特尔将 7200 万美元投入到 12 家创业公司中,包括人工智能、物联网、云等领域,也包括三家中国公司

白宫 AI 峰会鼓励科技公司发展人工智能。会议上,白宫高级技术顾问Michael Kratsios 向与会者表示,政府对于人工智能发展持鼓励态度,同时呼吁工业界、学术界和政府机构共同努力,并宣布成立人工智能特别委员会(Select Committee on Artificial Intelligence)其成员包括将美国政府各个部门官员,如美国国家科学基金会和国防高级研究计划局等。

MIT 科技评论在一篇文章中指出,此次会议以及新的机构,彰显出白宫对于人工智能的认识开始升级,但相较于其他国家,政府层面的支持依然欠缺。

AI 会是 FB的救命稻草吗、语音领域正在发生什么、阿里云营收与市场份额

TL;DR.今天的「人工智能商业内参」,我将挑选本周人工智能领域最值得关注的事件并予以深度剖析,包括:

  • F8 大会后,人工智能会成为 FB 的救命稻草吗?
  • 语音领域再起波澜,Google、亚马逊和阿里巴巴的小算盘;
  • 寒武纪的云端机器学习芯片意味着什么?
  • 新一季财报后,阿里云营收与市场份额;

本周,Facebook 举行了年度开发者大会(F8),为期两天的会议上,正处在舆论漩涡中心的 FB 继续用「技术会让世界变得更好」的话术向开发者、媒体、华尔街分析师以及国会示好,比如桑德伯格在一个闭门演讲中就这样说道:

……
去年在这里,我说,面对科技行业的挑战,我始终会做一个乐观主义者。现在,我们只能说,科技行业面临了更多的挑战,但我却更加乐观,因为是技术让我们的世界更加安全,更加紧密地连接,是技术让美好的事情发生。

正因为技术的存在,我们能够在自然灾害发生的时候,给亲朋好友报上平安,找到彼此,帮助彼此。Facebook 要做的不仅仅是提升社交的体验,更要肩负社会责任。我们承诺,将进我们所能,我从未如此坚定,我知道马克(扎克伯格)也是一样。

不过大会第一天的产品和演讲,并没有令人看到 FB 正在用技术让「世界更加安全」:基于 FB 平台的约会功能聊胜于无;虚拟现实头盔产品 Oculus Go 在 VR 不再流行的背景下也不具备成为大众产品的可能性。

舞台上,Facebook CTO Mike Schroepfer 告诉台下的观众,人工智能将成为保证 Facebook 社区安全运行的重要工具。类似的话,也是扎克伯格上月出席国会听证会时的观点,不过扎克伯格还在上周 FB 财报分析师会议上吐槽当下人工智能的无能

One of the pieces of criticism we get that I think is fair is we’re much better able to enforce our nudity policies, for example, than we are hate speech,The reason for that is it’s much easier to make an AI system that can detect a nipple than it is to determine what is linguistically hate speech, so this is something I think we will make progress on and we’ll get better at over time. These are not unsolvable problems.

我给这段发言的后半句做了标注,与此同时,Mike Schroepfer 在 F8 大会期间告诉《连线》记者:

If I told you that there was a human reading every single one of your posts before it went up it would change what you would post……

也正是这样的假设,构成了今后 FB 应对舆论质疑的重要观点,这是硅谷对于技术、效率的迷恋,FB 也将自己的未来与人工智能的未来,尤其是自然语言理解的未来捆绑在一起,就像扎克伯格所指,人工智能在图像识别的进步远远超过自然语言理解的发展速度。

会议期间,FB 也展示了自然语言理解上的几个进步,比如该公司的算法可以根据用户发言内容判断用户是否有自残倾向,并发出预警;再比如,今年第一季度,Facebook 的算法自动检测数以十万计涉及到恐怖主义的文字,并自动删除。

然而,摆在 FB 算法面前的,不仅还包括如何检测仇恨言论,还有针对不同语言的理解。根据最新一季的财报,Facebook 月活跃用户已达到 22 亿,如下图所示,但作为主要英语地区的北美用户数量是最少的,特别是亚洲地区,语言更是多种多样,如何理解不同语言就成为一个巨大挑战。

img

根据联合国针对缅甸国内种族冲突的调查,Facebook 在传播仇恨言论以及虚假新闻中扮演了重要角色,今年 3月,路透社援引联合国独立调查小组主席 Marzuki Darusman 的话:

It has … substantively contributed to the level of acrimony and dissension and conflict, if you will, within the public. Hate speech is certainly of course a part of that. As far as the Myanmar situation is concerned, social media is Facebook, and Facebook is social media……

Facebook 针对多语言理解推出的解决方案是 MUSE,也就是「Multilingual Unsupervised and Supervised Embeddings」,希望利用监督学习和非监督学习的算法,实现不同语言理解中的迁移。换句话说,通过 MUSE,开发者们在面向不同语言环境时,可以直接调用过往在英语环境调试的算法和训练的模型。不过,这个项目到底能有多大的通用价值,到底能让机器在多大程度上适应不同语言,至少在缅甸这件事上,FB 并没有展示出机器学习的能力。

公平地说,今年的 F8 大会并不是像有些媒体所言的「无聊」大会,在减少诸多所谓「黑科技」产品之后,Facebook 展现了在未来愿景里,人工智能尤其是自然语言理解将成为重中之重。如果从纯粹的机器学习角度去看,FB 坐拥 22 亿月活用户、遍布全球各大洲,这可能是机器学习最好的训练场之一,倘若机器能在这个训练过程中攻克假新闻、仇恨言论以及多语言理解的难题,过往 FB 的一切「罪恶」,或许就成了进步的「代价」。

但问题是,这个代价是不是有点太大?

语音领域再起波澜,Google、亚马逊和阿里的小算盘

本周,围绕语音领域有几个大事件。

Google 针对语音领域设置了一项专门投资基金,面向所有早期的语音创业公司或开发者,当然,这些创业公司和开发者必须是 Google Home 智能音箱外部技能的重要贡献者。

第一批 Google 投资的公司里,GoMoment 公司提供面向酒店的语音交互工具,客人可以在客房里,通过智能音箱和酒店前台直接对话;Pulse Labs 则是帮助开发者测试语音服务的产品;BotSociety 则是一个帮助开发者涉及语音界面的工具。

Google 不仅将在资金方面予以投入,还将在技术、工具和人才培养上提供帮助。

这是一项十分类似亚马逊 Alexa 基金的项目,其目的都是通过资金和技术来打造围绕智能音箱或语音助手的外围生态,Alexa 基金目前孵化出 13 家企业,而 Google 此次宣布的几家公司,显示出 Google 在旅游、教育等领域的野心。

当 Google 紧追不舍的时候,亚马逊的 Alexa 又快了一步。本周,亚马逊宣布将向所有开发者们开放技能付费和收款功能,这意味着,Alexa 的开发者们可以将开发的技能直接售卖,并会得到整个收入的 70%。

事实上,上述两个功能早在 2017 年年底就已经开始小范围测试,但此次全面开放意义重大。这意味着,Alexa 平台正在成为类「App Store」的应用商店。如果说 iPhone 的成功得益于 App Store 海量的应用以及良好的生态环境,那么,亚马逊希望自己成为下一个「App Store」。

就目前来看,亚马逊 Alexa 的先发优势明显,根据 Voicebot.ai 的数据,Alexa 上的技能数量已经接近 25000 个:

img

同时,配备 Alexa 系统的 Echo 系列市场份额占据美国市场的一大半:

img

这些技能、设备的先发优势,再加上此次的技能付费、收款功能,也进一步完善了 Alexa 的生态体系,所谓的闭环效应已经初步显现出来。

另一个关于语音领域的大事件来自国内。多方的消息源称,阿里巴巴全资收购了北京先声互联科技有限公司,该公司从事语音增强和远场语音交互技术的研发,曾和阿里巴巴、百度、小米进行过合作。

此次收购并没有涉及到具体金额,但正如阿里巴巴的说法,收购主要是针对人才和技术。比如先声互联创始人、中科院声学所前研究员付强博士以及该团队的多位专家,都悉数加入阿里达摩院的机器智能技术实验室,从事语音交互前端技术和方案的研发。

媒体指出,阿里此次收购也和 4 月份高调进军物联网相关。在物联网长长的产业链条上,阿里巴巴已经拥有云端的强大处理能力和品牌号召力,但在连接、终端交互层面并没有直接的优势,付强也透露了他们接下来的目标:

特别地,针对IoT化的智能家居的需求,我们正在研发基于小阵列语音增强技术的低功耗、低成本、高集成的端云一体语音交互技术和硬件方案。随着阿里在芯片上的战略布局,我们也会在语音专用芯片上有更多进展。

不过值得注意的是,阿里巴巴体系内还有一个针对家庭语音技术的部门,阿里巴巴人工智能实验室。对标 Echo 系列的天猫精灵正是出自这个部门,上月,该部门和戴姆勒、奥迪、沃尔沃三大车企达成合作,未来将把天猫精灵的底层系统 Ali Genie 植入到这些汽车的中控系统中,根据官方的说法:「……来监测汽油量、行驶里程数以及引擎与电池的状态,同时也能从家中透过语音指令控制车门、车窗与车内空调。」

这也让两个语音实验室的未来走向充满看点。同时,鉴于天猫精灵的重要性,阿里巴巴接下来会不会将智能家居的落地与天猫精灵打通等等,这些都会成为左右中国智能音箱以及语音交互市场的重要因素。

其他

本周在人工智能领域,还有众多值得关注的新闻。周三,寒武纪发布了一款面向云端机器学习的芯片,某种意义上也正式向英伟达、英特尔等公司宣战。深科技的记者写道:

本次发布的首款云端AI处理器—“MLU100”——这正是寒武纪科技在2017年底预告的其中一款云端高性能智能处理器,支持服务器端的推理和训练需求,尤其是侧重推理,另有一款MLU200偏重训练。在发布会现场,陈天石称MLU100的功耗仅为是英伟达同类产品的几分之一,将树立新的行业标杆。

加上此前基于终端的神经网络处理器,寒武纪正在打造一个从云到端的机器学习生态体系:

  • 云:面向超算领域,为发布会站台的还有浪潮和联想;
  • 端:面向手机,比如华为海思麒麟 970 处理器就采用了寒武纪的神经网络处理器;

目前来看,寒武纪在人工智能芯片领域的技术优势和产业生态已经初具规模,也是我最看好的中国人工智能创业公司之一。

周六,阿里巴巴新一季财报公布,其中阿里云的营收再创新高,季度收入达到 43.85 亿人民币,整个 2018 财年(2017 年 4 月至 2018 年 3 月底)营收为 133.9亿元。

img

现在,阿里巴巴的云服务也成了一个年度百亿收入的业务,但阿里云的收入还是低于 Google,如果放在这个季度对比,阿里云的收入换算成美元大概在 6 亿美元左右,我曾在上周的会员通讯里分析了 Google 云服务结构和收入预测:

Google 的云服务体系,包括云计算平台(也就是 Google Cloud)和 Google 办公套件(G Suite)。按照上一财季 Google CEO 皮查伊的说法,这两块业务已经变成了一个高达每季度 10 亿美元收入的业务。再结合本季财报分析师会议上的说法,Google 云计算的整个营收应该在 10-15 亿美元之间。

另外根据一份来自市场研究公司 synergy research 的数据显示,阿里云的市场份额,依然有不小的增长空间:

img

不过,这份数据在国内也被解读为阿里云、微软、Google 营收速度远超亚马逊,这当然不能算说谎,不过是呈现真相的一部分罢了。

最后,补充一个小新闻,Twitter 在本周宣布将部分数据平台业务迁移到 Google 云服务上。Twitter CTO 在官方博客里介绍道:

……we are excited to announce that we are working with Google Cloud to move cold data storage and our flexible compute Hadoop clusters to Google Cloud Platform. This will enable us to enhance the experience and productivity of our engineering teams working with our data platform.

此举,既是 Google 云服务获得越来越多青睐的重要证据,也凸显了混合云服务的市场需求,类似的案例,会在 2018 年越来越多。

云计算的三大趋势、扎克伯格的苦水以及自说自话的 AI 圆桌论坛

今天迎来五一假期,不过鉴于本周有太多值得探讨的重要新闻,因此「人工智能商业内参」将继续更新。

本周,亚马逊、微软、Google 相继发布财报,无论是营收还是利润,都有不同程度的增长,人工智能和云,成为这三家财报里一个有趣的看点。

Facebook 本周也发布了新财报,由于数据滥用事件并未算入本次财报统计,使得 FB 这一季的营收和利润都有大幅增长,但不可忽视的一点,广告几乎占据了 FB 全部收入的 99%,如果说这是 FB 内部推动人工智能所带来的巨大效益,那么人工智能能否在内容过滤上扮演重要角色?

本周,在国内移动互联网一年一度的 GMIC 大会上,人工智能成为众多演讲和圆桌讨论的议题,其中,作为企业家的李开复和两位学者 Yann LeCun、Michael Jordan 的讨论几乎就是当下被撕裂的人工智能讨论的缩影。

云端三巨头财报背后的三大看点

亚马逊、微软、Google 作为当下云计算领域最具代表性的公司,其每一季度财报中,关于云计算的数字也是我关注的重点。

不过,长期以来,微软和 Google 都没有将公有云业务单独列入财报。比如微软,就把公有云业务 Azure 放在智能云的业务体系里,这个业务体系还包括面向企业的 Office 365 等产品。根据微软的财报数字,智能云业务收入为 79 亿美元,其中 Azure 云收入的增长速度为 93%。

而 Google 对云服务的数字披露更保守。虽然其 CEO Ruth Porat 透露云计算、硬件等非广告收入贡献越来越大,但并没有触及核心数字。

Google 的云服务体系,包括云计算平台(也就是 Google Cloud)和 Google 办公套件(G Suite)。按照上一财季 Google CEO 皮查伊的说法,这两块业务已经变成了一个高达每季度 10 亿美元收入的业务。再结合本季财报分析师会议上的说法,Google 云计算的整个营收应该在 10-15 亿美元之间。

但不管是微软还是 Google,还难以撼动亚马逊在云计算领域的霸主地位。根据本周亚马逊公布的财报数字:AWS云服务第一季度净销售额为 54.42亿美元,比上年同期的36.61亿美元增长49%;运营利润为14亿美元,高于上年同期的8.90亿美元。

AWS 在 2017 年也曾遭遇一系列挑战,其整体增速开始放缓,但这个财季的强势回归,也让外界继续认可了 AWS 在云计算的领先地位。

img

从上述财报数字可以进一步引申出几个观察云计算未来走向的要点。

其一,云服务市场的基本格局在短期内不会出现变动,亚马逊、微软构成了第一集团,谁是第三呢?在 Google 不公布云计算营收之前,这个位置或许还是很多媒体所传的阿里云。

另一个被媒体广泛报道的事件是,美国或许将依据 1974 年贸易法 301 条款,研究发起新的 301 调查,以反制中国在云计算与其他高科技服务领域的所谓「不公平限制」,换句话说,美国可能要「封杀」阿里云在美业务。

但该事件对阿里云或者云服务市场格局几乎不产生多大影响,原因就在于美国市场早已被 AWS 和 Azure 瓜分,阿里云的市场份额几乎可以忽略不计。

更值得关注的云计算战场应该是东南亚、南亚、中东等正在快速增长的区域,这些新兴区域的云计算份额或许能左右未来的格局。

其二,三大云计算公司营收、利润同时增长,也进一步凸显了云计算市场正在变得更大,正如上文所提到东南亚、南亚和中东市场,这是一个还在高速增长的市场,也因此,该市场里的大小参与者,都会在这一个大市场里分得一杯羹。

上月底,微软作出重大战略调整,微软智能云业务将 Azure 和人工智能结合在一起,尤其是强调人工智能在云端的落地实践,这不仅意味着微软战略重心的转移,也再次引领了人工智能与云计算结合后的行业趋势。

其三,云+端正在成为新的业务增长点。不管是阿里云高调进军物联网还是微软投巨资加码物联网,都是将边缘智能作为云服务的重要延伸,不管是家庭物联网还是智能驾驶抑或是智能工厂,边缘智能或者中端智能所带来的想象空间,会非常非常大。

这一切的收益,都会在未来一段时间内体现出来。

扎克伯格的苦水与分裂的讨论议题

在 FB 财报分析师会议上,扎克伯格说出了这样一番话

One of the pieces of criticism we get that I think is fair is we’re much better able to enforce our nudity policies, for example, than we are hate speech,The reason for that is it’s much easier to make an AI system that can detect a nipple than it is to determine what is linguistically hate speech, so this is something I think we will make progress on and we’ll get better at over time. These are not unsolvable problems.

这里姑且不谈这句话的表述是否令人不适,只谈反映出的现实困境,或者说人工智能在产业界的困境:计算机视觉的发展速度远远快速自然语言理解。

当然,这里并非否认计算机视觉技术发展所带来的巨大进步,毕竟,让计算机理解静态、动态影像所引发的行业变革意义重大,从安防、智能手机到医疗影像,全球众多行业正经历一次全新的变革。

但还是要承认一点,当下人工智能「魔力」还有巨大局限性。但在概念炒作与媒体盲目的追捧之下,这种局限性往往会被有意无意地忽略掉,在本周的 GMIC 大会上,有一场圆桌讨论很有代表性,作为企业家的李开复和两位人工智能学者展开了所谓的「对话」,更像是一场自说自话的演讲,比如李开复的「宣言」:

从应用的角度来看,我会把人工智能的应用归纳成为四波浪潮,这四波浪潮它应用的方式不太一样。其实在座的每一位每天都在用人工智能。

所谓四波人工智能浪潮的具体说法,你可以在这里查看官方新闻稿。而李开复对于中国的「数据优势」表达技巧,要远远高过李彦宏:

这四波浪潮也给中国带来更多的机会,尤其在互联网上,我们已经占了世界的半壁江山。在视觉方面和传感器方面的应用,我们也发展的非常快。因为我们有海量的数据。在那些比较深入的科技,像无人驾驶方面还是美国领先的。但是中国有数据的优势和强大的政策推动,所以中美两国在未来会保持人工智能领域领先的状况。

但这番讲话所渲染的气氛被 Yann LeCun 「破坏」了,作为 FB 人工智能实验室的负责人以及深度学习领域的专家,LeCun 表达了学术界的基本看法:

……从学术性的到实际的应用,也有很多路要走。

Facebook 有一些应用的初步尝试,我们希望机器有真正的智能,并搭建起这样一个体系架构。我们希望人工智能可以很好地实时的做相关的事情,很多技术现在还没有到位。很多研究工作实际上已经进行了几十年,但有些目标还没有达成。因为机器要获取大量的知识,它才能够真正实现像人类那样的智能和智慧,并做出很多的预测和判断来做很多的事情。

事实上,这场所谓的「讨论」到这个阶段已经可以结束了,产业界和学术界的不同认知,媒体与公众的信息不对称,都将继续贯穿在人工智能接下来的每一个阶段,一个例子是,《西部世界》第二季已经回归,又有一波媒体将人工智能与《西部世界》结合在一起讨论了……

其他

本周,人工智能领域还有众多值得关注的话题。

在 Google 创始人之一的谢尔盖·布林写的 2018 公开信里,布林用了《双城记》的开头来表达自己对这个时代的定义:

We’re in an era of great inspiration and possibility, but with this opportunity comes the need for tremendous thoughtfulness and responsibility as technology is deeply and irrevocably interwoven into our societies.

这封公开信一方面展示了 Google 或者 Alphabet 这一年的发展状况,还进一步指出了人工智能的隐忧:

However, such powerful tools also bring with them new questions and responsibilities. How will they affect employment across different sectors? How can we understand what they are doing under the hood? What about measures of fairness? How might they manipulate people? Are they safe?

There is serious thought and research going into all of these issues. Most notably, safety spans a wide range of concerns from the fears of sci-fi style sentience to the more near-term questions such as validating the performance of self-driving cars. A few of our noteworthy initiatives on AI safety are as follows:

I expect machine learning technology to continue to evolve rapidly and for Alphabet to continue to be a leader — in both the technological and ethical evolution of the field.

不过,布林或者 Google 管理层的反思,并没有涉及 Google 是否应该参与军方人工智能项目,这个事件在 Google 内部一度引发巨大争议,我曾在 3 月份的一期会员计划里做过详细讨论。

本周另一个重大新闻是英特尔招募了负责特斯拉自动驾驶的副总裁 Jim Keller,他是前 AMD 的架构师,参与设计了 Zen 架构,随后加盟特斯拉,负责该公司的芯片研发,用于特斯拉的自动驾驶系统。

根据 Slashgear 的预测,Keller 在英特尔的工作将围绕云端和终端芯片的研发,也正如上文所言,英特尔同样将云计算与边缘计算的结合作为未来重要发展方向:

Intel has been betting considerably on so-called edge computing as vital for future AI applications in autonomous driving and more. That will involve positioning greater processing power at more local points, rather than relying solely on a centralized cloud, and giving individual nodes in the process – such as the vehicles themselves – greater capacity to filter only the data most essential to be passed up the chain.

最后来看两个人工智能的研究项目,IBM 利用 Watson 在气候变化与清洁能源方面做一些尝试,不过这篇文章更像是 IBM 的新闻稿。

Mashable 报道了微软和 Kyoto 大学所合作的一个人工智能项目,该项目里的机器可以「写诗」,这篇报道的价值在于没有停留在项目本身,而是发出了新的质疑:

Mashable spoke to AI-expert Professor Barry O’Sullivan of University College Cork about the significance of such experiments with machine-lyricism.

……

O'Sullivan said that AI systems writing poetry has long been examined, but the focus of the discussion should be on how we measure creativity. “What is art?” he asked, “How do we recognise something that is of artistic value? Who defines what the ground truth that determines whether one poem is more poetic than another?”

以上就是本期人工智能商业内参的全部内容,也再次祝大家假期愉快。

【视野】揭秘 Google 的播客计划、激光雷达专利盘点、阿里的芯片野心等

各位朋友,随着 DailyMe 开始运行,本着宁缺毋滥的筛选原则,「视野」专栏的更新可能不会太频繁,但好文章的推荐不会缺席。

本周的「视野」专栏,你将看到最近值得阅读以及收藏的文章:

  • Google 野心勃勃的声音计划;
  • 盘点激光雷达专利市场;
  • Uber 对于汽车定位导航的新思考;
  • 魅族沉沦的四年;
  • 阿里巴巴与「中国芯」;
  • 欧洲科学家呼吁建立 AI 实验室的公开信;

  • Google 野心勃勃的声音计划。从搜索产品的角度来看,Google 对于声音的收录也是非常不完善的,比如,我们现在几乎不能搜索某个播客节目的某段嘉宾发言,但这种状况或许正在被改变,推荐两篇独家文章,从可以被搜索的声音到 Google 接下来的播客产品计划,在苹果 2017 年推进iOS 播客项目后,也让我们有理由去期待 Google 会在这个领域有哪些惊喜。(文章1文章2
  • 盘点激光雷达专利市场。2018 年的自动驾驶正在进入一个全新发展阶段,国家层面的政策支持让资本、创业公司和巨头看到了新的机遇,但就目前来看,激光雷达依然是自动驾驶汽车不可或缺的重要元器件,推荐一篇盘点激光雷达专利的文章,详细介绍了这个领域每个玩家手中的底牌。(链接
  • Uber 对于汽车定位导航的新思考。尽管 Uber 估值下滑很多,但这个公司还是有众多优秀的科学家在研究一些非常有前瞻性的事情,比如这篇发表在 Uber 官方博客上的文章,就聚焦在汽车的定位导航领域,重新思考了 GPS 的优势和不足,并提出一种全新的补充框架,这个框架对未来的自动驾驶定位系统也有诸多启发意义。(链接
  • 魅族沉沦的四年。品玩网是国内少数还会做一些深度报道的科技媒体,这篇试图还原魅族四年沉沦的文章切开了一个角度,让外界看到魅族这几年沉沦背后的故事,不过这篇报道的信源并不多,更多的是底层员工所看到的故事,如果能找些高层的信息,会让整个报道显得更有说服力。(链接
  • 阿里巴巴与「中国芯」。芯片讨论还在持续,上周阿里巴巴宣布全资收购中天微,也让无数小粉红看到了「中国芯」崛起的希望,而这篇来自深科技的文章比较客观地分析了此次收购的意义,同时也是我认可的一个观察:这是对阿里巴巴云服务的补充。 站在行业的角度去看,阿里此举也是包括 Google、FB 等互联网巨头所在做的事情,减少对于上游厂商的依赖,不仅可以减少风险,避免类似中兴这样的事件发生,还可以进一步降低成本。(链接
  • 欧洲科学家呼吁建立 AI 实验室的公开信。来自英、法、德等欧洲国家的科学家们发出一封公开信,呼吁建立欧洲 AI 实验室(European Lab for Learning and Intelligent Systems, 简称为 Ellis),这封公开信言简意赅地介绍了欧洲人工智能领域的现状和挑战,之所以推荐这封信,我希望诸位朋友不要沉浸在人工智能的中美争霸的语境里,欧洲的优势也不容小视。(公开信链接

智能音箱大战:苹果和小米越来越像、亚马逊 2017 年做对了什么、为什么百度、FB要给音箱加上屏幕

这期的「洞察」专栏,我将着重围绕智能音箱的格局和变数,讨论以下几个问题:

  • 为什么苹果和小米在智能音箱布局上如出一辙?
  • 亚马逊 2017 年做对了那些事情?
  • Google 和阿里巴巴的智能音箱困局
  • 为什么百度、FB 要给音箱加一个屏幕?

生态型的打法:高价苹果与廉价小米

上周,苹果发布了 HomePod 第一个官方视频(点击这里查看),视频的主题是一个职场女性,在经历了一天的忙碌、并乘坐拥挤地铁回家后,用 Siri 唤醒 HomePod 来播放音乐,随着音乐的节奏,整个人进入到一个全新的状态。

img

这个时长 4 分钟的广告片由 Spike Jonze 担当编剧和导演,后者也是探讨人机关系电影《Her》的导演。熟悉苹果产品价值观的朋友或许可以理解,长久以来,苹果所秉承的,是个人电子消费品之于人类生存的积极意义,比如在这则广告里,HomePod 的出现,正是要释放都市人,尤其是都市女性的压抑。

HomePod 显然是苹果 2018 年第一季度最受人关注的产品,其「难产」之路也不禁让人怀疑,到底这款智能音箱里暗藏着什么秘密武器,会让苹果史无前例地推迟一款产品的发布时间。

当 HomePod 正式发布后,外界的评价也格外有趣。比如,绝大多数的媒体都认可了 HomePod 的音质,而几乎所有的媒体都会将 HomePod 和亚马逊的 Echo 以及 Google Home 作为类比对象,最终得到的评判结果则是:HomePod 是一款「刚刚及格」的智能音箱。

对此,a16z 合伙人 Benedict Evans 在 Twitter 上不禁感叹,如此类比实在是愚蠢至极:

So much HomePod silliness
If Apple wanted to make a $10 speaker-box with Siri embedded, it could.
If Amazon wanted to make a $350 Echo with good sound, it could.
Instead, they have different theses, from different market positions & strategies, that produce different products.

Benedict 还进一步解释了两者的区别,两者根本不是同一个类型的产品:

This isn’t iOS versus Android - it’s a bicycle versus an SUV. These aren’t competing products. They’re different answers to different questions, based on different views of what’s going to happen.

Benedict 的观点可谓一针见血。HomePod 作为又一款具有苹果特色的生态产品,其面对的应用场景和亚马逊 Echo 或 Google Home 完全不同。苹果要将 HomePod 作为新的生态延伸,如下图所示,苹果在个人、工作场景实现了全覆盖,并在 2017 年加大家庭领域的布局(推出 4K 版的 Apple TV),HomePod 将作为 TV 产品的重要补充。

img

另外,在 HomePod 的官方说明中,我们也能从中窥见一二:

img

从这个意义上说,HomePod 要解决的,是 iOS 设备拥有者对于智能音箱的消费需求,苹果天然将这部分人群的需求简化为了语音操控与音乐享受,由此形成了这款产品的显著特点:音质爆棚、「智商」为零。

事实上,这种生态级的玩法也是小米 AI 音箱的套路,这款只有 299 元的小米 AI 音箱发布于 2017 年 8 月,借助米家复杂、多样化的产品体系,这款音箱在功能上、实用性上有了巨大提升,而且,随着你手里的米家设备越来越多,音箱的「智能性」也会越来越高。

如果从另一个角度去理解所谓生态级的打法,以苹果为例,除了 iPhone、iPad 这样的高价产品,其他苹果的硬件产品都是「应用内购」。小米也类似,所不同的,可能就是便宜。

入口型的打法:亚马逊、Google 与阿里巴巴

亚马逊、Google、阿里巴巴,尽管都是全球领域的互联网巨头,但回忆过往,尤其进入移动互联网时的阵痛还记忆犹新。

以亚马逊为例,早在 2011 年 9 月,亚马逊也曾向苹果的 iPad 发出过挑战。当时亚马逊宣布推出一款名叫 Kindle Fire 的平板电脑,在贝佐斯的小算盘里,当用户转向移动设备之后,亚马逊理所当然应该向用户提供更方便的购物体验。于是我们也看到了这样一款设备:Kindle Fire 屏幕尺寸为 7 英寸,搭载亚马逊深度定制的 Android,整合了绝大多数亚马逊的在线服务,售价为 199 美元。

img

坦率说,Kindle Fire 的表现并不算差,在那个 iPad 常年维持在 499 美元的历史时代,Kindle Fire 背靠亚马逊这座大山,在小尺寸屏幕、低价、海量内容的多重独门利器的包装之下,一度抢占了不少的市场。2012 年 8 月的一份数据显示,第一代 Kindle Fire 的市场占有率达到 22%,同时期的 iPad 为 50%。

可即便如此,在全球平板电脑市场逐渐进入低迷阶段后,Kindle Fire 的境遇也好不到哪里去,这也让贝佐斯开始思考推出新设备的可能性,随后,亚马逊在 2014 年发布 Kindle Fire 手机,然而这却是一个完全失败的产品。从定价的角度来说,这款手机的价格看起来了当时的 iPhone 5S(高达 649 美元),这也和亚马逊一贯以来的低价策略形成了鲜明的反差。《财富》杂志在其发布两个月后就宣布 Kindle Fire 已经失败

Two months after Amazon released the Fire phone, it’s fair to call the device a disappointment.

img

颇具讽刺意义的是,Kindle Fire 系列(包括平板电脑、智能手机)都来自于亚马逊著名的 Lab126,这曾是 Kindle 阅读器的诞生地,但却在平板电脑、智能手机战场折戟,而在 2014 年年底的时候,这个实验室推出了第一代 Echo,Bloomberg 记者 Joshua Brustein 写过一篇深度挖掘 Echo 诞生故事的文章。

Echo 的出现,解决了亚马逊在移动互联网时代流量恐惧的难题,当智能手机市场进入瓶颈增长期的时候,亚马逊悄然将一款款廉价的智能音箱布局到了家庭中。

直到 2016 年年末,Google 才有了对抗 Echo 的第一款产品,Google Home。但到了 2017 年,亚马逊紧锣密鼓地发布了一系列新品,再一次将 Google 甩在了身后。如下图所示,亚马逊其实就做了一件事情:利用「机海战术」,将 Echo 系列覆盖到不同消费层次的人群,最终形成绝对的流量入口优势。

img

而 Google 也在 2017 年推出两款智能音箱,面向价格敏感性用户的 Home Mimi(49 美元) 以及针对价格不敏感群体的 Home Max(399 美元),但在经历了一个疯狂的购物季节后,这两款产品的走向却有两个不同的结果,Home Mini 为 Google 拿下了 9% 的市场份额,而 Home Max 几乎可以忽略不计。

![]()

在国内,阿里巴巴 2017 年 7 月才加入这个智能音箱战场,第一款智能音箱天猫精灵的售价 499 元,在当时小米 AI 音箱还未发布时已是行业最低价,而真正推动天猫精灵普及的,则是去年双十一期间的 99 元优惠活动。

上述案例进一步显示了,价格因素在这场争夺战中的重要影响。对于一款新型设备来说,如果没有苹果一样的生态级统治力,价格才是其可以普及的主要方式;其次,海量的机型选择也可以覆盖更多样化的消费人群,反过来还能带动出货量,接下来的 2018 年,Google、阿里巴巴如果要想有作为,必须走上这条道路。

为什么都在押宝屏幕?

几乎所有的互联网公司,都面临一个流量从哪里来的困境,与亚马逊、Google、阿里巴巴类似,百度也面临这样的难题。2017 年,百度在智能音箱领域砸出一个超过 1600 元的「高端产品」—— Raven H,这款长期需要预定的音箱终于在上周有了现货,搜狐科技的报道称:

去年11月在百度世界大会上发布的渡鸦raven H音箱也开始现货销售。此前尽管已经有预定的用户收到了产品,但官网该产品一直需要4到6周的到货周期。

与此同时,百度继续整合内部资源,成立了「智能生活事业群组(Smart Living Group,以下简称SLG)」,百度集团总裁兼首席运营官陆奇亲自挂帅,下辖硬件设计和操作系统(DuerOS)两大部门。

李彦宏更是在两会期间表示:下月百度将推出带有屏幕的音箱。

这是一个颇不寻常的举动,就目前来说,市面上主流带有屏幕的智能音箱只有两个:亚马逊的 Echo Show 和 Echo Spot。我曾在去年 Echo Show 发布后写的会员通讯里,详细分析了 Echo Show 的「阳某」,其中的一个关键点就是 Echo Show 官方广告里的家庭定位。

整个广告围绕家庭展开,没有过多的技术细节描述,广告的过程并非要让世人对亚马逊技术报以掌声,而是在创造一种全新家庭生活的氛围。产品经理出身的 Chris Messina 更是将广告里出现的所有人物列了出来,如下图所示:

img

这些人物选角的细节和广告里的多个场景设计,比如年轻夫妻照看双胞胎的场景以及小女孩和爷爷一起画星空的场景,事实上都是亚马逊 Echo Show 的用户群体定位,那就是,美国的中产阶级白人群体——他们受过良好教育、有着相对稳定的工作和收入、看重家庭观念,更希望能够通过技术带来的便利优势,让家庭成员之间的联系更加紧密和便捷。

为此,Echo Show 还提供了一个名叫「Drop in」的功能,亚马逊的官方解释是这样的:

…for the special cases when you want to connect with your closest friends and family. For example, you can drop in to let the family know it’s time for dinner, see the baby’s nursery, or check in with a close relative.

你可以将其理解为一个类似对讲机的功能,再开启该功能后,你可以随时查看其他家庭成员家里或房间里 Echo Show 相机拍摄的画面,比如广告里年轻夫妻要查看婴儿房里两个啼哭孩子的时候,就使用了这个功能。

img

这是一个颇具野心也很具「侵略性」的功能,它大大强化了 Echo Show 的家庭定位,你不大可能将「Drop in」用在普通朋友之间甚至情侣之间,但在家庭成员之间,这个功能却大有用途。广告里至少有两个「Drop in」功能的演示,其场景设计都是围绕家庭成员内部的沟通。

无独有偶,今年年初,社交巨人 Facebook 的智能音箱计划也被爆出。根据 Cheddar 的独家消息,作为 FB 首款硬件设备,Portal 将肩负着对抗亚马逊 Echo Show 系列的重任:

The device is designed to work in the home and represents Facebook’s first serious foray into selling consumer hardware, people familiar with the matter said. Rather than position the device as a smart assistant akin to Amazon’s Echo speakers, Facebook intends to pitch Portal as a way for families and friends to stay connected through video chatting and other social features.

而今年的 CES 期间,除了一大堆类 Echo Show 的硬件设备展示外。Google 也悄然收购了一家名叫 Redux 的公司,该公司的技术既可以应用在智能手机的扬声器上,还可以将屏幕改造成声音播放设备。这意味着,Google Home 这款智能音箱未来可能拥有一个可以个发出声音的显示屏[1],从而实现语音、视频的双重交互。

这意味着,进入 2018 年,智能音箱的竞争将在声音之外出现新的变量,一款屏幕不仅会带来全新的交互方式,同时还将融入更多的服务并覆盖更多的用户群体,一如我在去年评价 Echo Show 的意义:

尽管依然需要通过「Alexa 」来唤醒,但有了一个屏幕,也让整个交互的反馈机制得以视觉化的呈现,「屏幕」是从 PC 到智能手机时代最深入人心的交互媒介,如果说早前纯粹依赖声音的 Echo 产品是一种年轻人面向未来的体验,那么现在拥有屏幕的 Echo Show ,则更具普遍和大众意义,这也是为什么 Echo Show 广告里出现如此多的老年人和小孩的原因。


  1. 事实上,Google 已经开始将 Google Assitant 武装到包括 LG、西门子在内的智能家居的显示屏上。  ↩

被区块链夺去关注后,人工智能还有四个看点值得关注

过去的这个中国春节并没有重磅的突发新闻,也让很多科技媒体人,当然也包括我,有了喘口气的时间,陪伴家人度过了一个开心的假期。

但一个很残忍的事实依然不能忽视:2018 年几乎已经过去了 1/6。而 2018 年的头两个月里,区块链已经完美「代替」了人工智能的角色,成为全民热议的话题——也正如我在早先几篇会员计划里所言,摆脱了聚光灯效应后,我们可以更理性地去分析人工智能到底能给我们带来什么。 (更多…)