← Dailyio 历史存档 | 搜索

分类: Open Access

共有 354 篇文章

华为 P20 的样本效应、FB 的自救措施、银行业 AI 的处境以及 TED 2018 的 AI 议题

TL;DR。 本周的「人工智能商业内参」,你会看到:

  • 华为 P20 如何成为 AI 与智能手机结合的样本产品?
  • FB 的人工智能自救措施为何没人买账?
  • 人工智能在银行业的现实与梦想;
  • TED 2018 上的人工智能;

号外:以拍照来看,华为 P20 是 AI 与智能手机结合的样本

根据 Canalys 的中国智能手机市场报告,2017 年中国智能手机销售额出现历史上首次下滑,同比 2016 年下滑了 4%。

而自 2017 年下半年以来,人工智能与智能手机的结合,成为整个手机行业的一剂强心针。2017 年 9 月初,华为率先发布一款集成神经网络处理能力的麒麟 970 处理器;9 月中旬,苹果推出的新一代 iPhone 里,也加入了神经网络引擎;10 月,搭载麒麟 970 的 Mate 10 全球发布,由此也开启了人工智能驱动智能手机变革的全新故事章节。

不过值得注意的是,撇开市场宣传的各种话术,人工智能带给智能手机的变化还非常局限。一方面,受限于手机硬件的性能和功耗,不可能完成大规模的机器学习处理。另一方面,则是如何将机器学习和手机应用场景结合起来。

目前来看,手机拍照依然是各家的重点领域。

本周,华为在国内正式发布了 P20 系列手机,在这场名为「眼界大开」、长达两个小时的发布会上,智能手机部分的介绍至少有一个半小时,而介绍 P20 的拍照,又占据了其中的一个小时。

事实上,在上月海外发布之后,社交媒体上对于 P20 拍照性能有了诸多讨论,很多人会关注 P20 的三个摄像头,并以「底大一级压死人」的行话来凸显 P20 此次相机的硬件提升,但有一点却被忽略了,那就是去年那颗麒麟 970 处理器给拍照带来的算法优势。

我曾在麒麟 970 发布现场体验到这款处理器的拍照算法,他们给出的测试环境也是一个密闭的房间,模拟城市夜景环境,用一台搭载麒麟 970 的工程机(看不出型号)和一台 iPhone 8P(那时 iPhone X 还未发货)来对比夜拍效果,其结果如下图显示,麒麟 970 完胜。

img

由于当时外界还在期待 Mate 10 系列手机,现场很多人,也包括我,误以为这是 Mate 系列的特性。不过随后的 Mate 10 系列尽管拍照有了较大提升,但在硬件层面——无论是镜头还是感光器件——都没有真正意义的更新。直到 P20 发布,华为将硬件(三镜头加手机行业目前最大的感光元件)与软件(麒麟 970 里的图像处理能力)结合起来,最终成就了这款或许是目前为止可应对各个场景的拍照手机,

有评论指出华为 P20 的最大成绩其实是做成了手机拍照的标杆,我更愿意将其作为智能手机与人工智能结合的样本——只有实现软硬件的结合,才能真正释放人工智能在移动设备上的各项能力。类似地,在本周另一场围绕人工智能与智能手机结合的沟通会上,高通和 Vivo 也表达了类似的看法,在目前高通的产品线中,「AI Engine」被加入到多个处理器里,比如骁龙 660,爱范儿的报道:

虽然架构没有变化,但基于芯片中的 CPU、GPU 以及一系列 SDK ,高通选择将 AI 应用中的任务分配给芯片中的不同部分,以有效帮助开发者对自己的 AI 程序进行优化。
……
有了高通这套方案,哪怕去年的骁龙 835 和 660 这一批芯片均没有真正意义上的人工智能协处理器,但现在第三方开发者和手机厂商都可以在这些芯片上运行 AI 应用了。

高通这种做法,对于 Android 开放生态来说更加取巧,也可以更灵活地处理多家手机品牌的弹性需求。

高通的 AIE 的软件(算法)之外,Android 厂商则全力研发硬件,或在感光元件或在镜头上作出更多创新,这也会成为 2018 年 Android 市场的特有图景。

那么问题来了,下半年新 iPhone 会带来怎样的软硬件结合后的拍照体验呢?

业界:FB 与今日头条的自救、Open AI 新纲领

本周 Facebook 和今日头条都迎来一个「艰难时刻」,当大洋彼岸的扎克伯格坐到美国参议院听证会时,张一鸣的那一夜一定难熬,就像他在「道歉信」里所言的「一夜难眠」。

作为都是依托算法的内容平台,FB 和今日头条所做的自救措施则有些许不同。扎克伯格在听证会上表示会持续推进人工智能应对仇恨言论的研发工作

Zuckerberg said that the company is increasingly developing AI tools to flag hate speech proactively, rather than relying on reactions from users and employees to flag offensive content. But according to the CEO, because flagging hate speech is so complex, he estimates it could take five to 10 years to create adequate A.I. “Today we’re just not there on that,” he said.

但对于当下,扎克伯格承认,还需要大量人类员工来解决这类问题:

For now, Zuckerberg said, it’s still on users to flag offensive content. “We have people look at it, we have policies to try and make it as not subjective as possible, but until we get it more automated there is a higher error rate than I’m happy with,” he said.

为此,FB 将在今年年底将内容审核人员扩充到 20000 人。这同样也是今日头条本周所承诺的改进计划,张一鸣表示,「强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。」

不过,针对 FB 的人工智能优化计划,并没有多少人买账,Quartz 的报道指出,扎克伯格的承诺并不靠谱:

“Mark Zuckerberg is being realistic when he says ‘we will have A.I. tools that can get into some of the nuances’ in 5-10 years, but there are a lot of nuances and not all of them will be able to be automated away,” Babakar says.

Other researchers disagree on Zuckerberg’s timeline, with the disclaimer that technological predictions are always difficult to make.

而在 MIT 科技评论看来,这项计划面临三项难题,其中谈到,这本身就是一个军备竞赛:

Even if progress is made in natural-language understanding, the purveyors of hate and misinformation could well adopt some of the same tools in order to evade detection.

同样在本周,OpenAI 发布新的研究纲领,这份并不算太长的宣言,包括人工智能研究的出发点、长远研究的安全措施以及开发合作的基调,其核心是再一次强调,人工智能是一项全人类的福祉

OpenAI’s mission is to ensure that artificial general intelligence (AGI) — by which we mean highly autonomous systems that outperform humans at most economically valuable work — benefits all of humanity. We will attempt to directly build safe and beneficial AGI, but will also consider our mission fulfilled if our work aids others to achieve this outcome.

尾巴:Google 利用深度学习分离声音、阿里继续「买赛道」、AI 与银行

Google 两位工程师本周发布了基于视觉、声音识别模型的论文,通过利用深度学习结合人脸动作识别,可以将两个同时说话的声音提取出来。这项研究的落地场景非常多,比如应对多人同时发言时的语音识别和自动翻译。

商汤科技本周完成一笔 6 亿美元的融资。此次融资中,阿里巴巴集团领投,新加坡主权基金淡马锡、苏宁等投资机构和战略伙伴跟投。目前商汤科技在人脸识别、图像识别、医疗影像以及深度学习算法上拥有不小的影响力。外界普遍认为,投资商汤科技,将是阿里巴巴又一次「买赛道」的战略部署,要知道,阿里巴巴系的蚂蚁金服也投资了商汤科技的竞争对手旷视科技。

人工智能与银行。《金融时报》报道了人工智能在银行的应用前景,这句话可以说是点睛之笔:「The industry is taking a cautious approach in spite of excitement about new technology。」

TED 2018,人工智能成了与会者的消极论据。本周的 TED 2018 上,面向人类未来的几个重大议题都少不了人工智能的身影,《人类简史》作者 Yuval Noah Harari 描述了人工智能带给政府和大企业的无穷能力:

The greatest danger that now faces liberal democracy is that the revolution in information technology will make dictatorships more efficient than democracies,” Harari says. With the rise of AI, centralized data processing could give dictatorships a critical advantage over relatively decentralized democracies. So what can we do to prevent this possibility?

而今年人工智能畅销书《Life 3.0》的作者 Max Tegmark 也进一步强调了人类需要认真面对人工智能:

As he sees it, humanity has two options as we move closer to a world where artificially intelligent machines can do everything better and cheaper than we can. Option #1: We could be complacent and not worry about the consequences as we build our technology. Or, Option #2: We could be ambitious and envision a truly inspiring future, then figure out how to steer towards it.

颇为遗憾的是,没有一位演讲者拥有人工智能从业背景,他们的很多观点并不新鲜,而论据的选择,也有点「心机」,其最终传递出来的结论,或许并不足以证明人工智能的对与错。

砰然落地的今日头条、愚蠢且坏的批评以及后续影响

写在前面:上一周赶上搬家,还在搬运东西的时候夹伤手指,没有时间也无法双手码字,导致会员计划暂停了一段时间,向诸位致以歉意,随着手指的伤渐渐好转,接下来会陆续恢复正常的更新节奏。


我曾在去年一期会员通讯里提到,今日头条正在和 Facebook 越来越像,本周,这两家公司也遭遇到一个相似的场景:道歉。

北京时间 4 月 11 日凌晨,扎克伯格参加美国国会参议院的听证会,就 FB 的用户数据保护和隐私问题接受参议员的质询,整个听证会从扎克伯格的道歉开始:

We didn’t take a broad enough view of our responsibility, and that was a big mistake. It was my mistake, and I’m sorry……I started Facebook, I run it, and I’m responsible for what happens here.

接下来,44 名参议员轮番向扎克伯格发问,尽管多数问题简单而无知,但这番问答,还是彰显出程序正义的要义。

不过,今日头条的张一鸣则没有这么幸运。4 月 10 日下午,广播电视总局发出一个简短声明

国家广播电视总局在督察“今日头条”网站整改工作中,发现该公司组织推送的“内涵段子”客户端软件和相关公众号存在导向不正、格调低俗等突出问题,引发网民强烈反感。为维护网络视听节目传播秩序,清朗互联网空间视听环境,依据相关法规的规定,总局责令“今日头条”永久关停“内涵段子”客户端软件及公众号,并要求该公司举一反三,全面清理类似视听节目产品。

4 月 11 日临晨,张一鸣发表公开道歉书,就「内涵段子」被关停以及最近今日头条所遭遇的央视批评危机作出表态,道歉书的开头这样写道:

我真诚地向监管部门致歉,向用户及同事们道歉。 从昨天下午接到监管部门的通知到现在,我一直处在自责和内疚之中,一夜未眠。

今日头条将永久关停“内涵段子”客户端软件及公众号。产品走错了路,出现了与社会主义核心价值观不符的内容,没有贯彻好舆论导向,接受处罚,所有责任在我。

自责是因为辜负了主管部门一直以来的指导和期待。过去几年间,主管部门给了我们很多的指导和帮助,但我内心没有真正理解和认识到位,也没有整改到位,造成今天对用户不负责任的结果。

这份道歉书引发的讨论随后在社交媒体以及各大科技媒体上持续发酵,但我觉得需要区分出几点:其一,今日头条遭遇如此境遇,值得整个中国互联网行业的同情。在一个政治话语权大于一切的大背景下,在一个「一朝天子一朝臣」的潜规则里,失去「主管部门指导」的互联网公司,今天可以是今日头条,明天可以是百度,后天当然还有可能是阿里巴巴。

其二,社交媒体上的一些讨论,很多人会斥责今日头条各个产品都很 Low,比如此次关闭的「内涵段子」,因为里面充斥着大量的图片、Gif 而被人鄙视,我也看到有人抛出了所谓文字内容一定比图片、视频更有逼格的说法。

且不论这些用户到底对当局管制互联网有怎样的误解或者无知,仅以互联网的发展方向来看,图片、视频内容都是一个正确的方向。一方面,图片、视频内容进一步降低了用户消费互联网的门槛,快手、抖音的成功,就是因为移动互联网进一步普及、人手一部智能手机,从而带来了更低门槛的内容消费热潮。

另一方面,整个产业链也为图片、视频的下一轮增长做足了功课。手机厂商的相机功能越来越好,神经网络处理单元也进一步增强了手机的图像处理能力,基于生成对抗网络(Generative adversarial networks, GANs)的机器视觉处理,在机器自动生成图像(或者伪造图像)上不断取得突破……

事实上,互联网内容发展的路径和过往人类历次媒介的变革路径没有本质的变化,文字,不管是书写还是印刷抑或是在线,始终是门槛最高的内容消费产品,而图像、视频则几乎改变了上世纪后半叶人类认知世界的基础,比如那副《全球概览》封面上的地球照片,让多少人建立起了对地球的第一认知。

img

因此,上述这些批评若不是无知(包括对当局的无知以及对互联网行业发展的无知)便是坏,或是被招安后为当局政策辩护的坏,或是被人性深处「再踩上一脚,使其无法翻身」的坏,请尽量远离这样的所谓「批评者」。

第三,此次事件的后续影响或许可以从张一鸣承诺的解决方案里找到端倪。比如这一条:

进一步深化与权威媒体合作,提高权威媒体内容的分发,保证权威声音有力传播。

这意味着党媒将全面占领今日头条,同时还会有各大权重以及更多的推荐位,快手创始人宿华上周也在写了封道歉信后,其首页也出现了大量国字号的账号,接下来其他的内容平台都将采用上述做法。

另外,张一鸣还承诺,「强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。」这个做法,事实上否定了今日头条对于自己的定义,也将对今后新的内容算法创业产生消极影响,算法可以没有对错,但算法一定要有政治意识。

《三体》里有一句话,尽管刘慈欣多次强调这句话与当下无关,但很多时候,却是最想发出的感叹:「在中国,任何超脱飞扬的思想都会砰然坠地的,现实的引力太沉重了。」

非典型性网盘 Dropbox 启示录

上月底,沉寂长达一年的纳斯达克股市终于迎来一个令人欣喜的新力军,创业长达 11 年的云存储公司 Dropbox 终于敲响了上市的钟声。

市场的反应也相当积极,上市首日 Dropbox 的股价盘中一度冲高至 31.60 美元,较 21美元的 IPO 价格上涨大约 50.5 %。接下来几天,如下图所示,股价曾接近 34 美元,尽管稍有调整,但市值维持在 120 亿美元之上。

img

根据多个媒体之前的报道,Dropbox IPO 前夕就受到众多投资者的追捧,其 IPO 发行价也从最早的每股 16 美元,一路上涨到周五上市时的 21 美元,即便如此,其股票也被超额认购,展现出市场对于这家公司的良好预期。

这也留个市场以及云存储从业者们一个大大的疑问,为什么这样一个「慢公司」(从成立到 IPO 花了 11 年),做着一个几乎所有巨头们(包括苹果、Google、微软)几乎一样的云存储服务,能够一路杀出重围,还交出了一份满意的财务报表,并最终上市成功?

或者换个角度发问:Dropbox 这家公司到底给这个行业带来哪些启示?

免费增值的真谛是什么?

自成立至今,Dropbox 的商业模式没有发生本质变化,依然遵循着免费增值的商业模式。这个模式的核心有两点,其一是免费,这是几乎互联网公司获取用户的普遍方式,十年时间(2007——2017)内,Dropbox 的用户规模从 0 发展到 5 亿用户。

其二则是增值付费,Dropbox 的付费转化率高达 2%,这意味着其付费用户规模为 1100 万,根据 Dropbox S-1 报告中的几个数字,平均每人每月付费 9.3 美元,其 90% 的收入都源自于自服务渠道,2017 年的收入达到 11 亿美元。

硅谷风险投资人 Tom Tunguz 将 Dropbox 称之为「The King Of Freemium」,他尤其对该公司的成本控制赞不绝口:

More impressive still: the company has managed to nearly double revenues while decreasing the amount they spent on COGs annually. COGs stands for cost of goods sold. Images of Dropbox, which stores billions of files, hard disks and storage are the principal component of COGs.

This decrease is driven by user policy changes that affect users who have been inactive for a year or more, and a shift to operating their own data centers instead of using cloud providers.

而且,与其他 SaaS 公司不同,Dropbox 将更多的收入用于工程和研发,而非销售和营销,如下图所示,Dropbox 的销售效率非常高。

img

事实上,免费增值也是国内云存储企业的基本商业模式。不管是成立于 2011 年的坚果云,还是后来进入云存储行业的百度云、微云以及其他已经消失的云存储公司,他们都无力例外从一开始就采用了这样的商业模式。

img

然而正如上文所言,Dropbox 的免费增值模式包含两个基本要素,国内绝大多数公司只做到了「免费」,却无法突破「增值」的魔咒,而云存储又是一门烧钱的生意,这也不难理解为何过去几年国内众多网盘、云存储服务消失了。

一场场网盘大战之后,「幸存」下来的几个公司中,百度云、微云自然不用多说,其背后都有一个不差钱的母公司。

云服务到底在拼什么?

2013 年开始,国内的云服务市场曾掀起一场场容量大战,也正如上文所言,很多企业以免费、大容量的噱头,为自己的网盘服务吸引眼球和流量,从早年的 5G 免费空间到后来的 10G、100G 甚至 1T、2T,一时间好不热闹。

巴菲特曾有一句话:只有潮水褪去,才会发现谁在裸泳。仅仅在 2016 年 4 月到 11 月的 7 个月时间内,国内前后有 8 家网盘公司暂停个人服务或关闭。

纵观这些网盘产品,其本质上都是数据存储,这是一种毫无技术门槛的生意,这也不难解释为何在短短几年就出现几百个网盘。但提供网盘服务的成本非常昂贵。无论是带宽、硬件还是维护费用,都是一笔不小的支出。国内排名靠前的网盘服务用户动辄过亿,巨大的用户量意味着更加庞大的成本。

有媒体当时指出一点:这些暂停或关闭的云存储公司都没有盈利,但并非没有盈利的可能性。

Dropbox 起步于云存储。彼时,用户注册后,可以免费享用 2G 的免费空间,可实现多台设备之间的数据同步。当 2011 年,乔布斯代表苹果,向 Dropbox 伸出收购的橄榄枝,被拒绝后他曾抛出一个名言:「Dropbox 只是一个功能,而不是产品。」

img

苹果后来推出了 iCloud,不久之后,Google 发布 Google Drive,但这些产品本质上都是一种数据存储服务,iCloud 解决的是苹果不同设备上的数据同步,Google Drive 不过是 Google 办公套件的补充,但 Dropbox 却让自己成为了用户与不同应用之间的「数据中心」。

这对用户和应用开发者们意义重大。一方面,Dropbox 在不同终端上都有完善的覆盖能力,能够减少用户在不同设备上同步数据的切换成本;另一方面,大量应用开发者,利用 Dropbox 的开放接口,可以快速搭建应用的数据存储渠道,极大地节约了成本。

更准确的说,Dropbox 颠覆了网络存储仅仅是「存数据」这样一个简单的逻辑,而是让数据成为一种资源,鼓励应用开发者和用户,重新发掘数据的价值。

这个逻辑显然和百度网盘、微云的产品理念是不同的,无论是百度网盘和微云,更侧重用户的备份,其大容量甚至不限量的空间更适合诸如电影、照片的存储,也因此,百度网盘、微云和 Dropbox 是完全不同的两类产品。

如今,Dropbox 已经从苹果、Google 等巨头的包围里杀出一条「非典型网盘」的道路,从而进一步佐证了其战略的正确性,

围绕数据还能做些什么?

从 2013 年开始,Dropbox 鼓励第三方应开发者将 Dropbox 接入到自己的 App 中,从社交网络到邮件再到游戏数据,这让用户在不同设备的应用数据同步变得足够简单,而随着用户不断在 Dropbox 里存数据,事实上也形成了一种粘性,也有了付费的可能性。

这意味着,存储真的只是 Dropbox 的一个「功能」,而围绕数据,Dropbox 构建一整套连接用户、应用的生态。

第一,数据输入和管理。历史上,Dropbox 有过多次并购经历。除却 Mailbox 这样一个不太成功的产品,近几年来,Dropbox 都在围绕数据输入和管理来做展开并购计划。比如在 2014 年,Dropbox 一口气完成七笔收购,包括 3D 照片公司 Bubbli、企业数据分析公司 Parastructure 等等。

这些并购,让 Dropbox 具备了更大规模数据的触达能力,接下来就是围绕数据管理的创新。

很多 Dropbox 和坚果云用户会将增量备份和历史版本作为其杀手锏功能。前者,保证了大文档修改后的同步速度,后者,则为文档修改提供了一剂「后悔药」。

在面向企业团队的产品里,Dropbox 还开发了数据的智能同步功能(Smart Sync),官方的介绍是「仅供在线访问的内容会显示在电脑上的 Dropbox 文件夹中,不过不占用文件原本所需的空间。」

其二,数据流动与共享。主要包含两个方面,一是个人数据的共享,比如个人用户将一个文档分享给朋友,另一个层面则是企业团队内部的文档共享。

对于个人数据分享,Dropbox 可以灵活设置单个文档以及整个文件夹的共享,还可以进一步设置文档的查看或修改权限。

而针对企业客户,Dropbox 推出了团队协作平台 Paper,着是一款运行在浏览器里的 Web 应用(移动平台上有客户端),用户进去之后会发现自己不但可以创建在线文档,也可以邀请其他人和自己一起编辑。

img

很多人会将 Paper 与 Google Doc 对比,但这多少有失公允,这更像是一个团队整理文档的工具,Dropbox 希望用户通过 Paper,进一步挖掘用户在 Dropbpx 里的数据价值,一如官方做出的解释:「……teams have really wanted a single surface to bring all of those ideas into a single place. 」

尾巴

Dropbox 自创立到现在,已经过去了十一个年头。这十一年里,互联网从 PC 互联网时代步入移动互联网时代,智能手机取代 PC,成为每个人手中的「超级计算机」;十一年里,云存储的战场上你来我往,巨头们打造自己的封闭花园、创业公司们死的死、跑的跑,云存储的商业模式也被人诟病。

然而不管形势怎样变化,围绕数据的管理和流动才是云存储的核心,这考验的是各家公司的技术能力、运营能力以及生态整合能力,谁能把握上述几点,谁就能坚持到最后,Dropbox 的上市,也将会成为今年云存储市场的一剂强心剂。

微软重组的野心、李彦宏的「隐私换便捷」争议以及阿里和华为的物联网赛道之争

tl;dr,本周的「人工智能商业内参」,你会看到:43 岁的微软如何定义自己的未来、李彦宏的争议言论反映了互联网行业怎样的分裂现实、法国政府人工智能规划、阿里进军物联网后,华为的欢迎词是什么以及 Waymo 定义的自动驾驶未来……

微软重组的野心

本周,43 岁的微软迎来近年来一次重要的架构调整,根据其 CEO Satya Nadella 的内部邮件,微软重新调整了三个主要部门,包括:

  1. 体验和设备部门,负责 Windows、Office、硬件等;
  2. 云和 AI 部门,负责 Azure 云服务、企业服务,并将 Windows 一些涉及到企业服务的产品以及微软应用商店整合进来,还包括 AI 和虚拟现实等新技术应用落地项目;
  3. AI 与研究部门,更侧重人工智能的基础研究;

这个重组计划意义重大。一方面,重组后,过去 40 多年来微软核心项目—— Windows 和 Office ——正在被「边缘化」,作为调整的一部分,Windows业务主管、微软元老特里·迈尔森(Terry Myerson)也会离职。

不过,正如 The Verge 一篇评论所言,Windows 并非「死亡」(dead),而是不再重要,这个变化的背后,是行业变化的大趋势,比如软件订阅的兴起,比如云端服务的火热:

Windows is being adapted for new devices and scenarios, but it’s not the core of Microsoft’s business anymore and hasn’t been for years. Nadella says “the future of Windows is bright,” but in the same sentence he says Microsoft will “more deeply” connect Windows to its Microsoft 365 offering. Microsoft 365 lets companies purchase Office and Windows together in a single subscription.

此次重组的另一意义,则是微软将人工智能的基础研究和应用落地分成了两大部门,并将云计算与人工智能落地牢牢绑定在一起,这成为微软未来的重要战略方向。

与之遥相呼应的,则是今年 2 月份微软最新一季财报里的数字,包括 Azure、Windows Server 和SQL Server 在内的智能云业务部门营收增长 15% 至 78亿美元,其中,Azure 智能云业务当季收入 70.8亿 美元,增幅高达 98%。

包括 Windows、设备、游戏和搜索广告在内的个人电脑部门营收为 121.7 亿美元,增长幅度仅为 2%。

市场的变化也体现在微软的「座次表」里,2017 年的 Build 大会上,微软 CEO Satya Nadella 演讲之后,当时负责 Azure 和企业服务的微软执行副总裁 Scott Guthrie 上台演讲了一个多小时,随后上台的是负责微软人工智能的沈向洋。

所有这些,也让我们更期待即将到来的 2018 Build 大会。

言论争议:数据隐私以及中国特色的人工智能

百度本周发布的智能音箱差点被李彦宏的言论抢了头条,在参加中国发展高峰论坛时,李彦宏说了这么一番话:

我想中国人可以更加开放,对隐私问题没有那么敏感,如果他们愿意用隐私交换便捷性,很多情况下他们是愿意的,那我们就可以用数据做一些事情。但我们要遵循一定的原则,如果数据会使用者受益,他也愿意,我们就会去做,这是我们的基本原则,这就是什么该做的,什么不该做。

这番言论被众多媒体以「隐私交换便捷」为关键词进行了大量报道,引发众多讨论,且不说这些讨论有多少是被友商的公关带节奏,至少有三点值得去深思。

其一,国人对于自己在互联网的数据隐私认知已经有了较大提升。正因为这样的认知提升,才会促使讨论者发出诸如「我的数据资料被谁使用」、「我的数据被用到哪里」的疑问。

其二,在李彦宏这番话的后半部分,他提到了百度在使用用户数据时,会遵循「一定的原则」,这是一个颇为有趣的表态,意味着当下各个互联网公司对于用户数据的使用标准是完全主观的,而这一切在「不作恶就无法生存」的中文互联网语境下,更显得可怕。

其三,如果把视野放在全球市场,当 FB 被数据滥用遭受美英以及欧盟的调查时,当 Google 等公司重新修正用户数据保护规则时,百度这样的中文互联网巨头的表态,令人无法想象其未来还会有怎样的全球化思考。

还有一个月的时间,有史以来最严格的数据保护法律将首先出现在欧盟地区。这个名叫《常规数据保护条例》(General Data Protection Regulation,以下简称 GDPR)的法律,将成为全球其他地区制定相关法律的重要参考。深科技这样介绍 GDPR:

理论上来说,GDPR 的适用区仅限欧洲,然而互联网本身的全球性使得 GDPR 变成了一项覆盖全球的法案。

GDPR 第 3 条强调,无论数据处理的活动是否发生在欧盟境内,都统一遵循 GDPR。对于设立在欧盟外的机构来说,则适用属人因素。只要其在提供产品或者服务的过程中处理了欧盟境内个体的个人数据,那么该企业将同样受制于 GDPR。这也正是上文提到的那些美国公司转变的理由。

然而这其实很难理解,进一步翻译 GDPR 第 3 条的话就是“任何网站甚至 APP 只要能够被欧盟境内的个人消费者访问、使用的语言是英语或者欧盟成员国语言、服务或者产品价格为欧元标准”,则都可以被理解为服务于欧盟境内用户,因此受到 GDPR 管辖。当然,如果互联网企业选择放弃 5 亿发达人口市场的欧盟国家,那么他们将不用理会 GDPR。

当然,考虑到中国市场巨大的潜力,绝大多数的中国互联网公司,尤其是人工智能公司可以「战略性」放弃欧盟市场,我在上周会员计划的「人工智能商业内参」里有过详细讨论,在此不再赘述。

以百度目前的两大核心业务为例,自动驾驶平台 Apollo 和人机交互平台 DuerOS 都有着巨大的数据使用隐患。相对而言,由于自动驾驶是和汽车厂商进行合作,其数据使用、保护会有一定保障,而 DuerOS 瞄准的是家庭物联网,或者说是智能家居市场,其数据隐私的问题也更大。

这是因为,DuerOS 是一个基于语音的交互系统,已经被广泛地应用在多个品牌的家电之中,用户当然可以用语音直接唤醒这些设备,但这意味着,你的声音会在云端被存储、被分析,这些远程存储的音频文件,到底所有权归属于谁?

更重要的一点,则是物联网潜在的网络攻击风险,由于家庭物联网数据更具私密性,其被黑客攻击后的收益也更大。比如在百度此次发布的智能视频音箱里,「一键呼通」的功能可以在「强制」打开家庭里的智能音箱摄像头,想象一下,这个功能被黑掉会有怎样的严重后果?

与百度智能视频音箱高调发布所不同,Facebook 已经推迟了其智能视频音频的发布日期,这可能是中美在互联网领域的最大不同吧。

其他

本周,人工智能领域还有其他值得关注的事件。

法国政府公布全新的人工智能战略规划。预计到 2022 年,政府会投入 15 亿欧元用于该行业,同时要发挥法国高等教育的优势,吸引全球人才到法国接受相关教育。

与此同时,根据 TechCrunch 的报道,目前全球范围的互联网巨头都在法国有了分公司:

many private companies have opened or plan to open AI research centers in France. Facebook and Google already work with hundreds of researchers in Paris. Today, Samsung, Fujitsu, DeepMind, IBM and Microsoft all announced plans to open offices in France to focus on AI research.

阿里巴巴进军物联网,或提前遭遇华为阻击战。本周的云栖大会深圳峰会上,阿里巴巴宣布进军物联网领域,物联网成为电商、金融、物流和云计算后的「新赛道」。

阿里云掌舵者胡晓明这样介绍物联网的重要性:

互联网的上半场是将人类活动数字化,比如电商、社交、文化娱乐等,催生了今天蓬勃发展的互联网市场,背后是全球40亿网民。互联网的下半场是将整个物理世界数字化,道路、汽车、森林、河流、厂房……抽象到数字世界,连到互联网上,实现物物交流,人物交互,这会是一场全新的生产力革命

具体的战术层面,包括:

  • 支持 2/3/4G、LoRa、NB-IoT、eMTC等 95% 的通信协议;
  • 提供人工智能的多项核心技术,包括视频识别、自然语言理解、声纹识别、人脸识别等;
  • 打通云、边、端,整合包括物联网操作系统 AliOS Things、IoT 边缘计算产品、通用物联网平台,实现物的实时决策和自主协作;

胡晓明还提了一个「小目标」,阿里云计划在未来 5 年内连接 100 亿台设备。

事实上,物联网提了这么多年,早已成为一个拥挤的战场,腾讯、百度、华为已经在不同细分领域耕耘多年。今年 AWE 上,华为发布了家居物联网 HiLink,官方数字透露,截止至 2018 年华为 HiLink 的注册数量达到了 1500 万台,设备激活数达到了 70%。

而在阿里云发布物联网计划之后,华为的 PR 发布了一个意味深长的图片:

img

Waymo 结盟捷豹,自动驾驶的竞争进一步升级。本周,Google 旗下的自动驾驶公司 Waymo 宣布和捷豹正式合作,双方将在未来几年打造 2 万辆基于捷豹 I-PACE 纯电动汽车平台的自动驾驶汽车。

这次合作有几个要点和细节:

  1. 到 2020 年,20000 辆I-PACE自动驾驶汽车将加入到 Waymo 自动驾驶车队正式运营;
  2. Waymo 的自动驾驶的落地方式将是共享出行;
  3. Waymo 运营的自动驾驶汽车出行服务频次有机会达到 100万次/天;
  4. Waymo 宣称未来的自动驾驶汽车将支持用户在上下班途中远程办公、与朋友一起用餐甚至午睡。这也就意味着,Waymo 所指为 SAE Level 4级别的自动驾驶汽车^1

与此同时,Waymo 曾经最大的竞争对手 Uber,则自本周宣布暂停向加州汽车管理部门申请自动驾驶测试许可,同时也暂停了多个地区的公共道路测试。

另据多家媒体的报道称,Uber 自动驾驶做合作伙伴之一的英伟达,也暂停全球范围内的自动驾驶汽车测试。受此影响,英伟达股价周二大跌7.8%,报225.52美元,市值蒸发超110亿美元。

在国内,工信部27日公布了《2018年智能网联汽车标准化工作要点》。《要点》提出,尽快启动汽车网联标准的研究与制定。

工信部要求,2018年将积极开展自动驾驶相关标准的研究与制定。尽快完成驾驶自动化分级标准立项及研究工作,启动自动驾驶测试场景、横纵向组合控制等2项测试评价类关键标准及自动驾驶记录、报警信号优先度、人机交互失效保护等3项自动驾驶通用标准的预研,并根据预研进度提出标准立项。


最后补充一个小广告:I/O 会员计划最近低调上线了一个免费邮件列表:Daily Me。这个服务每天提供一份经我筛选的、「有品味」的阅读清单,欢迎点击这里订阅。

【视野】流媒体产品的文化影响、自动驾驶创业公司们、Google 的核心产品以及一部近未来的恐怖片

本期的「视野」专栏,我将推荐最近读到的好文章以及一部视频短片。

  • 流媒体音乐产品到底改变了什么?过去的 18 年,是音乐行业巨变的 18 年,整个产业链条上都有了前所未有的深刻变化,推荐一篇很有趣的文章,作者统计了一系列数字,揭示了一些令人意想不到的变化,比如我们越来越不在乎歌名……(文章链接
  • 拿到钱的自动驾驶公司以及激光雷达之争。自动驾驶一直是 I/O 会员计划长期关注的领域,线来看看腾讯科技统计的一份自动驾驶汽车的融资状况,包括 17 家公司,其中,中国创业公司都处在早期阶段。而在激光雷达领域,中国的创业公司们,也在掀起一轮价格战,老牌的 Velodyne 能否招架住呢?(文章链接1、文章链接2
  • 人工智能会如何驱动计算架构变革?当下计算机架构都是来自于上世纪 40 年代末的冯·诺依曼,但在人工智能时代,这种将内存和处理器分开的设置已经成为计算能力扩展的瓶颈,这篇来自 IEEE 的报道,介绍了突破该架构的各种实践。(链接
  • Google 现在的核心产品到底是什么?我们会天然认为 Google 是一个搜索引擎为核心的公司,但 CBinsights 的一系列数据证实,Youtube 才是 Google 目前的核心产品,智能家居、云也在成为 Google 高管最近财报分析师会议上谈论的要点。(链接
  • 百度云的突围之路。36Kr 这篇对百度云总经理尹世明的专访,透露了百度最近一年多来云计算的发展路径,2016年11月,百度云提出ABC战略,故名思义即人工智能(AI)、大数据(Big Data)、云计算(Cloud Computing)。2017年初,在ABC之上,尹世明给它加上了IoT。「ABC+IoT,为变革而来」,构成了百度云全新的Slogan。(链接
  • 近未来的科幻恐怖片。这是我在 Twitter 上的发现,推友@cxiaoji 写道:「人脑植入芯片普及,可以随时打开自动模式操作日常琐事。人们充满了被机器控制的焦虑,却已经失去了自主做决定的能力。几乎没有特效,纯心理惊悚,非常黑镜的一部片子。」我看完后,觉得很吓人。(观看链接
  • 将机器学习应用到新闻行业的三个案例。用数据模型「挑战」当地警察局的数据、将人脸识别系统应用到国会政治报道之中、通过分析 FBI和国土安全部飞机数据跟进独家报道,上述这些尝试都是美国媒体将机器学习应用到新闻报道的三个案例,同时这篇文章还探讨了机器学习应用中的种种挑战。(文章链接
  • 面向公众的算法测试工具 。Facebook 的数据滥用事件继续发酵,由此也进一步引发了公众对于数据、算法的关注,但考虑到这些领域的高门槛,科学家们正在研究一种面向普通公众的算法测试工具,类似一个盒子,里面配置了各种算法,普通人可以将自己的数据上传上去,自行测试。同时,科学家们还希望大公司们未来将自己的算法也放入这个盒子。这篇文章来自《经济学人》,如果你不是该杂志的订阅用户,每周可以查看三篇免费文章。(文章链接

智能音箱战事刚起:产品周期尴尬的天猫精灵、百度发布视频音箱的三个潜台词

不到一周时间,国内智能音箱已经有了三场发布会。

3 月 22 日,天猫精灵春季发布会上,阿里巴巴人工智能实验室发布了基于 AliGinie 2.0 的精灵火眼功能,该功能内置在天猫精灵的手机 App 中,用户只需要同时购买一个类似手机支架的 Xholder,就能让去年发布的天猫精灵 X1 变身为「视频音箱」。

img

3 月 26 日,百度在其总部召开一场硬件发布会,李彦宏亲自上阵,发布了传闻已久的百度智能视频音箱「小度在家」,售价 599 元。

img

3 月 27 日,小米在其手机发布会上还发布了一款智能音箱,小爱音箱 mini,售价 169 元。

img

至此,国内智能音箱的竞争态势发生了很多有趣的变化。

天猫精灵的产品周期难题

上周天猫精灵的产品发布会上有不少槽点,且不说现场演示中出现了种种无响应的网络事故,更重要的是,负责天猫精灵的阿里巴巴人工智能实验室团队对产品走向的判断令人困惑。

一方面,该团队看到了包括 Echo Show 在内的视频音箱所掀起的热潮;另一方面,他们又不断强调,所谓加一块屏幕并不足以支撑新产品的溢价,其公关话术里一直在用「零成本」感受视觉能力来回复诸多记者的疑惑,比如该团队负责人浅雪就这样说道:

屏幕不等于视觉能力,不是加块屏就好了,我们不拘泥于上面那块屏是什么,我们拘泥的是有没有新的交互方式,是用视觉跟你做互动的,这才是下一代人和机器交互的东西……

36Kr 在一篇文章里试图理解整个产品逻辑:

这种方案在阿里看来是“取巧”,借助手机屏幕让天猫精灵摇身一变成了“带屏幕”的多模态交互硬件,“零成本”升级。

当然一个无法回避的问题是,让音箱借助手机的屏幕是否体验足够好,以及这些场景是否足够刚需。对于一般的青年和成年人而言,8成的手机电量耗费在微信和通话这类通讯功能上,很难让人为了剩下两成的娱乐和其他场景,把手机拴在音箱上。

所以目前看来,Xholder更靠谱的用户群是前文所述的老人和孩子。这两个群体的粘性已经被支持远程通讯的智能视频相框验证过了。Xholder的需求能否成立,接下来取决于是否有足够的内容和服务提供给用户,增加他们的使用时长。

请注意我在引用里的加粗部分,作者看到了此次天猫精灵 Xholder 的目标群体,但忽视了这个群体对于电子产品的另一种需求:体验。

对于老人和孩子而言,产品体验不仅是智能音箱上的屏幕反馈那么简单,更重要的一点,则是开箱即用以及傻瓜式的操作体验。但在天猫精灵的 Xholder 设计思路中,产品人员天然假设了两个前提:其一,用户愿意动手改造智能音箱^1;其二,用户愿意拿出自己的手机放在这个音箱上。

但这个前提却天然与老人、孩子的目标群体无关。或者,我们可以换一个场景,在一个典型的五口之家里,孩子的父母更像是 Xholder 的主导者,而孩子以及孩子的爷爷奶奶,更多还是被动使用者,譬如一起听(看)百科、一起听机器读绘本故事……

但很显然,这是一个非常不完善甚至支离破碎的体验,有媒体误以为这是天猫精灵展示其系统能力的发布会,但在我看来,这更像是一个产品周期被拖延后的发布会。

公开资料显示,天猫精灵首发于 2017 年 7 月 5 日,并在 8 月 10 日正式上市。不过,真正的爆发点是在去年双十一期间,官方透露的数字,双十一单日达到 100 万台销量,而自上市发布到现在,已经突破 200 万台。

双十一的数字的确好看,却也埋下了隐患,科技媒体智东西曾在去年双十一期间发现,不知是底气不足还是产能有限,天猫精灵的发货周期都在一个月甚至更长时间:

然而通过仔细分析可以发现,事实并没有表面这么乐观。首先阿里面对的是产能不足。按照一个月生产二三十万台产品来算,这70万订单中剩下的30万订单就算本月完成,那么还有22万台的订单需要继续延后。通过与智东西智能音箱社群人员沟通发现,购买用户的发货日期大都为11月30日前和12月31日前。“这不等于是买期货嘛。”一家智能音箱高管调侃到。

这意味着,至少 100 万台产品的发货时间是从 2017 年 11 月底开始的。更意味着,至少 100 万用户对于该产品的认知和使用时间只有 3 到 4 个月,即便是这群用户当时以 99 元的特价(原价 499 元)购买的产品,但依然是一个非常短的产品周期。

因此,正是这样颇为尴尬的产品周期里,推出一个带有屏幕的新产品是无法让老用户买单的,这才是浅雪以及其产品团队不断强调所谓产品溢价的原因所在。

而本周,百度又将了天猫精灵一军。

百度的 All in 硬件?

百度很「心机」地将这场发布会放在其总部,原因也很简单,自家园区网络的稳定性远胜于酒店、会场的网络,从而也能保证现场智能音箱的演示万无一失。

事实也的确如此,现场的数十次演示都毫无问题,引发一阵阵掌声和欢呼。除此之外,百度试图讲述一个关于家庭与计算设备的新故事。

其一,强调屏幕的价值。我曾在之前多期会员计划里讨论过屏幕的意义,可参见这里这里。简而言之,屏幕不仅增加了一层交互方式,还增加了一个更直观的反馈机制,也让智能音箱变得更亲民也更具大众意义。

img

其二,将家庭场景作为屏幕与音箱结合的切入点。多个广告片里,忙碌的年轻人无法和父母团聚、焦虑的职场的妈妈想时刻和孩子通话等等场景反复出现。这和去年 Echo Show 发布时的广告几乎一模一样,尤其是家庭通讯功能:

其中,“一呼即通”功能最适合有老人和孩子的家庭。通过简单的权限设置,当你向家里的小度在家拨出电话时,不需要家人操作接听,小度在家就能帮你直接联通。

我曾在去年指出,这个功能有着极强的「侵略性」,它强化了智能音箱与其他计算设备的不同——它不再是私人(个人)设备,而是一种家庭共有设备。

其三,几乎赔钱的价格是价格战的开篇。如果说过往小米扮演了多个领域里的「价格屠夫」角色,那么此次在智能视频音箱领域,百度一手掀起了新的价格战,将 599 的价格对标天猫精灵 499,外加一块屏幕,已然形成了价格优势。

值得注意的是,百度自 2017 年以来形成了两条围绕人工智能的产品线,瞄准智能硬件底层系统的 DuerOS 和发展自动驾驶的 Apollo。

今年以来,DuerOS 不断强化其在智能家居市场的存在感,先后和 TCL、创维、海尔等家电厂商建立了合作关系。

与此同时,百度内部也继续整合资源,成立了「智能生活事业群组(Smart Living Group,以下简称SLG)」,百度集团总裁兼首席运营官陆奇亲自挂帅,下辖硬件设计和操作系统(DuerOS)两大部门,形成了软硬两手抓的架构体系,此次发布会上,百度也宣布了战略投资小鱼在家,后者是百度这款音箱的硬件供应商。

战事才刚刚开始

事实上,经过这短短一周,智能音箱的战事才刚刚开始。我们有理由期待阿里巴巴人工智能实验室在夏季或秋季推出真正意义的视频音箱,毕竟这次的发布会的前缀是「春季」。

同样,低价与多产品线依然是重要战略。天猫精灵 M1 将这个系列的价格降低到 299,小米更激进地将到 169,而百度,则用 599 元为带屏幕的智能音箱做了价格标的,也让后来者不得不进入一场全新的补贴战。

对于这些智能音箱的玩家来说,硬件成本更像是占据家庭物联网入口的「营销费用」,这个市场能有多大呢?根据《中国智能家居设备行业市场前瞻与投资报告》数据显示,2018 年,中国智能家居规模将达到1800 亿元,两年后的 2020 年,这个市场规模将达到 3576 亿元。

如此大的市场诱惑之下,阿里巴巴、百度、小米当然不会放过。相比于小米米家自给自足的策略,阿里巴巴、百度更热衷在智能家居/家庭物联网上构建生态,不管是 AliGinie 还是 DuerOS,都想成为 Alexa 的中国版,因此,未来阿里巴巴和百度会继续「拉帮结伙」,但这也同时意味着,所谓家庭物联网,很有可能最后演变为一张张被人为割裂的网络。