← Dailyio 历史存档 | 搜索

标签: Echo

共有 11 篇文章

GDPR 之于机器学习和云、Echo 随机发送录音以及中国的人脸识别

img

题图来自 Unsplash(Matthew Henry

上周,可能是有史以来最严格的数据隐私保护法规《一般数据保护规定》(下文统一称之为 GDPR)正式生效。这个法律对于数据收集、使用、流通都有了详细的规定,并明确了数据各方的权利和义务,比如作为数据所有者的个体,即便你已经同意了互联网公司可以收集你的数据,还可以继续要求这些公司:

  • 访问并修正错误
  • 删除个人数据
  • 反对处理数据
  • 导出数据

正如这个法规名字里的「一般」两字,GDPR 像是一个大篮子,将欧洲的数字经济参与者们,尤其是涉及到数据的参与者——本土公司、跨国巨头、个人开发者、个人消费者——纳入其中,并为不同的参与者们提供了新的角色设置。

不过,考虑到该法律才刚刚实施,我们并不能过于武断地去给欧盟数字经济(移动互联网、人工智能)的未来判死刑,但毫无疑问,在数字经济与全球化的现实语境下,这个法规对欧盟以及全球数字的影响将是深远的。

以新闻行业为例,GDPR 的巨大挑战也是对于其商业模式的直接冲击。过去十几年里,新闻行业依靠数字广告的精准投放苟延残喘,如今,这个变现渠道在欧盟地区已然失效。

包括 《洛杉矶时报》和《芝加哥论坛报》都直接拒绝欧洲用户使用,同时,两家报纸所属集团 Tronc 的多个手机应用也在欧盟市场下架。

而 GDPR 对机器学习的冲击可能是致命的。

一个必须要明确的前提:GDPR 并非是禁止欧盟地区的机器学习行为。

但显然,欧洲的机器学习从业者们将面临巨大的困难。DDPR 禁止所谓「自动化决策(automated decision-making)」的使用,并将其定义为只要数据决策过程中没有人为参与,就属于自动化决策,比如很多机器模型自动化生成的用户模型概要,就已经涉嫌违法。

而如果要合规,至少要从以下三个方面入手:

  1. 基于合同,比如通过其他公司的合同授权;
  2. 基于其他法律授权;
  3. 基于数据所有者(个体消费者)同意;

其中第三项或许是最简单,也是最繁琐的,正如上文提到的数据所有者所拥有的权利,他/她当然可以同意其数据用于机器学习,还可以随时要求取消,这种动态的数据许可无疑将大大增加机器学习从业者的负担,而一旦没有足够的数据,机器学习的优势也消失殆尽。

如果说机器学习仅仅是人工智能的一个狭小领域,GDPR 更多还是对其技术实现层面的影响。那么, DDPR 对于云计算,特别是公有云的影响,则将会涉及商业模式层面。

通信行业资深从业者宁宇在钛媒体撰文指出了这种危险:

为了更全面地进行数据的安全保障,GDPR对数据的控制者(如云计算的客户)和数据的处理者(如云服务提供商)提出了同样的要求,这一政策的本意是让接触数据的各个企业都承担起数据安全保护的责任,但是云计算是由多层次组成的,强调开放性和企业之间的自由组合与协作。这二者放在一起,就产生了矛盾冲突。

宁宇列举了几个案例,比如以公有云三大服务模式来看,GDPR 将 IaaS、PaaS、SaaS 三个服务的数据使用做了割裂式的规定:

GDPR要求,如果没有数据控制者授权,数据处理者不应聘用另一个处理者;如果数据控制者反对,那么数据处理者就不能将数据提供给第三方。那这是不是意味着:PaaS平台发展任何一个用户、开发任何一个应用,都必须事先征得IaaS厂商的同意?

再比如:

GDPR要求,数据处理者必须在收到数据控制者书面通知后才可以处理数据。这条规定在云服务场景中几乎是不可能实现的:得不到上层应用的书面通知,底层的基础设施和平台就不能对数据进行处理?

宁宇也注意到一点,在上周 Gartner 的公有云 IaaS 魔力象限里,入围的 6 家公司,亚马逊、微软、Google、阿里云、IBM 和 Oracle,没有一家是欧洲公司,那么,他们未来在欧洲的云业务会呈现出怎样的局面?会不会为欧洲的云服务模式提供更多个性化的定制?都将是观察 GDPR 后续影响的重要入口。

有趣的是,几乎在欧盟地区最严格的数据保护开始实施的前夕,发生在美国和中国的两件事情也格外值得关注。

在美国,波特兰的一位女士告诉位于华盛顿的 KIRO 7 电视台,他们家的亚马逊智能音箱 Echo 录制了她和丈夫的对话,并将这段对话随机发给了她丈夫公司的同事,你可以在这里查看这个这段视频。

这是颇为诡异的事件,亚马逊随后的调查中,通过调取 Echo 的设备日志,也证实了该事件属实。亚马逊在发给《纽约时报》的声明中写道:

“Echo woke up due to a word in background conversation sounding like ‘Alexa,’Then, the subsequent conversation was heard as a ‘send message’ request. At which point, Alexa said out loud ‘To whom?’ At which point, the background conversation was interpreted as a name in the customer’s contact list. Alexa then asked out loud, ‘[contact name], right?’ Alexa then interpreted background conversation as ‘right’. As unlikely as this string of events is, we are evaluating options to make this case even less likely.”

亚马逊并未给出更详细的解释,但考虑到这位用户家里有多台 Echo 设备,其根源很可能就是当你在卧室说话时,厨房的 Echo 被唤醒,并错误地将其当作「发给xxx」的指令,从而自动发送。

但显然,上述对于机器「自动化决策」的解释缺乏证据,也几乎无法杜绝。如果放在 GDPR 的框架下,数据处理者(亚马逊)在没有得到数据所有者(用户)的同意下私自使用了数据(发送给朋友),已然触犯了法律。

另一个不得不提的案例发生在中国。

我曾在不久前在朋友圈感叹道:「人脸识别公司太多,(中国人)人脸快不够用了。」这是对中国人脸识别公司发展之快、数量之多的最好注解。

与之呼应的则是,中国人脸识别的海外探险已经开始。美国在线媒体 QZ 提到,津巴布韦政府购买了来自广州的云从科技的人脸识别技术,用于公共场所的人脸识别。

但中国的人脸识别应用场景还在无限制的扩展中。《新京报》的一篇报道中,杭州第十一中学成为被人工智能,尤其是人脸识别所改变的学校典型,不禁利用人脸识别改变了过往点名、打卡,还将人脸识别技术集成到课堂管理之中:

校方负责人介绍,系统每隔30秒会进行一次扫描,针对学生们阅读、举手、书写、起立、听讲、趴桌子等6种行为,再结合面部表情是高兴、伤心,还是愤怒、反感,分析出学生们在课堂上的状态。

 

校方表示,目前仅趴桌子一项为负分行为。若此类不专注行为达到一定分值,系统就会向显示屏推送提醒,任课教师可根据提醒进行教学管理,而显示屏仅任课教师可见。日后还会与学校医务室等其他后台的数据打通,若学生因身体不舒服,可列入“白名单”。

 

该校高一学生王虹艺在接受媒体采访时表示,自己理解该系统并非是把上课睡觉的同学的影像录下来,而是通过分析行为得出一个数据。若自身状态不好,收到信息反馈后,在下节课或者第二天便会积极做出调整。

这个原本的「典型」随后遭到众多质疑,不过很多批评者都站在了道德高地上去指责学校对隐私的无视,而搜狐「后窗工作室」则用一个微观视角去重新审视这件事,他们找到了被这个系统所改变的人,包括教师、家长和学生,他们各自又有者不同的需求,比如,家长很喜欢这个系统:

一个高瘦男生,常常不自觉地扭动身体,系统就给了一个低分,可能“被误认为经常趴在桌子上。”他现在已经有了很大的改变,他回家和父母说,父母都觉得应该支持。

而在一些高年级学生看来,他们担心家长和学校联合起来的「阴谋」:

吴建飞担心,下一步系统会怎么发展,“如果是像之前新闻说的,让家长联网,打开手机就能随时看孩子的监控,那我们肯定无法忍受。”他说:“这是破坏家庭团结,我们要有所行动。”

 

比他高一级的柳峰也有类似的打算。“这就像赫胥黎的《美丽新世界》,通过捕捉你的表情然后控制你。”

 

“同学不错,知道东西很多啊?”旁边的同学挤兑他。“不是,我只知道锤子。”他边说,嘴边细密的胡须抖动了一下,他说高二8班已经有人把手机柜撬开了。

 

如果这个系统在全校推广,你们会怎么办?

 

“我已经准备好了锤子。”说完,他便匆匆离开。

这位同学的锤子灵感或许来自于苹果经典的「1984」广告,不过,当下人脸识别技术所创造的「美丽乌托邦」,显然更像是奥威尔笔下的大洋国,而在这个过程中,科技公司们所扮演的角色并不光彩,在上周 Bloomberg 科技频道的一则新闻通讯里,编辑 Shira Ovide 提出了一个非常难解却又十分重要的命题:

Should powerful technology companies do more to help protect people from potential government abuse, or do more to help government protect its citizens?

智能音箱大战:苹果和小米越来越像、亚马逊 2017 年做对了什么、为什么百度、FB要给音箱加上屏幕

这期的「洞察」专栏,我将着重围绕智能音箱的格局和变数,讨论以下几个问题:

  • 为什么苹果和小米在智能音箱布局上如出一辙?
  • 亚马逊 2017 年做对了那些事情?
  • Google 和阿里巴巴的智能音箱困局
  • 为什么百度、FB 要给音箱加一个屏幕?

生态型的打法:高价苹果与廉价小米

上周,苹果发布了 HomePod 第一个官方视频(点击这里查看),视频的主题是一个职场女性,在经历了一天的忙碌、并乘坐拥挤地铁回家后,用 Siri 唤醒 HomePod 来播放音乐,随着音乐的节奏,整个人进入到一个全新的状态。

img

这个时长 4 分钟的广告片由 Spike Jonze 担当编剧和导演,后者也是探讨人机关系电影《Her》的导演。熟悉苹果产品价值观的朋友或许可以理解,长久以来,苹果所秉承的,是个人电子消费品之于人类生存的积极意义,比如在这则广告里,HomePod 的出现,正是要释放都市人,尤其是都市女性的压抑。

HomePod 显然是苹果 2018 年第一季度最受人关注的产品,其「难产」之路也不禁让人怀疑,到底这款智能音箱里暗藏着什么秘密武器,会让苹果史无前例地推迟一款产品的发布时间。

当 HomePod 正式发布后,外界的评价也格外有趣。比如,绝大多数的媒体都认可了 HomePod 的音质,而几乎所有的媒体都会将 HomePod 和亚马逊的 Echo 以及 Google Home 作为类比对象,最终得到的评判结果则是:HomePod 是一款「刚刚及格」的智能音箱。

对此,a16z 合伙人 Benedict Evans 在 Twitter 上不禁感叹,如此类比实在是愚蠢至极:

So much HomePod silliness
If Apple wanted to make a $10 speaker-box with Siri embedded, it could.
If Amazon wanted to make a $350 Echo with good sound, it could.
Instead, they have different theses, from different market positions & strategies, that produce different products.

Benedict 还进一步解释了两者的区别,两者根本不是同一个类型的产品:

This isn’t iOS versus Android - it’s a bicycle versus an SUV. These aren’t competing products. They’re different answers to different questions, based on different views of what’s going to happen.

Benedict 的观点可谓一针见血。HomePod 作为又一款具有苹果特色的生态产品,其面对的应用场景和亚马逊 Echo 或 Google Home 完全不同。苹果要将 HomePod 作为新的生态延伸,如下图所示,苹果在个人、工作场景实现了全覆盖,并在 2017 年加大家庭领域的布局(推出 4K 版的 Apple TV),HomePod 将作为 TV 产品的重要补充。

img

另外,在 HomePod 的官方说明中,我们也能从中窥见一二:

img

从这个意义上说,HomePod 要解决的,是 iOS 设备拥有者对于智能音箱的消费需求,苹果天然将这部分人群的需求简化为了语音操控与音乐享受,由此形成了这款产品的显著特点:音质爆棚、「智商」为零。

事实上,这种生态级的玩法也是小米 AI 音箱的套路,这款只有 299 元的小米 AI 音箱发布于 2017 年 8 月,借助米家复杂、多样化的产品体系,这款音箱在功能上、实用性上有了巨大提升,而且,随着你手里的米家设备越来越多,音箱的「智能性」也会越来越高。

如果从另一个角度去理解所谓生态级的打法,以苹果为例,除了 iPhone、iPad 这样的高价产品,其他苹果的硬件产品都是「应用内购」。小米也类似,所不同的,可能就是便宜。

入口型的打法:亚马逊、Google 与阿里巴巴

亚马逊、Google、阿里巴巴,尽管都是全球领域的互联网巨头,但回忆过往,尤其进入移动互联网时的阵痛还记忆犹新。

以亚马逊为例,早在 2011 年 9 月,亚马逊也曾向苹果的 iPad 发出过挑战。当时亚马逊宣布推出一款名叫 Kindle Fire 的平板电脑,在贝佐斯的小算盘里,当用户转向移动设备之后,亚马逊理所当然应该向用户提供更方便的购物体验。于是我们也看到了这样一款设备:Kindle Fire 屏幕尺寸为 7 英寸,搭载亚马逊深度定制的 Android,整合了绝大多数亚马逊的在线服务,售价为 199 美元。

img

坦率说,Kindle Fire 的表现并不算差,在那个 iPad 常年维持在 499 美元的历史时代,Kindle Fire 背靠亚马逊这座大山,在小尺寸屏幕、低价、海量内容的多重独门利器的包装之下,一度抢占了不少的市场。2012 年 8 月的一份数据显示,第一代 Kindle Fire 的市场占有率达到 22%,同时期的 iPad 为 50%。

可即便如此,在全球平板电脑市场逐渐进入低迷阶段后,Kindle Fire 的境遇也好不到哪里去,这也让贝佐斯开始思考推出新设备的可能性,随后,亚马逊在 2014 年发布 Kindle Fire 手机,然而这却是一个完全失败的产品。从定价的角度来说,这款手机的价格看起来了当时的 iPhone 5S(高达 649 美元),这也和亚马逊一贯以来的低价策略形成了鲜明的反差。《财富》杂志在其发布两个月后就宣布 Kindle Fire 已经失败

Two months after Amazon released the Fire phone, it’s fair to call the device a disappointment.

img

颇具讽刺意义的是,Kindle Fire 系列(包括平板电脑、智能手机)都来自于亚马逊著名的 Lab126,这曾是 Kindle 阅读器的诞生地,但却在平板电脑、智能手机战场折戟,而在 2014 年年底的时候,这个实验室推出了第一代 Echo,Bloomberg 记者 Joshua Brustein 写过一篇深度挖掘 Echo 诞生故事的文章。

Echo 的出现,解决了亚马逊在移动互联网时代流量恐惧的难题,当智能手机市场进入瓶颈增长期的时候,亚马逊悄然将一款款廉价的智能音箱布局到了家庭中。

直到 2016 年年末,Google 才有了对抗 Echo 的第一款产品,Google Home。但到了 2017 年,亚马逊紧锣密鼓地发布了一系列新品,再一次将 Google 甩在了身后。如下图所示,亚马逊其实就做了一件事情:利用「机海战术」,将 Echo 系列覆盖到不同消费层次的人群,最终形成绝对的流量入口优势。

img

而 Google 也在 2017 年推出两款智能音箱,面向价格敏感性用户的 Home Mimi(49 美元) 以及针对价格不敏感群体的 Home Max(399 美元),但在经历了一个疯狂的购物季节后,这两款产品的走向却有两个不同的结果,Home Mini 为 Google 拿下了 9% 的市场份额,而 Home Max 几乎可以忽略不计。

![]()

在国内,阿里巴巴 2017 年 7 月才加入这个智能音箱战场,第一款智能音箱天猫精灵的售价 499 元,在当时小米 AI 音箱还未发布时已是行业最低价,而真正推动天猫精灵普及的,则是去年双十一期间的 99 元优惠活动。

上述案例进一步显示了,价格因素在这场争夺战中的重要影响。对于一款新型设备来说,如果没有苹果一样的生态级统治力,价格才是其可以普及的主要方式;其次,海量的机型选择也可以覆盖更多样化的消费人群,反过来还能带动出货量,接下来的 2018 年,Google、阿里巴巴如果要想有作为,必须走上这条道路。

为什么都在押宝屏幕?

几乎所有的互联网公司,都面临一个流量从哪里来的困境,与亚马逊、Google、阿里巴巴类似,百度也面临这样的难题。2017 年,百度在智能音箱领域砸出一个超过 1600 元的「高端产品」—— Raven H,这款长期需要预定的音箱终于在上周有了现货,搜狐科技的报道称:

去年11月在百度世界大会上发布的渡鸦raven H音箱也开始现货销售。此前尽管已经有预定的用户收到了产品,但官网该产品一直需要4到6周的到货周期。

与此同时,百度继续整合内部资源,成立了「智能生活事业群组(Smart Living Group,以下简称SLG)」,百度集团总裁兼首席运营官陆奇亲自挂帅,下辖硬件设计和操作系统(DuerOS)两大部门。

李彦宏更是在两会期间表示:下月百度将推出带有屏幕的音箱。

这是一个颇不寻常的举动,就目前来说,市面上主流带有屏幕的智能音箱只有两个:亚马逊的 Echo Show 和 Echo Spot。我曾在去年 Echo Show 发布后写的会员通讯里,详细分析了 Echo Show 的「阳某」,其中的一个关键点就是 Echo Show 官方广告里的家庭定位。

整个广告围绕家庭展开,没有过多的技术细节描述,广告的过程并非要让世人对亚马逊技术报以掌声,而是在创造一种全新家庭生活的氛围。产品经理出身的 Chris Messina 更是将广告里出现的所有人物列了出来,如下图所示:

img

这些人物选角的细节和广告里的多个场景设计,比如年轻夫妻照看双胞胎的场景以及小女孩和爷爷一起画星空的场景,事实上都是亚马逊 Echo Show 的用户群体定位,那就是,美国的中产阶级白人群体——他们受过良好教育、有着相对稳定的工作和收入、看重家庭观念,更希望能够通过技术带来的便利优势,让家庭成员之间的联系更加紧密和便捷。

为此,Echo Show 还提供了一个名叫「Drop in」的功能,亚马逊的官方解释是这样的:

…for the special cases when you want to connect with your closest friends and family. For example, you can drop in to let the family know it’s time for dinner, see the baby’s nursery, or check in with a close relative.

你可以将其理解为一个类似对讲机的功能,再开启该功能后,你可以随时查看其他家庭成员家里或房间里 Echo Show 相机拍摄的画面,比如广告里年轻夫妻要查看婴儿房里两个啼哭孩子的时候,就使用了这个功能。

img

这是一个颇具野心也很具「侵略性」的功能,它大大强化了 Echo Show 的家庭定位,你不大可能将「Drop in」用在普通朋友之间甚至情侣之间,但在家庭成员之间,这个功能却大有用途。广告里至少有两个「Drop in」功能的演示,其场景设计都是围绕家庭成员内部的沟通。

无独有偶,今年年初,社交巨人 Facebook 的智能音箱计划也被爆出。根据 Cheddar 的独家消息,作为 FB 首款硬件设备,Portal 将肩负着对抗亚马逊 Echo Show 系列的重任:

The device is designed to work in the home and represents Facebook’s first serious foray into selling consumer hardware, people familiar with the matter said. Rather than position the device as a smart assistant akin to Amazon’s Echo speakers, Facebook intends to pitch Portal as a way for families and friends to stay connected through video chatting and other social features.

而今年的 CES 期间,除了一大堆类 Echo Show 的硬件设备展示外。Google 也悄然收购了一家名叫 Redux 的公司,该公司的技术既可以应用在智能手机的扬声器上,还可以将屏幕改造成声音播放设备。这意味着,Google Home 这款智能音箱未来可能拥有一个可以个发出声音的显示屏[1],从而实现语音、视频的双重交互。

这意味着,进入 2018 年,智能音箱的竞争将在声音之外出现新的变量,一款屏幕不仅会带来全新的交互方式,同时还将融入更多的服务并覆盖更多的用户群体,一如我在去年评价 Echo Show 的意义:

尽管依然需要通过「Alexa 」来唤醒,但有了一个屏幕,也让整个交互的反馈机制得以视觉化的呈现,「屏幕」是从 PC 到智能手机时代最深入人心的交互媒介,如果说早前纯粹依赖声音的 Echo 产品是一种年轻人面向未来的体验,那么现在拥有屏幕的 Echo Show ,则更具普遍和大众意义,这也是为什么 Echo Show 广告里出现如此多的老年人和小孩的原因。


  1. 事实上,Google 已经开始将 Google Assitant 武装到包括 LG、西门子在内的智能家居的显示屏上。  ↩

亚马逊这家公司

《经济学人》杂志看来,亚马逊与 Google、苹果以及 Facebook 一样,都是新一代的「Titan(泰坦)」。

img

而从公司的架构去看,亚马逊看起来也的确不是一家简单的公司,它更像是一个「联邦式的帝国」——各个看似松散却又联系紧密的部门共同造就了这样一个赚钱机器。

在最新一季的亚马逊财报中,总共实现 437 亿美元营业收入,自营电商、第三方电商卖家服务、AWS、Prime 服务(在线音乐、视频订阅)分别贡献了 60%、18%、11%、6% 的成绩,剩余 5% 由实体店和其他收入贡献。

接下来,我们会详细分析上述几个部门在亚马逊整个公司里的位置以及增长潜力。

(更多…)

人工智能商业内参#2018-01-14

本周,CES 成为全球科技媒体关注的焦点,2018 年 CES 是属于智能音箱与汽车的舞台,人工智能已经悄然成为一种驱动不同领域产品演进的底层技术。在本周的人工智能商业内参中,你会看到 CES 里的汽车变形记、Facebook 新老人工智能产品的命运、智能音箱 2018 的竞争新格局以及被无意流出的 2018 中国政府支持的人工智能项目。 (更多…)

088:万能计算设备正在消失

上周,阿里巴巴正式加入智能音箱大战行列,推出一款名叫天猫精灵的智能音箱。至此,全球范围内的互联网巨头们,都已经有了属于自己的智能音箱。在后智能手机时代,语音被看作是全新的「输入方式」,有可能开创一个全新的万亿市场。

过往,我们习惯性地将人机交互的演化作为论证语音入口或智能音箱的可行性,但这个思考更多还是基于「用户为中心」,倘若站在计算设备发展的角度去看,几乎所有这些音箱都是一种面向未来的计算设备,或者准确地说,是一台台专属计算设备。

(更多…)

080:电话情人与 Echo 伴侣

亚马逊 Echo 正在成为如 iPhone 一样改变世界的产品。

关于这款产品的流行,一般意义上的解释是:这是一种全新的交互模式——声音,在 PC 时代的鼠标键盘、iPhone 时代的触摸屏之后,以声音交互为核心的 Echo,让人机交互进入到一个全新的阶段。

这个解释当然没有问题,事实上,不仅包括我自己,互联网行业从业者们都已经看到基于声音交互带来的巨大潜力,2017 年 6 月,Mary Meeker 在一年一度的互联网报告里将声音作为下一个重要的交互模式(如下图),如果按照互联网的行话,这是一个全新的流量入口。

img

然而在 Mary Meeker 的 Slide 里,你可以清晰看到她将苹果的 Siri 和亚马逊 Echo 一前一后放在一起。但一个显而易见的事实是,即便放在今天进行对比,苹果 Siri 与亚马逊 Echo 之间的体验差距依然非常大,换句话说,如果非要给基于声音的交互方式设置一个里程碑的事件,Siri 充其量只是一个史前的小事情,只有到了 2014 年亚马逊发布 Echo 开始,人类才正式进入基于声音的全新交互时代。

Echo 到底能做什么?我曾在一期播客节目里截取过一段 Echo 的「技能」,下面这段视频就是 Echo 技能的视频版(如果不能正常观看,可以点击这里进入 YouTube 里观看):

这个视频的精彩之处在于,它让我们看到了 Echo 作为新型设备的无限潜力[1],下图来自美国科技媒体 BI 的一份报告截图,统计了 2016 年全美用户使用 Echo 最多的几个功能,其中可以发现,真正在用 Echo 下单购买亚马逊产品的场景并不多,绝大多数的使用场景集中在一个层面:交流。 (更多…)