← Dailyio 历史存档 | 搜索

分类: Open Access

共有 354 篇文章

一个智能城市的样本:脸部数据、身份信息与安全

洞察

上周,TechCruch 拿到了一个中国智能城市项目的数据库,原文在这里。透过这个数据库,可以一窥当下智能城市光鲜的宣传语背后,隐藏了哪些不可告人的秘密。

这个数据库首先是安全研究员 John Wethington 在公网上发现,然后他将数据库信息交给了 TechCrunch(以下简称为 TC)的记者。

TechCrunch 发现,该数据库托管在阿里云平台,数据量巨大,而且还有近几个月的人脸识别信息。当记者向阿里云求证时,阿里云给出了三个明确的回答:其一,该数据库并非阿里云的城市大脑项目;其二,阿里云拒绝透露该数据库的所有者,但已经通知了相关利益方;其三,阿里云无权访问客户数据库里的内容。

阿里云的回应并没有问题,作为公共云服务商,不碰客户数据也是第一准则,而此事值得关注的地方也并非该数据库归谁所有,而是就像 TC 记者所言:这给了我们一个观察所谓智能城市运作的好机会。

首先,关于面部数据的采集与处理。这个泄露的数据库主要监测北京东三环附近的两个住宅小区,这也可以部分说明,该数据库并非是一个用于商场的监控系统。

img

该数据库通过多个数据采集点形成采集网络,采集点都配有面部识别的监控摄像头。

这些摄像头收集的面部数据非常细致,比如一个人的面部表情(微笑还是其他)、是否有胡子、是否佩戴太阳镜或口罩、嘴巴是否张开等等,甚至还会标记这个人的大致年龄与民族成分。

其次,面部识别数据与警方记录的联动。TC 也发现,该数据库会从警方那里获取数据,利用警方的数据来匹配实时的面部识别数据,TC 也通过这点指出,这个数据库的真正客户是政府。

而在具体操作层面,每当面部识别系统检测到人时,数据库会自动开始「记录」,包括具体的时间、位置以及相应的注释,注释主要为了指出这些识别对象的身份。不过在下面这个截图里,「VillageName」字段里的「怒晴湘西」,我并没有在北京找到这个小区,我还用「怒晴」、「湘西」等关键词搜索,也未找到相关信息。

img

我推断有两种可能:其一,这个字段用了代号进行加密,尤其是「湘西」指代的可能是一个具体小区;其二,这个数据库并非生产环境的数据库,可能是一个测试数据库,里面混淆了诸多不同地区的数据,但我也未在全国其他地方找到名叫「怒晴」、「湘西」的小区,因此第一种可能性比较大。

撇开该数据库里的这个疑问,我们已经可以相对清晰地勾勒出一副智能城市里的监控图景:你的一举一动、面部表情与面部遮挡都在被记录,并实时匹配来自警方的数据,及时发现所谓「坏人」,保护「好人」的「安全」

类似的场景,BBC 记者 John Sudworth 两年前体验贵阳的监控摄像头后感叹,借助布满整个城市的摄像头以及背后强大、实时的数据分析能力,生活在这个城市的人已经无处可藏,视频链接在这里

然而在数据,尤其是面部数据收集、处理的过程里,谁来确保数据不泄露?谁来定义数据的使用权限?谁来制定面部识别里的偏见?所有这些疑问都不会有答案。(完)


视野

苹果

Bloomberg 爆料了 iOS 13 可能更新的内容,包括新 App 以及 iPad 的全新桌面,消息非常可靠。

库克接受 CNBC 采访。

微软

微软年度开发者大会 Build 正式开幕,这篇来自VB的总结很详细。

Wired 一篇长文,介绍了纳德拉时代的微软,涉及到微软对于 AI、开源的态度以及公司文化转变。

Bloomberg 专访微软云和 AI 副总裁 Scott Guthrie,谈及 Azure 与 AWS 的竞争以及 AI 的发展方向。

阿里巴巴

IDC 的数据显示,阿里云继续在 2018 年继续领跑中国公有云市场。

阿里巴巴正在重新评估印度电商市场,新战略或将关注垂直领域电商的投资

Azure 会超越 AWS 吗?

周二凌晨,Google 母公司 Alphebet 发布了 2019 财年第一季度财报,整体营收不及华尔街预期。财报会议上,面对分析师对于 Google 云计算业务规模的提问,Google CEO 皮查伊拒绝直接回答这个问题,他用了这样的句式

I think we are building a strong business across all our verticals, and we're definitely are seeing a strong momentum and look forward to being able to share more at the appropriate time.....

与之形成鲜明对比的是,上周亚马逊和微软的财报里,云计算业务俨然成为两家公司增长的助推力。

先看数字。亚马逊 2019 财年第一季度营收 597 亿美元,同比增长 17%,其中 AWS 营收 77 亿美元,同比增长 41%。

在微软 2019 财年第三季度财报里,营收 306 亿美元,同比增长 14%,其中,智能云部门的营收为 96 亿美元,同比增长 22%。

微软还特别强调一点,智能云部门里,公有云产品 Azure 的收入涨幅高达 74%。

虽然阿里巴巴要到 5 月中旬才会发布财报,但站在 2019 年第一季度的时间点去看,全球云计算的基本格局没有太大变化,亚马逊和微软牢牢占据着前两位,阿里云尽管在亚太地区进步明显,但和微软和亚马逊还有较大差距,至于 Google,正如我在稍早前会员通讯里所言,Google Cloud 还处在「又一次起步阶段」。

那么现在还有一个问题:微软会超过亚马逊吗

首先必须明确一点,亚马逊与微软的云业务无法直接对比。所谓亚马逊的云业务,特指的就是 AWS(Amazon Web Service),如果细看这一季的财报,AWS 的收入已经占据亚马逊整个营收的 13%,其运营收入更是增长了 58%,达到 22.23 亿美元,凸显出 AWS 在整个亚马逊业务体系里的赚钱能力。

img

而微软的云业务则相对复杂。除了直接对标 AWS 的公有云平台 Azure 外,微软还将 Office 365 与 Dyanamic 打包到商业云业务营收里。

这一季财报中,上述三大云业务共产生了 96 亿美元的收入,但由于微软刻意不提供三大业务的营收比例,因此很难直接推算出 Azure 的具体营收数字。

上周,投资银行 Nomura 分析师 Christopher Eberle 指出,Azure 将在 2019 年财年(从 2018 年 7 月到 2019 年 7 月)营收 135 亿美元。路透社援引 Christopher Eberle 的话称,尽管随着行业发展,Azure 的增速会放缓,但考虑到其巨大的基础数字,整体的营收规模依然非常大。Christopher Eberle 还补充道:「我很难找到第二家能有如此增长势头的公司」。

接下来的这个问题就是:Azure 是否能超过 AWS?

作为公有云平台,Azure 和 AWS 都提供了丰富的云服务产品、可用区选择,满足企业对于基础设施、开发运维、地区扩展等一系列的需求。

AWS 的最大优势在于其完善的产品线和广泛的运营区域,而其市场先发优势也让 AWS 统治了过往十年的云计算市场。

但 Azure 之于 AWS 有三大优势。

其一,围绕在 PC 和生产力工具领域的统治力,进一步延伸了 Azure 作为云平台的扩展能力,比如 Office 365 在全球拥有约 1.8 亿用户;Dynamics 365(将客户关系管理,销售和营销工具捆绑在一起)虽然处在 Salesforce 阴影之下,但增长势头依然可观。与 Salesforce一样,微软也认为 AI 功能的集成将简化这些流程并帮助公司优化业务。

其二,正如我在之前几期会员通讯里所谈到的,亚马逊在零售领域的霸主地位,使得这个古老行业的玩家们集体「抵制」AWS,沃尔玛与 Azure 的结盟就是鲜明的例子,更进一步,亚马逊在物联网领域的布局,也会进一步加剧 AWS 与该行业各大公司的紧张关系,受益的也将是微软或 Google。

其三,得力于微软在企业市场的多年耕耘,使得 Azure 拥有更好混合云部署能力,基于 Azure Stack 的混合云产品,企业可以在自己的数据中心调用来自公用云平台的产品。而 AWS 直到 2018 年才正式发布了混合云产品 AWS Outposts。

财报分析师会议上,微软 CEO 纳德拉也进一步强调了 Azure 在混合云领域的优势:

I would say Mark the main thing that this offering enables is the flexibility with which customers can adopt hybrid computing. And as I've always said that there is -- hybrid computing is important for workloads that are more in the characteristic -- can be characterized as lift, shift and modernize, so that's one motion. And then there is a new load hybrid as well which is people are building in fact they're doing AI training job in the cloud but want to deploy the model close to the edge. And in both of the cases, hybrid benefits actually help with -- our business model is basically differentiated in supporting the architectural need and the flexibility needs. The one additional thing I’d mention, which is increasingly becoming clearer to us is operational sovereignty will become important, the world and its distributed computing needs is not going to become some margin as set of requirements but it's going to be very heterogeneous, very in many cases regulated and so what we provide in terms of both the technology and the business model I think shows up with the maximum flexibility.

与此同时,微软还指出,Azure的利润率提高使其商业云毛利率在第三季度同比增长了 5 个百分点至 63%。而 Azure 的新功能,包括物联网设备和网络安全功能的服务,也进一步增加单个客户的收入。

当然,上述推演,更多还是基于 Azure 自身的优势,但即便是将 Azure 延续 75% 年复合率,短期内也无法超过 AWS,毕竟 AWS 每个季度也还有 40% 左右的增长,全球云计算市场还有足够大的空间,Azure 追赶 AWS 的势头也不会停止。(完)

二维码转账、脸部识别与匿名性

两则新闻放在一起来看。第一个是国内新闻,网传江苏宜兴公安局通过调取涉黄浴室的支付二维码信息,给 600 多人发送短信或电话(如下图所示)。

img

此事引发多个层面的讨论,涉及法律,比如到底是疑罪从无还是疑罪从有,也涉及到网络支付的隐私,比如在怎样的情况下可以读取普通人网络支付的详细信息等等。

第二个新闻来自国外。根据 Verge 的报道,来自比利时 Ku Leuven 大学的研究者发布了一篇论文,利用对抗生成网络生成的一个图像,能够完全欺骗某些监控系统里的识别算法,成为 AI 时代的「隐身术」。

img

而根据周五《新京报》的报道,宜兴警方已经抓到了传播「扫码支付超600元就要被传唤」的造谣者。

两个新闻的切入点不同,事实走向也不同,但放在当下这个环境里有诸多共性的话题值得去讨论。

其一,匿名与反匿名的争议不是由技术决定,而是个体与政治机构、商业集团的博弈。互联网一度让个体拥有了巨大权力,但在政治、商业利益面前,个体权力逐步缩小,互联网上的账号信息不再匿名。如今,大数据、脸部识别则可能实现线上线下数据的打通,其结局就是匿名性的消失。

其二,匿名与反匿名之间的博弈不会停止。第二个新闻里提到的这类图片,虽然只能针对特定算法,但至少证明了其可能性。当政治、商业机构以算法从个体身上获取利益时,对抗这种「极权」的唯一方式也是算法。

img

其三,当新技术来临,我们该警惕什么?如果说过往新技术的出现会让很多人捂紧自己的钱包,那么面对当下的技术发展趋势,我们最需要的是保护自己的「隐私财产」。

只有将隐私作为一种财产,才能识破互联网公司过去十几年所编织的「免费」谎言。事实上,全世界的互联网用户都一直在支付「隐私」来换取网络服务,由此造就了硅谷以及中国的互联网盛世。能够支撑起 Google、Facebook、阿里巴巴、腾讯等公司千亿美金市值的要义,便是这些公司比其他公司更好的「收集、整理、贩卖」用户的隐私财产,你看最新一季财报里,Facebook 又从全世界用户身上挣了多少钱。

img

其四,我们当然呼吁立法,包括三个层面:

  • 明确商业公司对于用户数据、隐私的权利和义务,比如腾讯与阿里,到底如何使用我的数据,以及一旦泄露后的责任是什么;
  • 明确政治机构、商业公司在用户数据使用上的边界,比如警方何时才能向科技公司要求调取网络交易数据或者脸部识别数据;
  • 明确个体对于其他个体数据、隐私的权利和义务,比如如何对待贩卖普通人信息的行为;

但立法真的可以改变吗?欧盟去年实施的 GDPR,让欧盟地区的用户隐私得到了最大保护,其他国家和地区也在着手准备类似的法律,然而当互联网、人工智能等领域上升为政治议题后,其背后的游戏规则变得更具地域特色,欧洲的标准当然不适用于美国,欧美的标准或许也不能成为中国的参考,毕竟,收编这样一个拥有巨大权力的「神兽」,当局从来不会心慈手软。

最后可能还要回归到一个终极命题:「这个世界还会好吗?」

「或许吧。」

深度学习峰会、PaddlePaddle 更新的行业背景以及潜在的不确定性

周二的时候,首届 WAVE SUMMIT 2019 深度学习开发者峰会在北京举行,这是由深度学习技术及应用国家工程实验室和百度共同举办的会议,主要议题则是探讨深度学习的重要性以及应用价值。

身兼百度高级副总裁和深度学习技术及应用国家工程实验室主任的双重身份,王海峰在主旨演讲里为深度学习的发展定了基调:「深度学习框架是智能时代的操作系统,同时深度学习正在推动人工智能进入工业大生产阶段」。

这句话包含了两层意思:其一,在深度学习领域,框架的重要性不言而喻,如果类比操作系统,深度学习框架也是起到了一个承上启下的连接作用,往下是芯片以及其他操作系统,往上则将业务和行业应用对接在一起。

王海峰如此这般强调深度学习框架的作用,其实也是在宣传百度深度学习框架 PaddlePaddle(中文名为「飞浆)」,公开资料显示,PaddlePaddle的研发始于2013年,伴随着百度广告、文本、图像、语音等训练数据的快速增长,以及百度外卖、搜索、无人驾驶领域的算法要求,百度内部研发了Paddle(Parallel Asynchronous Distributed Deep Learning)这个多机并行GPU这个训练平台,并将其在 2016 年 9 月正式开源,也是目前国内唯一开源的深度学习框架。

其二,所谓「深度学习正在推动人工智能进入工业大生产阶段」,则是强调了深度学习的落地能力,尤其是在工业领域的落地。王海峰列举了深度学习如何改进百度地图的路线规划以及基于遥感影像数据,监测城市土地使用情况的案例。

正是基于这样的技术判断,百度此次还首次对外公布了 PaddlePaddle 全景图,包括核心框架、工具组件和服务平台等,也发布了面向自然语言处理的 PaddleNLP、面向视频的识别工具、面向模型压缩的 PaddleSLim等。

2017 年开始,陆奇新政下的百度,会在每年 7 月举办 AI 开发者大会,集中展示百度在 AI 领域的技术和解决方案,2018 年 4 月陆奇离职,但 7 月份的 AI 开发者大会依然在 AI 赋能开发者的议题上做了新的尝试。

而在 2019 年 4 月,百度将深度学习单独拿出来放在一个会议上举行,并冠以「首届深度学习峰会」,也进一步凸显了百度对于深度学习以及 PaddlePaddle 的重视程度。

如果将此次峰会放在行业大环境里去看,或许也能理解其背后的动机。

首先,上月 3 月 27 日,ACM 宣布了 2018 年图灵奖得主。深度学习领域三位杰出学者 Yoshua Bengio, Yann LeCun, 以及 Geoffrey Hinton 获得了 该年度年度的图灵奖。

图灵奖作为计算机领域的「诺贝尔奖」,与其说看谁是获奖者,倒不如看这些获奖者所代表的领域。以今年的情况来看,尽管过去几年来包括强化学习、生成对抗网络(GAN)有不少突破,但从技术成熟度以及工业应用效果来说,上述三位学者——无论是 Geoffrey Hinton 之于 Google 还是 Yann LeCun 对于 FB——他们都将深度学习引入到工业领域,并证明了其拥有「改变世界」的能力。

其二,而在学术领域,根据去年年底斯坦福大学发布了《2018年度全球AI报告》,神经网络( Neural Networks )论文增长的复合年增长率(CAGR)在 2014 年只有 3%,而到 2017 年却达到 37%。

img

在地区分布里,欧洲一直是最大的 AI 论文出产地,2017 年 Scopus 数据库中 28% 的 AI 论文源自欧洲。与此同时,尽管 2008 年左右中国 AI 论文数量出现波动,但在 2007 年至2017年间,中国发表的论文数量增长了150%。

img

事实上,现在随意在 Google 用中英文搜索「中国 AI 论文数量」或「中国深度学习论文数量」都可以看到中国在这个领域的数量统治力。

第三,当深度学习证明了可用性,科技巨头们希望将技术和开发者留在自己的平台。比如 Google 和百度相继开源了深度学习框架 TensorFlow 与 PaddlePaddle,也是希望开源的形式获得开发者的认可,从而形成自己的 AI 生态。

与此同时,过去的 2018 年,「端到端」、「一站式」等词汇也开始频繁出现在科技公司的大会上,华为在 2018 年推出了「全栈全场景」的 AI 开发平台,AWS 也在年末强化了其 AI 平台的「完整性」,其架构如下图所示。

img

类似的平台,也在本月的 Google Cloud Next 上出现了。

img

这些开源平台、端到端的开发平台,旨在降低机器学习、深度学习的门槛。工具层面,大量 AutoML 的出现,让机器学习越来越成为一种可以即插即用的解决方案;服务层面,包括 Google、亚马逊以及百度,都提供了基于云端的机器学习服务,开发者甚至可以直接通过浏览器完成相关工作。

上述三个行业背景也构成了百度 PaddlePaddle 此次更新的意义:利用行业热点,争取更多开发者,尤其是中国开发者的认可和支持,搭建中国最大的深度学习开发者应用生态,或许才是百度最大的目的。

但这条路有众多不确定性。其一,深度学习自身有者天然的缺陷,它只是一种机器学习的方式,而不是最正确的方式或者终极方式。

这也意味着,未来几年可能有其他类型的机器学习方式替代其位置,事实也的确如此,比如RL、GAN 的应用场景也开始变多,这也要求这些科技公司们必须将新的机器学习技术纳入到自己的平台上,才能适应学术界的需求。

其二,如果说技术发展还算简单的话,那么将深度学习应用到工业场景里,则是一件更困难的事情。

一方面,前期的数据处理成本高昂,但没有数据,也就没有智能;另一方面,不管是深度学习还是其他机器学习,目前还局限在单一痛点问题上,如何将单一场景延伸出更多的需求,也是摆在全行业面前的共同挑战。

更重要的是,不管是国外的 Google 还是国内的百度,将深度学习推向工业界这件事显然已经成为一个 2B 的生意。目前,Google 已经将所有的 2B 生意放在 Google Cloud 架构里,负责 Google cloud AI 的 Andrew Moore 表示,Cloud 部门不再对 AI 研究有兴趣,他们更关注的是 AI 产品的落地。

如今,百度 PaddlePaddle 的工业化落地究竟由谁来主导还没有明确的定义,考虑到百度云计算还缺乏竞争力,或许未来还会有专门的事业部来推进。其官网信息显示,目前工业应用落地案例只有 7 个,而且更多的是作为单点技术突破,没有形成解决方案级别的产品。

上述这些不确定性,既有深度学习自身的缺陷,也有百度内部的整合问题,但作为国内唯一一款深度学习开源框架,PaadlePaadle 未来在技术、商业之外,还会有一定的政治价值,其进化路径也值得持续关注。(完)

Google Cloud 再起航、百度智能云产品发布以及京东云的出路

这期会员通讯,我们将目光放在云计算领域。目前从市场格局上看,AWS 和阿里云统治着当下美国和中国两大云计算市场。就在上周,美国五角大楼表示,AWS 和 Azure 将成为美国国防部云计算项目JEDI (joint enterprise defense infrastructure)的最后候选者,这个项目的预算高达 100 亿美元。

1 月底的最新一季财报里,阿里云的营收同比增长 84%,达到 66.11亿元人民币,正在成为一个季度营收 10 亿美元的生意(约合 9.62亿美元),全年营收也首次突破 200 亿人民币。

img

尽管前面有这几座大山,但从整个市场规模的角度去看,无论美国还是中国,围绕云计算的机会还有很多,结合上周 Google Cloud Next 大会、百度智能云大会以及京东云分拆的新闻,我们来讨论一下这背后的生意逻辑。

Google Cloud 变了吗?

我曾在去年详细分析过 Google 为何做不好云计算,其中一点提到了所谓的「企业基因」的玄学问题:

过去三年时间,Google Cloud 一直希望通过机器学习作为突围而出的捷径,上述一系列布局和整合,的确让 Google Cloud 拥有了人工智能领域的号召力,但 Google Cloud 的这些成绩,更多的是「Google」的生意,而非「Cloud」的生意,或者换句话说,Google Cloud 的企业级服务能力,尤其是大企业的服务能力,始终是一个无法跨越的坎。

某种意义上说,这更像是一个企业文化或企业基因的玄学问题。Google 长期以来形成的工程师文化,促使这家公司在新技术上不断创新,以云服务为例,早在 2008 年,这家公司就发布了面向 PaaS 服务的 Google App Engine(以下简称 GAE)。

简而言之,GAE 提供了一个利用 Google 底层技术来构建 Web 应用的平台,开发者可以方便地部署自己的应用。

这在遥远的 2008 年是一件非常炫酷的事情。彼时,亚马逊 AWS 只能提供最底层的 IaaS 服务,而微软的 Azure 还要至少两年才会发布,但 GAE 作为一款典型的 Google 产品,迷失在炫酷的技术与实用的功能之中,忽略了企业客户的核心诉求:稳定性

Google 越成功,其内部的文化惯性也越大......

这篇会员通讯发表于 2018 年 11 月 18 日,彼时,Diane Greene 宣布将在 2019 年 1 月离开 Google Cloud CEO 的职位,由前 Oracle 高管 Thomas Kurian 接任。

四个月后 Google Cloud Next 大会的舞台上,Thomas Kurian 带来了他对 Google Cloud 未来的规划。从产品层面,此次 Google Cloud 主要带来了六大更新,分别是:

  • 混合云产品 Anthos;
  • 与开源产品结盟,首批包括六大开源产品公司;
  • 面向零售领域的解决方案;
  • 端到端的 AI 平台 Google AI Platform;
  • 基于 Google 账号和 android 手机的云安全令牌;
  • 云端代码编辑器;

上述六个更新,从技术、产品、行业到生态。Thomas Kurian 显然为 Google Cloud 的突破找到了「捷径」。

首先,押注混合云产品。事实上,Google Cloud 去年 8 月发布了混合云产品「Google Cloud Services Platform」,Anthos 则更近一步。

为了解决当下企业在多个云计算服务商里的应用管理问题,Anthos 不仅可以让企业用户同时管理 Google Cloud 公有云和本地私有云的业务,还同时支持 AWS 和 Azure。这意味着,Google 将利用企业多云战略趋势和对于云计算厂商锁定的担忧,提供更多开放式的产品选择。

其次,与开源公司结盟。Google 热衷于开源,Kubernetes、TensorFlow 都是 Google 对于开源世界的贡献,利用这样的关系,Google Cloud 此次与包括 Confluent、DataStax、Elastic 在内的开源公司结盟,一方面是扩大 Google Cloud 的客户群体(毕竟这些公司已经拥有不小的客户),另一方面则是打压 AWS,AWS 也一直被诟病在开源领域贡献较少。

第三,瞄准零售领域。这又是一次有针对性的出击,在零售行业几乎一致抵制 AWS 的时候,Azure 和 Google Cloud 也成为新的选择,沃尔玛选择结盟微软、Target 则拥抱 Google Cloud,这是一个看起来双赢的战略选择,包括宜家、雀巢、宝洁(P&G)、泰森食品和联合利华等零售巨头在已经是 Google Cloud 的客户。

将这三条捷径放在 Thomas Kurian 的主题演讲里,或许可以近一步理解 Google Cloud 的未来进化路径,我在这里总结为三点:

  • 基础架构层面:打造全球规模的分布式架构,包括 Anthos、与思科戴尔等公司的合作懂属于这个层面;
  • 平台层面:打造数字化转型平台,比如端到端的 AI 平台以及与开源社区和公司的合作;
  • 特定行业层面:明确了金融、零售、医疗、制造、娱乐等为主要「攻坚」行业;

2019 年的云计算大戏,由此也正式开场。

百度智能云透露的三个信息

与 Google Cloud 在美国所处的境地类似,百度智能云在国内也处在第二梯队。先看财报数字:

  • 阿里云:季度营收 66 亿人民币;
  • 腾讯云:2018 全年营收 91 亿元(平均季度营收 20+亿人民币);
  • 百度云:季度营收 10 亿人民币;

再看市场份额,IDC 中国的这份数字里,百度云位于「ohters」,仅以 3.3% 的市场份额排名第八。

img

这是百度云计算业务所面临的市场格局,而他们在上周,也用一场峰会展现对于云业务的野心。

这场名为「INSPIRE」大会主要传达了三点信息。

其一,品牌层面:百度智能云继续与「ABC」绑定。所谓「ABC」,将组成 AI、Big Data、Cloud,百度将这三个当下最火热的技术名词(概念)纳入到自己的品牌宣传之中。

这样的宣传,实际上也在向行业释放百度在云计算领域所处位置的信号,那就提供「ABC」技术的平台供应商。

其二,产品层面:聚焦底层架构,在基础能力领域发布了一系列新产品。作为后晋厂商,百度在云基础设施产品上无疑是落后的,此次发布的产品包括计算、网络、存储、数据库、安全等产品,这些产品将强化百度智能云的 IAAS 层的竞争力。

其三,特定行业层面,发布面向视频产品的新解决方案百度智能视频平台。这个平台瞄准的不仅是当下火热的视频创业领域,还在争取行业视频的大市场,随着智能手机的普及和流量费用的逐年下降,视频正在成为各行各业的通用技术。

这也意味着,所谓视频行业,早已不再局限在普通消费者手机里的(长短)视频应用,而是一个更广层面的概念,比如任何一家企业都可能需要将视频服务整合到现有的业务里,但并不是所有企业都拥有开发视频平台的能力,百度所看重的恰好就是这个市场。

不过必须看到的是,上述三个方面并不能直接构成百度智能云的突围能力,短期来看,一方面百度在云计算领域还缺乏重磅客户,没有重磅客户的背书,其技术价值也会大大折扣。

另一方面来看,百度智能云的产品线还相当简陋,如计算、存储、数据库等基础类产品依然有较大提升空间,在此基础上,私有云、混合云等产品线何时发布也令人期待。

但好信息则是,当下依然是中国云计算市场格局动荡的时间点,不管是腾讯还是百度,都在 2018 年经历了云业务的架构调整并开启了快速增长,百度云一直宣称自己是「最快营收超过 10 亿元的公司」,这也从一个侧面展现了中国云计算领域巨大的增长潜力。

京东云还有出路吗?

这或许也是京东云或独立的一个大背景

据媒体的报道称,京东云正在计划从京东内部独立,成为与京东商城、京东数科、京东物流并列的独立子公司。

公开资料显示,京东云是在 2016 年起步。2017 年,时任微软亚太研发集团首席运营官的申元庆加盟京东云,担任总裁,鉴于申元庆曾在微软以及 Azure 里的重要影响力,外界普遍认为这是京东发力云计算的开始,但随后的时间里,京东云便陷入沉寂。

这期间发生了什么或许很难有确切的信息,但有一点是肯定的,京东云几乎没有大发展。新浪科技援引京东云内部人士的消息,2018年京东云内部定下 8000 万元营收的目标,这个目标是 2017 年的 8 倍,而 2019 年设立的目标 2018 的 8 倍营收。

这个「内部消息」(不排除是故意泄露)里有两个潜台词。其一,2017 年京东云只有 1000 万营收;其二,2018 年的 8 倍目标,也就是 8000 万营收是否实现是个大疑问。

即便是 2018 年实现了营收目标,也就是 8000 万人民币,且不说无法跟阿里、腾讯、百度相提并论,即便是和刚刚寻求科创板上市的 Ucloud 相比,这个数字也实在可怜。

根据 Ucloud 招股说明书的公开数字,Ucloud 在过去三年(2016、2017、2018)分别为 5.2 亿、8.4 亿以及 11.8 亿。

img

至于市场份额,京东云更是可以忽略不计。与此同时,此前从京东独立出去的京东数科,其目前的业务架构里,就有不少与云计算业务落地的场景和业务,其官网上这样写道:

京东数字科技的经营宗旨是用数字科技连接金融和实体产业,助力产业提升互联网化、数字化、智能化水平,推动实体经济的发展,创造社会价值。

京东数字科技以数据技术、AI、IoT三大时代前沿技术为核心,已经完成在数字金融、数字城市、数字农业、数字营销、数字校园等领域的全面布局,在客户群体上实现了个人端,企业端,政府端的三端合一。未来,京东数字科技将在深耕现有业务领域的同时,进入更多实体产业领域。

上述介绍语里只需适当加入「云」,也就构成了一家云计算公司的介绍。也因此,京东云这样一个没有营收、没有市场份额、业务又和兄弟公司重叠的公司,其独立运作又有什么价值呢?

积极一点来说,或许是因为刘强东看好云计算业务,但悲观一点则是因为要将这个极度烧钱的业务丢出去。

当 2019 年阿里云全面升级之后,这个「一大多小」的中国云计算战场走势,还有巨大的想象空间,行业洗牌再所难免,2B 领域的大战看似平淡,却也是技术价值与商业价值变现的写照,而京东云无论是技术还是商业能力,实在无法满足市场需求。(完)

Google 的 AI 伦理探索之路、欧盟出台 AI 伦理指南以及三个核心议题

差不多一年前,Google 经历了一次影响广泛内部「博弈」。

Google 员工发现公司(准确地说是 Google Cloud)正在参与美国军方的无人机项目 Maven,该项目是美国五角大楼与包括 Google 在内的多家公司共同参与,旨在利用机器学习来分析美军无人机拍摄的画面,从而提升无人机打击的精准度。

这意味着,Google 的 AI 正在被应用到军事领域。这也引发了 Google 内部员工的巨大反响,数千名员工签署联名信,呼吁公司停止这个项目。

这个「博弈」一直延续到 6 月,时任 Google Cloud CEO 的 Diane Greene 在 2018 年 6 月 3 日宣布,Google 在该项目合作到期后,不再继续参与其中

紧接着,Google CEO 皮查伊透过官方博客进一步介绍了 Google 对于未来人工智能的使用原则和底线,根据科技媒体爱范儿的翻译,主要包括以下几项:

  • 对社会有益。
  • 避免制造或者加深不公平的偏见。
  • 在开发中进行测试以确保安全。
  • 对人类负责。
  • 隐私原则。
  • 坚守对卓越科学的追求。
  • 在使用中考虑首要用途、技术的独特性及适用性、使用的规模这三个因素。

四个底线包括:

  • 对于那些将产生或者导致伤害的整体性技术,我们会确保其利大于弊,并将做好确保安全的相关限制。
  • 不会将 AI 用于制造武器及其它将会对人类产生伤害的产品。
  • 不会将 AI 用于收集或使用用户信息,以进行违反国际公认规范的监视。
  • 不会将 AI 用于违反国际法和人权的技术开发。

但正如我在当时一篇会员通讯里所言:

Google 既没有设置相应的监督机制,也没有提出必要的防御措施,整个表态也就失去了其意义,此次 Maven 项目的争议中,Google 内部上千名工程师的签名信以及辞职威胁的作用到底有多大,以及在其他公司又有多少可复制性,都是一个巨大的问号。

这个问号一直延续到了 2019 年 3 月。

2019 年 3 月 26 号,Google 通过官方博客正式宣布成立一个「先进技术外部咨询委员会(Advanced Technology External Advisory Council,以下简称为 ATEAC)」。

按照 Google 官方的说法,这个委员会将评估 Google 多项 AI 技术的潜在影响,比如脸部识别里的肤色偏见以及机器学习应用过程里的其他偏见等。该委员成员也涉及 AI 学术界、经济、政策、伦理等领域,首批成员共有八人,详细资料在这里

img

从 AI 伦理的角度去看,Google 希望将内部 AI 伦理原则与外部 AI 咨询委员会结合在一起,至少在 PR 层面重塑 Google 的形象。

但事情的走向从一开始就发生了变化。

Google 员工发现这个提供「技术伦理道德」咨询的委员会,其组成成员却在某些议题上非常「不道德」,比如委员会里的 Dyan Gibbens,其身份是无人机公司 Trumbull 的 CEO,该公司与军方关系密切;再比如 Heritage 基金会负责人 Kay Coles James,在 LGBT 议题上持非常保守的态度,她不止一次地反对 LGBT。

这也再次引发 Google 员工的抗议,其背后的动因不仅是这两位成员的「伦理」,还涉及了 Google 到底是如何选择的这些成员,如果说成立外部咨询委员会让 AI 技术伦理实践更具透明度,那么这个委员会成员筛选的透明度又如何保障?

最终,在上周五,Google 宣布解散这个委员会,官方声明以「更新」的方式添加到了委员会成立的新闻上面:

It’s become clear that in the current environment, ATEAC can’t function as we wanted. So we’re ending the council and going back to the drawing board. We’ll continue to be responsible in our work on the important issues that AI raises, and will find different ways of getting outside opinions on these topics.

兜兜转转,又回到了原地。

但 AI 伦理监管的探索还在继续。

本周一,欧盟委员会再一次强调了科技公司必须建立 AI 伦理原则,以防止 AI 技术被滥用。

根据 The Verge 的报道,欧盟委员会在这份 AI 伦理指南里,提出了以下几个「要求」:

  • 人类影响与监督:人工智能不能超越人类的自主性。人类不能被AI系统操纵或者胁迫,人类要能够干预或监督软件做出的决定。

  • 技术的稳健性和安全性:人工智能应该是安全的、准确的。它不应该易于受到外部攻击的影响,应该是相当可靠的。

  • 隐私和数据管理:人工智能系统收集的个人数据应是安全的、私有的。它不应该被任何人接触,也不能被盗。

  • 透明性:创建人工智能系统的数据和算法应该是可访问的,软件所做的决定应“由人类理解和跟踪”。换句话说,操作员应该能够解释AI系统所做的决定。

  • 多样性、非歧视和公平性:人工智能服务应该面向所有人,无论年龄、性别、种族或其他特征。AI不应该存在偏见。

  • 环境和社会福祉:人工智能应该是可持续的并可以「导致积极的社会变革」。

  • 问责机制:人工智能系统应该是可审计的,并被纳入企业可举报范畴,以便受到现有规则的保护。应事先告知和报告系统可能产生的负面影响。

路透社的消息称,欧盟目前有一个来自 50 多家机构(公司、高校)的咨询委员会,上述几项原则也正是出自这个机构。当然这些「要求」还不具有法律约束力,不过鉴于欧盟对于数据隐私、互联网的强势管理方式,未来不排除正式出台 AI 伦理监管的法律。

透过 Google 外部委员会的闹剧与欧盟的举措,《华尔街日报》也提供一份 AI 伦理监管需要关注的问题。

其一,千万不要忽视 PR 层面的争议。如果要成立 AI 伦理监管委员会,一定要提高一整套、清晰的成员筛选标准;

其二,AI 伦理监管的权力问题。公司外部 AI 伦理监管太过于表面,如果要符合欧盟对于 AI 伦理的要求,那么公司一定要拥有内部的 AI 伦理机制,既有向公司董事会汇报的权力,也应该了解、并参与 AI 项目;

其三,制定更详细的 AI 伦理道德准则。包括数据使用、隐私保护以及透明度、算法可解释等方面的具体原则,以此来约束和规范公司的 AI 项目。

AI 伦理监管的探索还将继续,欧盟委员会数据代表 Andrus Ansip 的这句话颇为应景:

The ethical dimension of AI is not a luxury feature or an add-on. It is only with trust that our society can fully benefit from technologies......