← Dailyio 历史存档 | 搜索

标签: 人工智能

共有 76 篇文章

被贩卖的 AI 片面性,你需要认识人类自己还是认识机器?

上周,《华尔街日报》一篇关于 Gmail 邮件被第三方厂商随意查看的报道却意外揭开了科技行业另一个谜团:当下所谓各家公司所标榜的「人工智能」,其核心竞争力不是机器,而是人

当然,这句话的理解方式有很多,比如,你当然可以认为,过去几年人工智能领域所掀起的「抢博士」热潮,人工智能的竞争,也是人才竞争;而与之相对的则是另一个事实,在这个看似高大上以及被媒体热议要时刻替代人类的行业,更需要愿意重复劳动的廉价劳动力。看下面这段叙述:

……Return Path assigned two data analysts to spend several days reading 8,000 emails and manually labeling each one, the person says. The data helped train the company’s computers to better distinguish between personal and commercial emails.

Return Path declined to comment on details of the incident, but said it sometimes lets employees see emails when fixing problems with its algorithms……

还有另一家公司,他们要解决的邮件的智能回复,当机器无法从海量邮件里提取智能回复的样本时,人类就上场了:

Two of its artificial-intelligence engineers signed agreements not to share anything they read, Mr. Berner says. Then, working on machines that prevented them from downloading information to other devices, they read the personal email messages of hundreds of users—with user information already redacted—along with the system’s suggested replies, manually indicating whether each made sense.

随后《卫报》的报道则将这种现象一分为二地做了分析。首先,在保证数据隐私的前提下,人工智能需要人类智能这件事本身就很合理,不管是搭建神经网络还是参数调优,都需要人类智能的高度介入,而这一部分人类智能绝大多数来自该领域的专家、博士。

其二,人工智能领域还隐藏着一些「潜规则」,他们会将人类智能包装为人工智能产品进行售卖,《卫报》列举了其中一家公司:

In 2017, the business expense management app Expensify admitted that it had been using humans to transcribe at least some of the receipts it claimed to process using its “smartscan technology”. Scans of the receipts were being posted to Amazon’s Mechanical Turk crowdsourced labour tool, where low-paid workers were reading and transcribing them.

这种做法不仅是对投资人的欺骗,也是对用户的欺骗,而当涉及到与人类交流时,类似的做法也让技术陷入到另一个道德困境中,一个很简单的问题:当你认为你在和一个智能程序聊天时,你的言谈方式会和与人类(客服)聊天一样吗?

答案显然是否定的。事实上,早在上世纪 70 年代,MIT 科学家约瑟夫·魏泽鲍姆就发现了这个现象,当时,他创造了有史以来第一个 Chatbot 伊莉莎。

img

伊莉莎原本是用于在临床治疗中模仿心理医生。尽管伊莉莎的实现技术仅为关键词匹配及人工编写的回复规则,导致对话是单向的而且也会产生一些很奇怪的回复,比如,当用户提到自己的妈妈时,伊莉莎会以「你说你妈妈?」这样的句子来回复,但依然有很多人沉迷与伊莉莎的聊天,甚至会透露一些私密的个人信息。

《连线》也曾在 2017 年报道了一个研究发现,从而进一步佐证了这个事实:

“People are very open to feeling connected to things that aren’t people,” says Gale Lucas, a psychologist at USC’s Institute for Creative Technologies and first author of a new, Darpa-funded study that finds soldiers are more likely to divulge symptoms of PTSD to a virtual interviewer—an artificially intelligent avatar, rendered in 3-D on a television screen—than in existing post-deployment health surveys. The findings, which appear in the latest issue of the journal Frontiers in Robotics and AI, suggest that virtual interviewers could prove to be even better than human therapists at helping soldiers open up about their mental health.

硅谷资深记者约翰· 马尔科夫在《与机器人共舞》一书曾这样评价伊莉莎:「这证明人类习惯在与自己互动的对象中寻找人性存在的迹象,从没有生命的物体到提供虚拟人工智能的软件程序,无一不是如此。

img

这也就不难理解,为何当 Google 展示一个可以给人类打电话聊天的 Duplex 时会引发如此大的争议1,硅谷资深记者 Steven Levy 当时在 Twitter上写道:

Is it ethical to have a human-sounding robot interact with someone without informing the other party that he or she is in conversation with an it? Real question.

联想到刚刚完结的《西部世界》第二季里的一个场景:一个妹子在园区被男子搭讪,两人在上床前,女子要用游戏枪来「检验」这个男子到底是不是机器人。

随着剧情的发展,当机器人接待员混杂到人类之间,你如何确定和你聊天的这个「东西」是人类还是接待员?而当这个场景延伸到现实里,就像 Google 展示 Duplex 时那样,你如何确定电话那头到底是纯粹的机器还是人类操控的机器抑或纯粹是人类?

如果将上述讨论继续下去,会涉及越来越多的心理学、哲学以及伦理学知识,不过有趣的是,这些看似是围绕机器该做什么的讨论,其落脚点都在人类身上,或者可以这样理解,上述讨论只回答了问题的一个答案:人类到底是什么?

但这个问题还需要另一个答案,那就是怎么回答「人工智能/机器学习到底是什么?」

a16z 合伙人 Benedict Evans 最近的一篇文章就试图回答这个问题,这篇名为Ways to think about machine learning的文章读起来并不容易,但 Evans 把握住了当下人工智能/机器学习热潮的关键要素:数据

正因为数据,所以新型的自动化(或者说被包装的人工智能)才得以展开;同时,数据让人工智能/机器学习具备了上世纪 70 年关系型数据库的角色,成为驱动企业发展的新力量;这一系列的叠加,可能会让人工智能成为一种技术基础设施。

img

其中,Evans 对于关系型数据库和人工智能/机器学习之间的相似之处,以及公众如何误解自动化的叙述非常值得一读:

An important parallel here is that though relational databases had economy of scale effects, there were limited network or ‘winner takes all’ effects. The database being used by company A doesn’t get better if company B buys the same database software from the same vendor: Safeway’s database doesn’t get better if Caterpillar buys the same one. Much the same actually applies to machine learning: machine learning is all about data, but data is highly specific to particular applications. More handwriting data will make a handwriting recognizer better, and more gas turbine data will make a system that predicts failures in gas turbines better, but the one doesn’t help with the other. Data isn’t fungible.

This gets to the heart of the most common misconception that comes up in talking about machine learning - that it is in some way a single, general purpose thing, on a path to HAL 9000, and that Google or Microsoft have each built one, or that Google ‘has all the data’, or that IBM has an actual thing called ‘Watson’. Really, this is always the mistake in looking at automation: with each wave of automation, we imagine we’re creating something anthropomorphic or something with general intelligence. In the 1920s and 30s we imagined steel men walking around factories holding hammers, and in the 1950s we imagined humanoid robots walking around the kitchen doing the housework. We didn’t get robot servants - we got washing machines.

Washing machines are robots, but they’re not ‘intelligent’. They don’t know what water or clothes are. Moreover, they’re not general purpose even in the narrow domain of washing - you can’t put dishes in a washing machine, nor clothes in a dishwasher (or rather, you can, but you won’t get the result you want). They’re just another kind of automation, no different conceptually to a conveyor belt or a pick-and-place machine. Equally, machine learning lets us solve classes of problem that computers could not usefully address before, but each of those problems will require a different implementation, and different data, a different route to market, and often a different company. Each of them is a piece of automation. Each of them is a washing machine.

上述三段略显啰嗦的话可谓戳穿了围绕人工智能行业的诸多谎言,这些谎言在过去几年时间被巨头公司、媒体、资本甚至好莱坞包装起来贩卖,公众在一次次被诸如「人机大战」、「机器取代人类」的内容冲击之中,除了陷入到「我是谁、我从哪里来、我到哪里去」的终极提问,已然失去了对于技术发展的正确认知,或许,这是机器给人类的一道诅咒吧。


  1. 我曾在之前的会员通讯里对此做过分析,详见这里 ↩

英伟达「投资笔记」

过去三年时间,英伟达的股价已经翻了 10 倍,这是一个利用行业红利快速实现增长的典型案例,也因此,英伟达成为众多科技媒体关注的焦点。然而,这些分析文章中最容易出现的一个认知误区「幸存者偏差」,即英伟达的成功来自于人工智能行业对于 GPU 的强烈需求,所以要想在人工智能领域成功, GPU 是必然选择,这也是包括英特尔在内的芯片公司必须努力的方向。

img

这个偏见不仅包括包含了认知误区,还对人工智能的现状以及未来缺乏必要了解,GPU 的确是目前人工智能,尤其是深度学习领域的重要需求,但也应该看到,业界目前对于 GPU、FPGA(可编程逻辑阵列,英特尔和微软都在投入)、TPU(Google 力推的深度学习芯片)的地位尚无明确好坏评价。

另一方面,深度学习终究是人工智能的一个小分支而已,也并非万能算法,它的种种局限性,比如对于数据的强烈需求、算法的黑盒子等等,都是自身无法克服的难题。因此,长远来看,必然有更好更高效的算法出现,而到那个时候,GPU 还会是支撑新算法的最好硬件吗?恐怕未必。

视线回到英伟达,我们可以试着避开过去英伟达到底做了什么使得市值增长了 10 倍,而是将关注点放在当下,从当下这家公司在做什么的视角,结合行业发展趋势,最后做出一个研判。

上月 30 号,英伟达在台北发布了全新的 HGX-2,这是一个面向服务器的 GPU 产品线 HGX 系列的升级产品。英伟达更是宣布,HGX-2 不仅可以用于服务器,还可以在 HPC(高性能计算)领域有所作为,成为业界首个可针对跨领域计算应用的 GPU 平台。

过去三年多时间,与英伟达股价上涨同时发生的,还有这家公司的转型,英伟达正在从一个单一的 GPU 供应商变为一个 GPU 平台公司1,这从该公司目前的业务架构可见一斑,目前英伟达的 GPU 平台业务架构包括:

  • GeForce 系列:面向个人和专业游戏计算;
  • Tesla 系列:面向数据中心;
  • DRIVE 系列:面向自动驾驶;
  • Quadro 系列:面向专业视觉化计算;

img

更重要的一点,上述四个 GPU 平台还有不同的产品线,可以覆盖低中高等不同群体/用户的需求。当然,英伟达还在开发面向医疗和制造业等方面的新平台,使 GPU 能在这些领域发挥作用。比如在 2018 的 GPU 技术大会上,英伟达展示了应用于医疗领域的 Clara 平台和制造业的 Issac 平台,但仍在研发阶段,还未投入使用,因此暂不在本文讨论范围。

游戏领域一直是英伟达重要的收入来源。2019 财年第一季度,英伟达游戏业务收入相比去年增加了 68%,达 17 亿美元。当「大逃杀」、「孤岛惊魂5」、「最终幻想 XV」等游戏越来越受欢迎时,也意味着英伟达的 GPU 销量开始上升。

img

技术层面,2018 的 GPU 技术大会上,英伟达展示了一种新的光线追踪技术 RTX,这种技术可以使游戏画面达到大荧幕的级别,可与微软 DXR 应用界面媲美,任何一款在 GeForce 平台上使用 DXR 的游戏,在使用 RTX 后都将提速。

img

英伟达表示已经花费超过十年时间研发 RTX ,该技术有望在2018年底问世,搭载该技术的产品将于 2019 年完成。英伟达希望 RTX、4K 和 VR 技术的普及进一步推动 GPU 需求的增长。

但在游戏领域也有一个不稳定因素:加密货币。在 2019 财年第一季度,挖矿者对于 GPU 的需求非常强烈,一度导致供应紧张,Geforce 显卡的市场价翻了三倍。

英伟达 CFO Collette Kress 在财报会议上也承认:

Cryptocurrency demand was again stronger than expected, but we were able to fulfill most of it with crypto-specific GPUs …

与此同时 Collette Kress 也进一步表示:「 Looking into Q2, we expect crypto-specific revenue to be about one-third of its Q1 level.」这也意味着,加密货币到底能有多大潜力左右未来英伟达 GPU 的新业务,还值得长期观察。

数据中心则是英伟达另一个快速增长的业务。过去三年里,该部分业务收入年平均增长率 85%,2018 年财年增长率为 133%。这些增长来源于 HPC(高性能计算机群),云计算公司和 AI 研究者等多种垂直领域。英伟达也因此扩大了此类产品组合,以满足垂直领域的增长需求。

img

截止 2019 财年第一季度,英伟达数据中心的收入较上年增长 71%,较上季度增长 16%,达 7 亿美元。这是两年以来年增长率第一次从三位数跌至两位数,但仍然非常可观,英伟达正着手将数据中心产品打造得更加多元,同时开辟一些新的板块。

产品层面,2017 年 6 月,英伟达发布了下一代拥有 Tensor cores 的 Volta GPU, 依靠深度学习,Volta 比它的前代 Pascal 快了 5 倍。Volta 目前已经得到微软 Azure 以及 Google Cloud 的采购,同时也受到众多服务器制造商的青睐。

img

2018 GPU 大会上,英伟达发布 TensorRT 4,这是一个面向深度学习的推理加速器,使用 TensorRT 4之后,用户可以加快深度学习的进程,比如语音识别、推荐、计算机视觉等,相较于 CPU ,其速度能快 190 倍。

受限于行业发展现状,英伟达自动驾驶业务进展并不快,其收入更多来自于车载信息娱乐系统。如下图所示,过去三年,英伟达汽车业务的收入年平均增长率为 45%,2018 财年增长率为 15%,2019 财年更是降到 4%,为 1.45 亿美元。

img

英伟达的自动驾驶布局,主要是通过和汽车厂商、共享出行服务商合作来实现落地和商业化。2018 年 3 月,英伟达与 Uber 合作的一辆自动驾驶汽车发生车祸,英伟达也暂停了相关测试。

而在 2018 GPU 大会上,英伟达推出针对自动驾驶的 DRIVE 运算平台。英伟达希望将自身的 GPU 优势转化为一个可用于自动驾驶测试的计算平台,简言之,自动驾驶汽车公司可以使用这个平台,在虚拟世界的各种场景下进行测试和研究,免于上路测试的风险。

img

这个平台包括两个服务器,一个用于模拟汽车测试的虚拟场景,另一个是基于 DRIVE Pegasus AV 的服务器,用于在虚拟环境下驾驶汽车。

这更像是一个全新的「数据中心」平台业务,只不过只限于自动驾驶领域,目前包括丰田在内的 300 多个公司都在和英伟达进行自动驾驶领域的合作。

英伟达在无人驾驶汽车方面的营收有望在 2035 年达到 600 亿美元规模,其直接竞争对手是英特尔和 Google,这个领域的竞争也将变得非常激烈。

最后来看看英伟达的专业视觉化业务。这是一个增长非常缓慢的业务。过去三年里,英伟达 专业视觉化(ProV)业务收入的年增长率仅为 6%,而在 2018 财年增加产品应用后,增长率提高至 12%,仍然非常低。

img

到了 2019 财年第一季度,英伟达 ProV 业务收入的年增长率达到 22%,较上季度下降 1%,收入 2.51 亿美元,已远超预期。

这得力于随着 AR 和 VR 技术的逐渐成熟以及包括零售、医疗领域的大量需求。高端产品线 Quadro GPU 的主要需求来自哥伦比亚大学的 AI 实验室,以及西门子的计算机断层成像和超声波解决方案。甚至 AMD 在这阶段的 GPU 销量也增长很快。

在看到 AR 和 VR 技术在建筑、产品设计、游戏等领域的潜在机遇后,英伟达加大了 ProV产品的开发。

img

梳理完英伟达的四大平台之后,接下来的问题就是:「英伟达还能继续上涨吗?还值得投资吗?」

这个问题看似是个股票问题,却也是一个技术发展趋势问题。正如上文所言,过去三年推动英伟达增长的主动力是人工智能产业对于 GPU 强烈需求,那么未来三年呢?

正如本文开篇时所言,随着人工智能的发展,GPU 未必是最适合的硬件,这也意味着英伟达的数据中心业务将面临巨大的不确定性;

其次,自动驾驶领域的竞争才刚刚开始,英伟达当然有自己的优势,不过当英特尔、Google、百度甚至苹果都在努力切入该领域之后,英伟达如何应对也将成为观察这家公司未来发展的重要角度。

最后则是一个可以确定的领域:游戏。英伟达在这个领域的技术积累和商业运作已经非常成熟,从某种意义上说,游戏会成为英伟达短期内支撑数据中心转型以及自动驾驶发展的重要资金来源。


利益相关:本人未持有英伟达任何股票。


  1. 这里的「平台公司」不限于人工智能。  ↩

人工智能的新黑盒子

沸沸扬扬的 Google 与五角大楼人工智能合作争议基本终于有了答案。负责 Google Cloud 的高管 Diane Greene 在 6 月 3 日宣布,Google 在该项目合作到期后,不再继续参与其中

而上周,Google CEO 皮查伊透过官方博客进一步介绍了 Google 对于未来人工智能的使用原则和底线,以下是科技媒体爱范儿的翻译:

  • 对社会有益。
  • 避免制造或者加深不公平的偏见。
  • 在开发中进行测试以确保安全。
  • 对人类负责。
  • 隐私原则。
  • 坚守对卓越科学的追求。
  • 在使用中考虑首要用途、技术的独特性及适用性、使用的规模这三个因素。

四个底线包括:

  • 对于那些将产生或者导致伤害的整体性技术,我们会确保其利大于弊,并将做好确保安全的相关限制。
  • 不会将 AI 用于制造武器及其它将会对人类产生伤害的产品。
  • 不会将 AI 用于收集或使用用户信息,以进行违反国际公认规范的监视。
  • 不会将 AI 用于违反国际法和人权的技术开发。

Google 这一系列举措旨在摆脱自己被包装为战争帮凶的形象,同时也希望人工智能行业内部形成一个共识,将人工智能用在所谓「好」的方面,多做些对社会「有益」的事情。

但事情绝非这么简单。

首先,技术进步与政治、军事的结合是不可避免的必然现象。我们当然不能忽略二十世纪由于化学、物理进步给全人类的福祉,不过更不能忽略的是,一战时期的氯气、二战的原子弹,都是化学、物理、数学等学科综合发展所带来的「副作用」。

在当下,人工智能作为前沿技术之一,包括语音、图像和自然语言理解等技术,已经在消费领域和工业领域展现出不俗实力,其被军方看中从而应用于军队项目也在情理之中。以 Google 此次争议比较大的 Maven 项目来看,其核心是利用图像、视频的识别、跟踪技术来帮助军用无人机自动跟踪目标,过往这些工作都是人类操作员远程操作1,而通过人工智能技术,可以大幅提升跟踪目标的准确性、实时性,最终更好地消灭这些敌人。

其次,从生意的角度来看,政府又是新技术的最大卖家。公开资料显示,IBM 长期以来都是五角大楼和中情局的主要 IT 供应商之一,2013 年的时候,亚马逊一举击败 IBM,拿下了中情局 6 亿美元的云服务合同。而从 2017 年开始,亚马逊 AWS 也成为五角大楼新一份高达 10 亿美元合同的潜在赢家,《华尔街日报》这样写道:

The next big break could come with the Pentagon’s planned $10 billion, 10-year move to the cloud. The proposed contract, called JEDI, would require a cloud infrastructure that could handle unclassified material as well as data classified as secret or top secret, defense department documents said.

更重要的一点,包括甲骨文、微软、IBM 在内的其他 IT 企业组成了一个游说组织,他们更希望军方在这个项目中采用所谓的「多云」策略,避免单一云服务供应商的局面,这也凸显出政府在各大 IT 企业潜在客户群里的重要地位。

科技博客 The Intercept 在 Google 内部泄露邮件里也发现,Google 内部对于其商业前景非常看好:

The September emails show that Google’s business development arm expected the military drone artificial intelligence revenue to ramp up from an initial $15 million to an eventual $250 million per year.

 

In fact, one month after news of the contract broke, the Pentagon allocated an additional $100 million to Project Maven.

这些邮件内容还进一步显示,Maven 项目还有其他巨头参与,Google 希望通过这个项目打压亚马逊 AWS:

The internal Google email chain also notes that several big tech players competed to win the Project Maven contract. Other tech firms such as Amazon were in the running, one Google executive involved in negotiations wrote. (Amazon did not respond to a request for comment.) Rather than serving solely as a minor experiment for the military, Google executives on the thread stated that Project Maven was “directly related” to a major cloud computing contract worth billions of dollars that other Silicon Valley firms are competing to win.

第三,科技公司与政府合作的透明性又如何体现出来?即便是在此次皮查伊亲自撰写的公开信里,也有这么一段话:

We want to be clear that while we are not developing AI for use in weapons, we will continue our work with governments and the military in many other areas. These include cybersecurity, training, military recruitment, veterans’ healthcare, and search and rescue. These collaborations are important and we’ll actively look for more ways to augment the critical work of these organizations and keep service members and civilians safe.

这意味着,Google 不会停止与政府的合作,只是不会和政府合作涉及到战争的项目。也正是这段话,让 Google 此次发布的这些原则和底线都更像是一个纯粹的 PR 行为。Google 即没有设置相应的监督机制,也没有提出必要的防御措施,整个表态也就失去了其意义,此次 Maven 项目的争议中,Google 内部上千名工程师的签名信以及辞职威胁的作用到底有多大,以及在其他公司又有多少可复制性,都是一个巨大的问号。

从这个角度去看,公众早先对于人工智能的担心,有很大一部分是因为其算法本身是个黑盒子,而现在,我们更应该考虑的是,这些从事人工智能的科技巨头们,到底和政府做了哪些合作?有哪些你不知道的人工智能项目,最终影响到你我的日常生活?

2018 年的确是人工智能行业开始分化的一年。我在上周的一期会员通讯里阐述了为何人工智能是个没有「新市场」的行业 。也因此,依托人工智能概念与技术的国内外创业公司以及科技巨头们,迫切需要可落地的商业项目来支撑估值和市值,那么,把人工智能卖给谁,就成为中美人工智能公司们必须面对的共同课题。

正如上文所言,人工智能相关技术与政府采购的契合点使得政府成为这个市场的重要买家。与亚马逊、Google 进入美国军方项目相比,中国广大科技公司们则利用人脸识别、图像识别,抢占政府公共领域的安防市场,现在只需随手在 Google 上搜索「人工智能+安防」,至少 80 万条搜索结果足以显示出这个市场有多大热度。

其次,人工智能的技术伦理与国家安全和社会民生的冲突也会持续出现。一位参与某城市智能交通项目的人工智能博士私下透露,尽管所有交通路口的算法都由他们团队来研发,但这个路口交通信号灯的时间间隔到底是多少,是由交警部门手动设置,而不是由算法自动推荐生成。也就是说,不管人工智能算法如何优秀,技术层面的决策与业务层面的决定不会完全一样,甚至会出现完全不同的选择。

最后表达我的一个悲观预测,人工智能的未来绝对不会失控,因为政府不会让它失控,同时也因为政府的参与,人工智能的未来也更加恐怖,最近有一部「恐怖片」《Anon(匿名者)》推荐看看。


  1. 推荐一部讲述无人机攻击敌人的电影《天空之眼》 ↩

AI 之于美国经济的影响以及为什么 AI 是一个「没有新市场」的战场?

过去两年多的时间里,中美两国几乎同时进入人工智能风口期。下图来自 CBinsighits 的统计数字,非常清晰地展示了人工智能市场的资本活跃度。

img

而在另一张图里,Google、苹果、Facebook、微软等巨头也频频出手,成为人工智能市场上的最大买家。

img

而在中国,仅以机器视觉为例,2017 年的投资数量和投资总额都再创新高。

img

而随着以伊隆·马斯克为代表的科技大佬们(比如比尔·盖茨),频频发表人工智能副作用的惊悚言论,越来越多的人开始发问:人工智能真的已经「侵入」到社会经济并开始影响到经济发展了吗?人类的多个工作马上就可以被机器代替了吗?

真实情况并非如此。

上月,前美国总统经济顾问 Jason Furman 和纽约大学教授 Howard Seamans 共同撰写了一份报告。这份名叫「AI and the Economy」的报告指出了一个略显残酷的事实:人工智能之于美国经济的影响几乎微乎其微。

之所以要讨论这份报告,有以下几个考量。首先,参考历次技术革命带来的影响,比如生产效率的提升以及职业变化1,其最后的落脚点都是社会经济水平的整体提升,倘若人工智能不能实现这个「小目标」,也无法胜任过往技术革命中蒸汽机、电力的角色。

其次,以中美当下的产业结构来看,倘若人工智能无法在人力成本高昂的美国,还推动生产效率的提升,并创造出新的职业,那么,人工智能一样无法令中国的产业结构发生大的变化。毕竟,中国目前的经济发展还远远没有达到必须依靠机器来提升生产效率的阶段。

因此,透过这份来自美国的「体检报告」,我们可以部分意义上戳破人工智能的炒作泡沫。

回到这份报告,两位作者先从一些基本数字入手,比如全球人工智能融资状况,特别提到了工业机器人这个特定领域,包括全球工业机器人的出货量以及工业机器人的应用领域。

img

img

由于工业机器人带来的经济增长更容易量化,因此,作者在接下来的几个章节里,重点介绍了工业机器人对生产效率以及劳动力市场的影响,作者指出,工业机器人带给经济的影响与蒸汽机早期的表现非常类似:

The case for productivity growth from AI can look to empirical research on robotics for support. According to Graetz and Michaels (2015), robotics added an estimated 0.4 percentage points of annual GDP growth between 1993 and 2007 on average for the 17 countries in their sample (accounting for about one-tenth of GDP growth during this time period). The authors note that these effects are of similar magnitude to the impact of steam engines on growth in the United Kingdom.

而在劳动力市场,并没有直接证据显示人工智能发展与人类失去工作的证据,反而是一个亘古不变的真理始终影响着劳动力市场,那就是劳动力的受教育水平与收入直接相关,作者写道:

In all of these cases, however, there is a strong relationship between the occupations or skills that can be automated and income or education. CEA (2016) used the Frey and Osbourne characterizations and found that jobs making less than $20 per hour had an 83 percent probability of automation while jobs making over $40 per hour only had a 4 percent probability of automation, as shown in Figure 8. Although the levels are very different in the OECD study, the gradient is the same—with jobs that require a high school degree or less much more likely to be automatable than jobs with a college or graduate degree, as shown in Figure 9. This highlights that going forward it is reasonable to expect that to the degree that AI does not displace labor, part of that will be because relative wages adjust, in other words that inequality rises. In addition, the pressure on lower-skilled jobs risks the continuation of the same trend that has contributed to declining labor force participation for prime-age workers.

这份报告并非否定人工智能的价值,而是透过对生产效率和劳动力市场的分析,证明了当下人工智能的非理性狂热,无论未来人工智能会如何影响人类社会的发展,至少在短期内,所谓人工智能改变世界的说法都是扯淡。

类似的情况也在中国有所展现。不久前,亿欧网在针对国内人工智能创业市场盘点时发现,这个市场现在已经进入到一个全新的阶段,所谓「落地」:

一个显著的变化是,去年创始人还在拿数据和算法讲故事,今年则开始强调大订单与大客户。

其中一句话非常中肯:「这里没有新的市场」,这可谓一针见血地指出了目前人工智能创业的最大困境:一批批科学家、企业家和投资者涌入到一个个存在少则十几年,多则上百甚至上千年的行业。他们所能做的,除了能让如金融、工业等领域的效率提升一点点,根本撑不起所谓可以改变世界的独角兽的头衔。

洪泰基金副总裁宋楠在接受钛媒体时也表达了类似的看法

像算法、算力上的技术优势反馈到客户那里,可能会有3%-5%准确率的差别,但这种差异很难去做一个定量的横向比较,实际上,AI 公司去拿单的一个核心因素是说商业的服务能力。

 

具体来说,比如和客户沟通,很多科学家背景的 AI 项目方会觉得,我的技术这么好你凭什么不用我?这就是他们在和客户沟通时不适应的地方,你要让客户感觉到你作为乙方公司的诚意,坦白说就是“接地气”,做到这一点才能拿到单。

 

而在实际的项目落地层面,客户真正需要的,与 AI 行业讲究的所谓高大上的算法、豪华的团队又完全不是一回事。

这些变化也让所谓高大上的人工智能创业变成了一个越来越需要下沉的行业,在一个没有新市场的大背景下,你需要下沉到每个行业的最底层,然后去寻找发现机会,并以最快的速度抓住可以变现的机会,让自己高大上的技术变成可以场景化应用的产品。

进入 2018 年,中美人工智能的发展都不可避免地步入到一个瓶颈期。

在这个阶段,创业公司如果还未吸引到巨头的注意,这并不是一个值得开心的事情,或许,这些创业公司会成为某个市场的先烈,或许,这些创业公司的技术、产品没有达到可收购的标准。

同样在这个阶段,美国的亚马逊、Google、微软,以及中国的 BAT、华为等,在利用人工智能完成自身业务的升级改造后,也开启了新的产品输出。但对这些巨头而言,人工智能的产品输出远不是过往互联网时代的代码优化那么简单,他们也必须下沉到行业的底层,去寻找新的可能性。

这可能是一个新机会,也可能是一个新陷阱,在通用人工智能智能(AGI)出现之前,所有关于人工智能的幻想,正在被一个个行业所重塑,最后都将归于平淡。


  1. 包含被机器取代的职业以及创造出的新职业  ↩

后陆奇时代的百度:自动驾驶降速、不再 All in AI 以及戛然而止的「文化革命」

陆奇辞去百度 COO 的消息震惊业界,而刻意选择在周五下午临近下班时发布此消息,也凸显出百度深知该消息的震撼性,因此需要一个周末的时间,以一种低调的方式稳妥度过舆论关口。

但投资市场却已经嗅到某种味道,百度在美国东部时间周五收盘时,报每股 253.01 美元,较上一交易日下跌了 9.54%,下图或许更能说明问题,这是百度 5 天内的股价表现,请注意那个近乎断崖式的下跌时间点,也正是陆奇宣布辞去百度 COO 的时间。

img

不过,股价表现始终是一种应激反应,并不足以说明太多问题,真正值得关注的,则是后陆奇时代的百度以及陆奇留给百度的人工智能「遗产」。

根据百度官方透露的消息,陆奇辞去 COO 后,相关工作将由各业务部门负责人直接向李彦宏汇报,其中涉及陆奇的三项:

  • 陆奇原来主管的 AIG(AI 技术平台体系),由百度原副总裁王海峰担任,后者也晋升为高级副总裁,向李彦宏汇报;
  • 智能驾驶事业群组总经理李震宇向张亚勤汇报;
  • 智能生活事业群组总经理由景鲲担任,未来一段时间向李彦宏汇报;

至此,陆奇自上任以来所构建的人工智能技术开放平台和商业输出计划,都已经处在李彦宏的管理之下,无怪乎有媒体指出,这一系列调整也是李彦宏重回一线的重要信号。

同时根据汇报等级的变化,百度智能驾驶事业群组的地位已经下降,这也意味着,2017 年陆奇也力推的自动驾驶平台阿波罗平台已经不再是当下百度的重点项目。与此同时,主导智能家居的智能生活事业群显然成为当下百度人工智能落地的重中之重。

这将成为后陆奇时代的百度最值得关注的战略动向变化。事实上,早在 2017 年陆奇启动自动驾驶和智能家居之时,外界显然看到了百度在人工智能领域的远近布局:

  • 智能家居:依托 DuerOS,押注 3- 5 年的语音交互和家庭物联网市场;
  • 自动驾驶:依托阿波罗平台,押注 5 -10 年的自动驾驶市场;

尽管自动驾驶平台的发现相当迅速,2018 年 CES 上,陆奇向全球媒体展示了自动驾驶发展的「中国速度」,阿波罗平台从无到有,从代码到解决方案再到合作生态,过去一年百度自动驾驶的发展令人眼前一亮。

但显然,通过这轮调整后,百度内部对于自动驾驶的积极性已经下调了许多,随着整个自动驾驶团队归于新兴业务事业群组管理,其发展前景也增加了诸多不确定性。

从某种意义上说,全球范围内的自动驾驶行业都处在非常早期的阶段,百度作出这样的趋势研判并不奇怪,作为国内最早涉入自动驾驶的巨头,百度先后经历了自助造车、与宝马合作造车,再到去年启动的做「汽车行业的安卓」(陆奇语)但问题的核心是,百度高层摇摆不定的战略选择,会进一步消耗外界对于百度在自动驾驶方面的信心。

其次,有媒体指出,百度内部对于陆奇所言「All in AI」并没有达成共识,比如李彦宏就在年初的一次活动上公开表示,自己从来没有说过百度要 All in AI

我这人说话还是倾向于留有余地,我是非常相信AI的,这个大家都有感受,但是没有这样说,还是希望大家不要把一件事情绝对化。

而在 2017 年 7 月的百度开发者大会上,陆奇的原话是:

AI是百度的机会,百度将All-In AI……百度有能力、有决心成为中国乃至世界的AI标杆企业。

当公司的一把手和二把手在重大战略方向表态上出现偏差时,这背后的潜台词就太多了。我们可以阴谋论第猜测陆奇 2017 年一系列雷厉风行的架构调整得罪了太多利益集团,也可以结合人工智能当下的处境,去推断百度内部对 All in AI 所产生的积极效应的失望。

我当然会选择后者。根据百度 4月底的财报数字,百度交出了一份三年来最靓眼的成绩单,从营收到利润双双超过预期,下图来自华尔街见闻,列举了营业利润的表现1

img

而在其营收结构上,网络营销收入的比重依然非常高,占据了公司总营收的 82% 之多,而其他收入的比重非常少。

img

这意味着,百度尽管在过去一年进入到转型快车道,但人工智能所带来的新产品、新理念还无法成为公司的核心收入。人工智能之于百度营收的价值更多还是卖出更多的广告,陆奇在 4 月底财报会议上介绍了强化学习与广告平台的结合:

首先说说一季度公司在基础架构方面的投入,机器学习对很多业务的发展都有强大的促进作用,强化学习最重要的特点是不需要读取标签数据,而是直接读取实际活动数据,包括浏览,点击和转化方面的数据,因此强化学习更高效。另外,强化学习技术可以利用更多的数据信号,因此经济收益和广告质量也可以得到进一步提高。第三,强化学习是一种在线学习,意味着不需要走离线训练到发布上线的程序,也就意味着学习的速度更快。业界都知道,阿尔法狗的底层技术就是强化学习,同样,在其他的App中也有应用的实例。我们正在应用强化学习来提高广告效果,相信经过一段时间,会有更好的表现。

第二个问题,通过优化,按点击付费广告性价比将更高,所有的行业都适用。当然,我们的技术将优先应用于市场规模大的行业,但最终将应用于所有行业,在搜索广告和信息流广告业务中都会有应用。

而在自动驾驶的业务上,陆奇这样说道:

我们的商业模式是提供免费开放的平台,但是我们的合作伙伴需要使用我们的一些服务,比如地图,我所说的地图是供传感器使用的高精度地图,而非平时普通用户使用的手机地图,这是我们的商业模式,而且成长非常不错。

至于智能家居,也就是 DuerOS 的商业模式,陆奇认为:

百度开放平台的创收模式是多层次的,第一,各类设备为百度提供了入口,比如我们可以通过这些设备提供信息,服务和内容,加入广告也是自然而然的事情,事实上我们也已经与设备商开始这种合作;第二,我们可以通过授权和收取佣金的方式获得营收,但这些都是远期的目标,短期来看还是专注于产品的开发。

上述这些财报数字、陆奇的发言,都展现出一个事实:人工智能固然对百度有利,但这注定是一个较长时间的转型周期。

但遗憾的是,百度内部已经等不及了。

第三,陆奇的「文化革命」或许也将宣告结束。《财经》杂志的一篇报道称,陆奇在内部工程师群体内颇受欢迎。2017 年 7 月,陆奇内部对工程师的演讲被刻意流出,主旨就是如何成为一名优秀的 AI 工程师。

「陆奇离开后,如何进一步收拢人心,让人心不散,也是百度面临的当务之急」,《财经》杂志写道。

我也曾在 2017 年 8 月,详细讨论了陆奇会给百度带来哪些变化,我将定义为「文化革命」:

真正让外界觉得百度能否转型成功的重要因素,则是陆奇究竟能给这家公司带来怎样脱胎换骨的表现,从技术投入到商业模式搭建以及内部文化的重构,特别是文化的重构。

搜索引擎长期以来都是一门躺着就能赚钱的生意,Google 如此,百度也是如此,在 PC 互联网时代,中美两大国网民的绝大多数上网入口都被这两家公司垄断,这种商业模式形成的内部文化,在人工智能时代都面临诸多挑战。

首先是产品落地的挑战,类似百度、Google 这样的公司都是 2B 赚钱的公司,换句话说,他们对于 C 端用户的认知都非常局限的,而像亚马逊、阿里这样的电商企业,时刻都将「用户(顾客)第一」的口号挂在嘴边,这样的差别也就决定了两类公司在人工智能落地场景上的思考,到底是以用户切身需求为切入点还是以技术炫酷为目的,目前百度、Google 离真正理解人工智能落地场景还有不小的距离。

其次,则是合作共赢的理念。人工智能从来不是一门单独技术,这是一个正在成长中的全新基础设施,长长的产业链上布满了各类瞄准利基市场的大小公司,而不管你百度也好、Google 也罢,过往的商业成功,都建立在自己研发的基础之上,但这一切在人工智能时代早已不适用,合作共赢才是时代的主旋律。当 Google 去年开始试图通过云计算笼络行业合作伙伴的时候,彼时的百度,还在埋头钻研核心算法,直到今年开始,依托 DuerOS 以及 Apollo 平台,百度开始了一轮疯狂「交友」计划,效果如何,还待后续的考验。

但这一切判断,随着智能驾驶事业群权重下调和 DuerOS 的不确定性的未来,都让这场「文化革命」戛然而止。我曾经将 2017 年列为百度最关键的一年,「把握不住这一年,或许就真的剩下 AT 了」,但现在来看,2018 年的百度,将遇到更多的压力和挑战。


  1. 需要说明一点,很多公司营收、利润都有季节性,因此很多时候需要关注同比去年的数字。  ↩

Google 语音助手的「价值观」

上周的「人工智能商业内参」,我对 Google I/O 大会上的语音对话新功能Google Duplex 做了一些分析,当时主要侧重在产品理念和 AI 伦理层面,如果你还没来得及看这篇文章,不妨点击这里先来看看。

Google Duplex 本质上是一个内置于 Google Assistant 的功能,目前也尚不知晓该功能何时、以何种方式提供给普通消费者,但这个「震惊世界」的新功能还是让人看到了 Google 在语音领域的野心。

Google 的语音类产品可以追溯到 2012 年,彼时,Google Now 被看作一款直接对标 Siri 的语音助理产品,一度引发全球性的围观,雷锋网在 2014 年的一篇文章里介绍 Google Now 的多项「神奇」功能

1.自动估算通勤时间

Google Now当然不能帮你解决交通问题,但是一旦告诉它你住的位置和上班的位置,它能估算你上下班所需时间。这种估算不仅是基于现有的交通状况,还会基于你的日常习惯,最后以卡片形式呈现。

如果你能告诉它平常的出行方式,那它估算的时间会更加准确哟。

2.出游小助手

出门玩的时候,司机问你去哪呢,“等一下啊,我看下邮件,地址在邮件上写着”。当需要去酒店的时候,Google Now能直接调取来自你的Gmail和Airbnb账号的预订信息,酒店地址和预订卡都能一目了然,出行巨方便。

3.体育爱好者的福利

你是喜欢哪个球队呢?火箭队?湖人?还是马刺?直接告诉Google Now你最爱的球队,它就会在比赛期间为你推送相关比赛报道和实时比分。

值得注意的一点,Google Now 并不会用语音回答用户的问题,而是以直接的搜索结果来展示出来,如下图所示。因此,从某种意义上说,如果 Siri 代表了一种类似与电影《Her》的伴侣角色,那么,Google Now 更像是一个搜索助手。

img

随后的几年时间,Google Now 几乎和 Siri 一样发展缓慢。到了 2015 年,Google Now 的升级版 Now on tap 发布,简单来说,这是一个可以让用户在更多场景里使用 Google Now 的升级。比如,你可以在手机的 Gmail 里直接唤醒 Google Now,下图展示的是直接读取邮件里的电影信息。

img

上述功能的实现,一方面是因为 Google 可以收集海量的数据,比如 Google 长期以来都在自动扫描用户的 Gmail 邮件内容,美其名曰提供「精准广告推荐」,不过这属于另一个话题,暂且不表。

我更看重的一点则是 Google 在人机交互方面的理念,就像我在上一篇会员计划里引用 Ben Thomson 的观点,Google 要做的事情是通过机器「get things done」。

过往的人机交互,不管是键盘鼠标还是触控还是诸如 Siri 这样的语音交互,都是一个输入输出的过程,也就是说,用户通过某种方式让机器明白自己的需求,机器处理后做出一个反馈。但 Google 却在坚持一个理念:减少用户的输入成本,所有的输出是机器自动化处理的结果。

这一点也可以从 Google 前几年发布的邮件应用 Inbox 得以体现。Google 利用对用户邮件内容的自动化扫描,实现了对邮件类型的自动化分类,它能区分出诸如与旅行、购物、财务相关的邮件,自动匹配到相应的文件夹或标签。

img

到了 2016 年,Google 放弃了「Google Now」的名字,转而用一个更具体的名字:Google Assistant。这个名字也更凸显了该产品的目的,成为人类的助理。

Google Assistant 出现的 2016 年,正是人工智能、语音产品正在爆发的时刻,也是在这一年,Google 正式宣布进入智能音箱领域,发布了智能音箱 Google Home,其底层操作系统就是 Google Assistant。

下图是 CBinsights 对于 Google 财报电话会议上的统计,或许你也发现了,从 2016 年开始,Google 提及人工智能、机器学习、Google Assistant 的次数开始大幅增加。

img

进入 2017 年,Google 继续推进 Google Assistant 的覆盖范围。主要围绕三个方面:

  • 利用 Android 新系统推广;
  • 发布全新音箱产品,Google Home Mini、Google Home Max;
  • 与智能家居的硬件厂商合作;

更进一步,Google 最近几年在语音、智能家居领域开展了不少收购,公开资料显示:

  • 2016 年 9 月,收购自然语言交互平台公司 Api.ai;
  • 2016 年,将收购两年的智能家居软件公司 Revolv 整合到 Nest 旗下;
  • 2018 年 2 月,收购 IoT 产品开发平台 Xively;

利用新产品、新生态以及并购整合,Google Assistant 俨然成为这家公司的的重中之重,为什么?

在 Google 母公司 Alphabet 最新一季的财报中,来自广告的收入就有 266 亿美元,占据整个季度收入的 85.5%。从某种意义上说,Google 就是广告公司,而要继续保持广告业务的增长,Google 必须保持其在用户与商家之间的重要存在价值。

在 PC 时代,Google 利用搜索产品,几乎垄断了除中国市场外的主流互联网市场,如下图所示,随后几年,尤其是移动互联网时代,Youtube 之于 Google 广告业务的重要性也越来越高。

img

但当亚马逊 Echo 的普及率越来越高,语音交互的方式越来越流行,亚马逊事实上已经成为一个连接用户和商家的新平台,更何况,亚马逊天然就是一个商家(商家平台),如下图所示。

img

这是对 Google 安身立命商业模式的威胁。尤其在 Google 、Farebook 因为两年前选举广告引发的争议,亚马逊广告平台的受欢迎程度也开始提升。来自 Bloomberg 的最新消息称,亚马逊正在测试一款新型展示广告,通过这款产品,商家可以在网上追踪购物者消费行为,由此吸引消费者回到亚马逊平台选购商品。知情人士透露,该公司将于本月邀请一些商家测试新广告。

广告业务在亚马逊业务的比重也在上升,36Kr 援引摩根士丹利的报告称:「亚马逊的高利润率业务比如云服务AWS、广告和Prime会员服务是推动公司毛利润和毛利润率增长的主要因素。该报告称,这三项业务都在加速增长,估计它们上个季度贡献了35亿美元的毛利润。」

而这一切在 Echo 产品霸占北美智能音箱市场超 6 成的语境下更显紧迫,这也是 Google 如此重视语音助理的根本原因,通过语音助理强化用户与 Google 的关系,从而进一步构建 Google 广告业务的新护城河

img

如上图所示,这是 Google 对于未来语音助理发展方向的判断,一如 Google 当初让用户不必亲自动手整理邮件一样,Google 希望用户未来不用再打电话,一切都由「助手」来完成。

不妨再脑洞一下,文本、语音之后,Google Assistant 的下一步是要帮助用户完成什么?