← Dailyio 历史存档 | 搜索

标签: 人工智能

共有 76 篇文章

新 AI 寒冬、人机关系、苹果最重要的产品以及中国人的幸福观等 #WeeklySpot 011

导读

本期的「Weekly Spot」,你会看到以下精彩推荐。

在 AI 领域,新 AI 寒冬是否即将到来?于此同时,「AI+人」正在产生的协同效应如何进一步塑造人类生活与工作,一个长达 30 分钟的 Keynote 可以给你很多启发,而《华尔街日报》则展现了机器人、AI 对于城市的塑造......

对于人机关系,GPS 在过去 30 年里如何改变了人类对于方向感的认知,如果将 GPS 引发的影响作为一个观察的入口,人机关系的演变越发有趣。比如 Product hunt 创始人 Ryan Hoover 就发现,「No Code」正在释放人类在机器面前的创造力;而「中国互联网的老朋友」凯文·凯利则提出了「MIRRORWORLD」的概念,借着机器的视觉能力,人类与物理世界的关系也在重塑。

本周关于苹果的新闻很多,通过一个 iOS 13 概念视频,你可以理解为何这是 2019 年苹果最重要的产品更新;另一个苹果重要的产品则是 AirPods,这个小小的耳机到底有多流行,一组数字和图表可以展示其威力。

杂志「封面秀」全面升级为「杂志导读」,我将推荐一周内主流期刊值得关注的文章和观点。这一周里,《经济学人》介绍了一本讨论中国人是否幸福的书,《纽约客》报道了一个谎话成精的畅销书作家、《连线》杂志的封面文章是「双面马斯克」......

当然,本周还有一本旧书推荐,套用莎士比亚一句经典的台词:世界就是一个游戏场,所有的男男女女不过是一些游戏者,他们都有下场的时候,也都有上场的时候。一个人的一生中扮演着好几个角色、玩好几场游戏......

观点和故事

新 AI 寒冬将至?这篇文章的逻辑是,当下 AI 的流行是深度学习的进步,但深度学习的局限性或许也会让 AI 的未来变得暗淡无光,那么基于深度学习的 AI 行业是不是会迎来新的寒冬呢?这篇文章试图以历史的视角对未来作出预测,点击这里阅读。

「No Code」的威力。这篇文章的作者是 Product hunt 创始人 Ryan Hoover,作为一位长期参与技术创业的「nerd」,Ryan Hoover 注意到了一股趋势「No Code」,简而言之,就是整个行业出现了大量无需编程经验和技术就可以实现创造性的产品,从早期的 WordPress 让搭建个人网站变得足够简单,再到打造 Newsletter 的 Mailchimp、Revue 以及网络自动化应用 Zapier、Airtable 等。无数这样的应用和工具大大降低了用户创造的门槛,从想法到产品的距离正越来越短,你可以在这里阅读这篇文章。

a16z 合伙人 Frank Chen 年度关于机器学习的视频。 Frank Chen 长期关注 AI 领域的进展,每一年他也会发布一个关于 AI 与机器学习的分享,今年的主题是「AI+人 的协同」,Frank 用了大量案例来佐证当下 AI 需要人类积极参与的场景,非常有启发意义,推荐大家观看,你可以访问这里,在 YouTube 上观看。

iOS 13 的概念视频,我曾不止一次说过,iOS 13 将是今年苹果最重要的产品更新,甚至比下半年的 iPhone 还重要,推荐一个 iOS 13 概念视频,可以想象一下苹果硬件与「理想系统」搭配后的效果。

点击这里在 Youtube 上观看。

AR 是下一个伟大的数字平台吗?这篇文章的作者是「中国互联网的老朋友」凯文·凯利,文章提出了一个概念「MIRRORWORLD」,简而言之,就是物理世界的数字化。文章指出,未来的人类将和「MIRRORWORLD」互动,就像我们在现实世界里做事情一样,这也是一个巨大的商业机会。观点靠不靠谱暂不作评论,不过最新的一个消息是,苹果刚刚任命了 AR 产品营销负责人

被割裂的互联网以及潜在的「中美互联网大战」。《华尔街日报》的这篇长文谈到了中美两国日渐分裂的互联网形态。在中国,移动应用是主流,用户可以通过一个 App 满足生活中的绝大多数需求;而在美国,尽管 Google、FB 垄断了不少流量,但依然留个开放互联网不少机会。这两种不同形态下的互联网体验,正在加速两国用户对于互联网的理解,随着 5G 的到来以及中国互联网公司的海外扩张,中美互联网商业模式与数据隐私之间的博弈也在加剧。你可以在这里阅读这篇分析。

AirPods 到底有多流行?长期观察苹果公司的博客作者 Neil Cybart 的最新文章,总结了目前互联网上对于 AirPods 的各种「传说」,比如这个视频

另一个观察的角度则是 Google Trends,如下图所示:

img

你可以这里查看这篇总结。

AI、机器人以及自动化如何塑造城市?来自《华尔街日报》的一篇长文,介绍了一个被机器人和自动化改造的城市样本,一个颇具未来场景的城市发展路径,也是一个值得思考的未来图景。

GPS 三十年,到底机器和人谁改变了谁?《好奇心日报》的这篇文章,以 GPS 的历史以及发展历程入手,进一步探讨了人与机器的关系,文章谈到了法航事故后的航空业:

法航的悲剧之后,航空业的解决方案并不是给人更多控制权,而是让自动化更彻底,飞行员也接受更多培训适应自动驾驶系统,而不是彻底接管它。

但从结果看,这并不是一个错误的决定。刚刚进入千禧年时,每 59.48 万次飞行就会出现一起致死空难,但最近五年已经达到了将近每 300 万次航班才会发生一起致死空难的程度。这背后的原因除了飞机制造业水平的提升外,与 GPS 技术的普及是分不开的。

减少人类这个不确定因素之后,航空业变得前所未有的安全。机器证明了自己的优越性,它的话语权在人们生活中的权重逐渐变强,而人脑的判断便显得没那么重要。

正如文章最后所言,不管 GPS 发明者之一的 PBrad Parkinson 喜不喜欢自己的作品, GPS 「彻底改变了人类的习惯,也永远改变了人类和机器的关系」,那么 AI 与自动化呢?你可以在这里阅读这篇很有启发意义的长文。

图书和电影

人生如戏,人生也是一场游戏

春节期间又重读了一本:《有限和无限游戏》(豆瓣链接)。

套用莎士比亚一句经典的台词:世界就是一个游戏场,所有的男男女女不过是一些游戏者,他们都有下场的时候,也都有上场的时候。一个人的一生中扮演着好几个角色、玩好几场游戏。

这是一本不到 200 页的小册子,但就像这本书的副标题「一个哲学家眼中的竞技世界」所指的那样,这本只有 10 万字组成的读物里,作者詹姆斯·卡斯以一己之力,将自我、政治、社会、文化、权力以及语言、性等多元化的话题放放在一个二元游戏的视角中一一展开讨论,字里行间流露出宗教福音书常有的睿智说教,凯文·凯利曾这样评价这本书:「它改变了我对生活、宇宙和其他一切事情的看法。」

img

这本书的开篇已经足够吸引人:「世上至少有两种游戏。一种可称为有限游戏,另一种称为无限游戏。有限游戏以取胜为目的,而无限游戏以延续游戏为目的。」

这是一段让你无法拒绝的文字,同时也是这本书里最值得反复咀嚼的一段话。像极了数学里的公理定义,作者将世界划分了两个互相对立,又互相关联的游戏模式,通过定义两者的关系,实现了对彼此存在的定义。

作为前纽约大学宗教系教授,该书作者詹姆斯·卡斯却是一个不折不扣的无神论者。上世纪 80 年代,卡斯和几个不同院系的同事聚在一起,从不同学科角度切入到博弈论研究之中,卡斯的同事们或是从数学视角、或是从自然科学出发,重新梳理了博弈论理念在各自学科的作用,而卡斯,则发现博弈论之于游戏理论的意义。

卡斯在其个人网站回忆当时的情形,随着每周讨论和研究的深入,他开始思考游戏的本质,博弈论讨论的是赢得冲突或最大限度减少损失,但在游戏世界里,游戏虽然有赢有输,不过有的游戏却需要避免获胜,因为获胜就意味着游戏的结束。

这些思考最终促使卡斯在 1986 年出版了这本书。从一开始,卡斯就将其思考放在整个人类社会的全视角,他的讨论从未离开游戏,却也从未局限游戏。

接下来的几个章节里,你会聆听到作者如何用自己的二元游戏观来演绎现实世界的多元化的命题,你也会领略到观察自我、政治、社会、文化、战争等人类自身存在核心命题的新视角。正如作者所言:「只有意识到边界不过是我们的视域,边界才能被打破,我们所凝视的,是有限的,必定不能打破边界。」

杂志导读

《经济学人》:「社会主义复兴」、中国人是否幸福

img

这期杂志的封面主题是欧美「社会主义的复兴」,同时还配发了两篇文章予以解读,文章指出这股潮流并非仅仅是对当下资本主义发展的回应,同时还发出了一系列警告。

这期杂志中国板块的「Chaguan」,介绍了一本中国人是否幸福的新书:Chinese Discourses on Happiness。这是一个论文集,几位作者对于中国人的幸福感展开了多元讨论,你会发现官方定义的「幸福」、富人的「幸福」与普通阶层的「幸福」之间的巨大真空,而利用舆论的力量,当局正在制造一种「全新的幸福」。你可以在香港出版社的官网下载这本书的预览。

本期《经济学人》的所有文章都可以在其官网上查看,点击这里查看。

《纽约客》:谎言说了一千遍之后......

img

这期杂志的封面标题是「Love Interest」,封面图也和本周的情人节相呼应。本期有一篇有趣的长文,Ian Parker 发现,畅销书《窗里的女人(A Woman in The Window)》作者 Dan Mallory 是一个玩转谎言的高手,他的一系列公开发言几乎都是谎言编织的故事,这个故事不仅是一个人的故事,而是一个行业(出版)以及一个社会的某种写照,为此本周的《经济学人》还在「书评」部分讨论了「语言到底如何传递信息。

你可以在这里浏览本期《纽约客》的所有内容。

《连线》:双面马斯克

img

2 月份的杂志封面主题是马斯克的「双面人生」,主要聚焦在其如何推动特斯拉发展这条线上,马斯克既是天才也是魔鬼,我特别喜欢这篇封面文章里的一段话:

A few years ago, two Tesla workers were having drinks at a hotel bar across from the Fremont factory when Musk walked in. He was alone except for a bodyguard. They asked Musk if he would like to join their table. Musk sat, and after a few uncomfortable moments started talking about the TV shows he liked, car- toons like South Park and Family Guy. Everyone ordered expensive Scotch and began recounting their favorite epi- sodes from The Simpsons. It was fun. They laughed a lot. It didn’t feel normal, exactly. But it also didn’t feel scary or bad, as it so often did inside the factory. They could have been anyone, just ordinary friends catching up. Then, after a few hours, Musk paid the bill and walked away, back into his chaotic, frenzied, tigerlike life.

你可以在官网上阅读这篇长文。

另外,这期杂志还有一篇讨论 Netflix 推出的互动式剧集《黑镜》的文章,这篇文章有趣的地方在于,它模仿《黑镜》的形式,让读者选择自己喜欢的段落进行阅读,如果你可订阅了《连线》杂志,可以在其电子版里感受一下。

年度 100 AI 公司榜单里的三个秘密

本期的会员通讯,你会看到围绕 CB Insights 发布「年度 100 大 AI 创业公司」里的解读:

  • AI 创业窗口正在关闭;
  • 面向企业市场的 AI 产品越来越多;
  • 中国特色的「To G」商业模式;

上周,数据分析公司 CB Insights 发布了全新的「年度 100 大 AI 创业公司」榜单,这也是 CB Insights 连续第三年发布该榜单。

img

春节前的最后一期会员通讯里,我谈到了所谓 AI 公司是一个不确定的市场概念,而 CB Insights 这份年度榜单里,还有诸多值得思考的点。

之前的会员通讯里,我也提到 2019 AI 领域的三个变化趋势,包括创业领域的两个观察:

其一,AI 创业窗口已经关闭,这个领域的资金已经流入到头部公司,长尾公司会活得很难,兼并、破产、被收购的事情会非常多;

其二,越来越多的 AI 产品会聚焦到企业市场,尤其是帮助企业解决效率问题,这也意味着 AI 的竞争已经从技术赛道延伸到产品、服务赛道;

这意味着:AI 创业公司的早期融资比例已经越来越小;企业 AI 的争夺战愈演愈烈。

CB Insights 的数据也验证了我的判断。下图是过去 5 年 AI 创业公司融资阶段的比例图,每一个柱状图底部是早期的种子投资或天使投资,相比于其他阶段的公司,这个阶段的公司数量在整个 AI 公司的比例已经越来越小。

img

事实上,硅谷投资机构 a16z 合伙人 Frank Chen 也曾发出「警告」:*接下来几年,没有投资人会继续投资 AI 公司**。在一篇名为* In a few years, no investors are going to be looking for AI startups 的文章里,Frank 认为,一如 80 年代的关系型数据库、90 年代的 Windows 软件、21 世纪初的云和移动 App,在「软件吃掉世界」的基本理念指导下,未来几年没有 AI 技术的产品将是不可想象的。

在 100 家 AI 创业公司里,有 33 家公司属于「Enterprise tech」类别,如果再算上面向企业人事、产业、法律的类别,这个数量可以增加到 43 个,下图是部分公司。

img

AI 公司扎堆企业市场,让 AI 领域具有「To B」的竞争属性。与此同时,还有一个「To G」的市场也在快速增长之中,这里的「G」就是「Government」。

CB Insights 的年度 100 个 AI 创业公司里,共有 6 家公司属于「To G」类别,如下图所示。

img

这其中,又有三家公司来自中国,分别是 SenseTime(商汤科技)、Yitu(依图)、Face+(旷视科技)。有趣的是,这三家中国创业公司也在全球 AI 公司融资榜上拥有一席之地,下面两幅图很能说明这一切。

img img

更值得关注的是,不管是商汤、依图还是旷视,这些「To G」的公司无一例外都是脸部/图像识别的公司,考虑到他们的主要生意都是在中国大陆,这也让整个围绕 AI 生意的讨论变了味道,这是一个无比残酷但必须要接受的现实:在政府需求的刺激下,依靠海量的脸部数据,中国大陆造就了多个全球「AI 独角兽」

作为深度学习领域的知名学者,Yoshua Bengio 对中国的当下表达过自己的担忧,在春节期间接受 Bloomberg 采访时,Yoshua Bengio 认为政府应该严格管理脸部数据的使用,这条新闻也毫不意外地没有被国内媒体「引进」。类似的情况,也出现在上月的达沃斯论坛上,资本大佬索罗斯也透露出对于中国 AI 领域发展情况的担忧,你可以在这里查看索罗斯演讲的文字稿。

这也再次引出了一个命题:AI 领域的最大客户到底是谁

或者更准确也更接地气的一个命题:谁会是中国 AI 领域的最大赢家?


延伸阅读

AI 公司是个不确定的名词、自动化的两套话术以及三个重要的趋势变化

我曾经不止一次在 Dailyio 会员通讯里讨论过一个问题:到底有没有 AI 产业?

比如我在 2018 年 6 月的一篇会员通讯里这样写道:

上月,前美国总统经济顾问 Jason Furman 和纽约大学教授 Howard Seamans 共同撰写了一份报告。这份名叫「AI and the Economy」的报告指出了一个略显残酷的事实:人工智能之于美国经济的影响几乎微乎其微。

之所以要讨论这份报告,有以下几个考量。首先,参考历次技术革命带来的影响,比如生产效率的提升以及职业变化,其最后的落脚点都是社会经济水平的整体提升,倘若人工智能不能实现这个「小目标」,也无法胜任过往技术革命中蒸汽机、电力的角色。

其次,以中美当下的产业结构来看,倘若人工智能无法在人力成本高昂的美国,还推动生产效率的提升,并创造出新的职业,那么,人工智能一样无法令中国的产业结构发生大的变化。毕竟,中国目前的经济发展还远远没有达到必须依靠机器来提升生产效率的阶段。

因此,透过这份来自美国的「体检报告」,我们可以部分意义上戳破人工智能的炒作泡沫。

整个报告并非简单地否定 AI 的价值,而是透过对生产效率和劳动力市场的分析,证明了当下人工智能的非理性狂热,无论未来人工智能会如何影响人类社会的发展,至少在短期内,所谓人工智能改变世界的说法都是扯淡。

本月初的一篇会员通讯里,我试图通过阿里巴巴技术委员会主席王坚博士的一句话,来探索 AI 公司要如何转型:

2017 年 12 月的时候,阿里巴巴技术委员会主席王坚博士曾发表过一个观点:「今天最需要转型的不是传统公司,而是互联网公司」。

…..

由此也引发了我的一系列思考。如果互联网公司需要转型应对赋能实体经济,那么「人工智能公司」是否也应该转型呢?或者,是否可以推理出,所谓「人工智能公司」是一个伪命题呢…..

这篇文章最后提出了几个结论,其中有两个关于 AI 产业和 AI 公司的:

第一,当下,人工智能公司或者人工智能产品突破的唯一途径就是「下沉」到各个行业,打造各个垂直领域的人工智能;

第二,没有「人工智能产业」一说,但「产业人工智能」会有巨大市场;

事实上,不仅 AI 产业是个伪命题,连 AI 公司也是一个值得商榷的话题。

如果在搜索引擎里搜索当下的 AI 创业公司,下面三家公司最具代表性:

  • 商汤科技:依靠脸部识别起家的创业公司,公开资料先显示其 D 轮融资额为 10 亿美元,过去一年内的总融资为 22 亿美元。
  • 优必选机器人:也是一家来自中国的创业工程,最新的 C 轮融资为 8.2 亿美元;
  • Zymergen:一家美国的生物科技公司,C 轮融资为 4 亿美元。

上述三家公司及其所代表的领域(脸部识别、机器人、生物科技)在各种 AI 公司数据库里都拥有不小的份额。但正如 TechCrunch 记者 Holden Page 所指出的那样,到底这些「AI 公司」的「AI」是个什么意思

Holden Page 以 Zymergen 公司为例,该公司在 TechCruch 和 CB insights 的数据库都属于「AI Maker」的类别,但在 Zymergen 公司网站上,你却看不到这样的描述,如下图所示,这个页面讲述了 Zymergen 公司的理念和产品,其中只提及了该公司如何利用机器学习来推进产品研发。

img

从这个角度去看,Zymergen 所做的,和所谓「AI Maker」并没有直接关系,即便是在该公司招聘网页上,你也看不到公司相关内容。

与之相呼应的是,CB insights 的报告、CrunchBase 的数据库以及 Bloomberg 的报告都认为:2018 年全球 AI 创业公司的融资总额再创新高。

对此,Holden Page 感叹道:这个行业并没有为所谓「AI 公司」设置一个明确的范围。这也意味着,市场上有太多投机取巧的公司,比如仅仅通过调取 Alexa 或 Google Assitant 的 API 进行开发的公司,能不能算入 AI 公司法范畴呢?

AI 创业热潮当然已经开始,但到底有多少资金流入、有多少 AI 公司获得融资,这些都是不能确定的问题。

如果说 AI 公司是个不确定的定义,那么 AI 公司的客户们——尤其是大公司——则有着非常确定的需求:不管 AI 还是 IA 还是其他什么技术,如何能够提升企业效率才是根本。

《纽约时报》记者 Kevin Roose 上周在达沃斯论坛上就发现了一个有趣的现象,参与会议的跨国公司高层,一方面在公共场合高呼自动化不会取代人类工作岗位,另一方面却在私下场合讨论到底如何才能通过自动化实现了效率的提升,即便是取代大量的人类职位也无所谓。

Kevin Roose 感叹道:

They’ll never admit it in public, but many of your bosses want machines to replace you as soon as possible.

究其原因,则是企业竞争的必然现象。Kevin Roose 援引采访李开复的话:

In an interview, he said that chief executives were under enormous pressure from shareholders and boards to maximize short-term profits, and that the rapid shift toward automation was the inevitable result.

另一方面,无论美国还是中国的大企业,都需要承担就业的社会责任,这些企业的高管,并不能随心所欲地表达自己对于自动化的观点,因此也导致了上述「两面派」的现象。

李开复在达沃斯期间的一段谈话很好地反映了这样的尴尬:

到底工作会不会被取代?我的观点是AI 和自动化能做大部分的重复性的任务,而很多工作大部分的任务是重复性的,所以有三种方法取代:1)一对一的取代(比如说自动收银机取代收银员),2)间接取代(比如说互联网支付颠覆信用卡,因而带来信用卡员工的失业),3)部分取代形成人工池(比如说前台部分50%被取代,前台人员的人工池也可以减少50%)。这三种都是必然的现象。在这个问题上,很多传统公司和科技公司都不愿意承认,传统公司因为不想吓到员工,科技公司因为不想承担责任。

事实上,正是这些大公司一致的需求,也在推动着「真假 AI 公司」以及「真假 AI 产品」发展。Kevin Roose 列举了两家获益颇丰的公司:其一是来自印度的 Infosys 公司,该公司提供的机器流程自动化产品,年增长率高达 33%;其二,IBM 的「认知计算方案」部门,利用「AI 技术」帮助企业提升业务效率,以及成为季度营收 55 亿美元的部门。

从这个角度去看,2019 年 AI 领域会出现一系列新变化,这里我提及最重要的三个变化:

其一,AI 创业窗口已经关闭,这个领域的资金已经流入到头部公司,长尾公司会活得很难,兼并、破产、被收购的事情会非常多;

其二,越来越多的 AI 产品会聚焦到企业市场,尤其是帮助企业解决效率问题,这也意味着 AI 的竞争已经从技术赛道延伸到产品、服务赛道;

其三,正如《MIT 科技评论》上周发布的一篇文章所指,深度学习的红利渐趋消失,那么有没有更好的算法或趋势去推动 AI 的继续发展(炒作),也就成为各大巨头——Google、微软、百度等——研究机构的重要课题。

苹果押注 AI、智能手机的「人工弱智」以及 2019 手机 AI 的三个关键线索

上周,Bloomberg 记者 Mark Gurman 又拿到了关于苹果的独家信息,由于 iPhone 销量不及预期,苹果内部正在考虑是否减少人员招聘。Gurman 的信源表示,尽管还没有完全确定哪些部门会「冻结」招聘,但有一点是非常肯定的,那就是 AI 部门不受影响:

Cook said he is yet to fully determine which divisions would cut back on hiring, but said that key groups such as Apple’s artificial intelligence team would continue to add new employees at a strong pace…..

这条新闻颇具象征意义。苹果作为全球影响力最大的智能手机公司,当智能手机产品遭遇严重挑战的时候,也将目光聚焦了人工智能领域。事实上,苹果对于 AI 的关注度在 2018 年已经越来越明显。继 2018 年 4 月从 Google 挖来 AI 顶级专家 John Giannandrea 后,2018 年 12 月,苹果官方宣布 John Giannandrea 晋升为管理团队成员,其职位名称为「机器学习和 AI 战略高级副总裁」。

img

在苹果官方新闻稿里,对 John Giannandrea 的工作范围做了这样的介绍:

Giannandrea oversees the strategy for AI and Machine Learning across all Apple products and services, as well as the development of Core ML and Siri technologies. His team’s focus on advancing and tightly integrating machine learning into Apple products is delivering more personal, intelligent and natural interactions for customers while protecting user privacy. ……

Giannandrea’s team is also helping to enhance the developer experience with tools including Core ML and Create ML, making it easier and faster to integrate machine learning into apps.

通过上面的架构图以及对 John Giannandrea 职位范围的整理,可以清晰地看到苹果对于 AI 的重视程度,AI 成为与零售、服务、软件、设计并列的核心业务。

苹果的这番表态一方面可以安抚华尔街,显示苹果对于未来产品和技术的布局,另一方面,也势必会影响整个手机行业在拥抱 AI 技术的节奏。

但手机与 AI 的结合并不乐观。

在过去的 2018 年,智能手机行业在 AI 上的探索不可谓不努力,从适合手机的 AI 芯片到 AI 算法均有不同程度的突破。

以芯片为例,苹果 A12 在 CPU 和 GPU 上的提升微乎其微,但针对机器学习的 NPU,则从 2017 年的每秒 6000 亿次运算提升为每秒 5 万亿次;华为发布的麒麟 980,则首次集成了双核 NPU(其 NPU 依然是寒武纪的授权而非自研);高通在 2018 年底发布的下一代骁龙处理器 855 里,AI Engine(其功能也类似于 NPU)的性能比上一代 845 提升了 3 倍,也比麒麟 980 高出了 2 倍。

2018 年 12 月,商汤科技联合艾瑞咨询发布了《2018年中国人工智能手机行业研究报告》,里面对所谓 AI 手机与手机 AI 有一些有趣的发现。

比如,AI 手机的产业结构包括硬件(如 AI 芯片厂商)和软件(如 AI 算法供应商)。

img

如果说上面 AI 芯片和 AI 算法供应商还比较统一的话,在 AI 开发者领域则出现了「分裂」的迹象:华为拥有 HiAI、AR Engine 两大自有开发者平台,同时还与百度机器学习框架 PaddlePaddle 共建开发平台;小米则拥有 Mobile AI Compute Engine 等。

img

但这些数字对于普通消费者而言依然是无感的,下面两张图则显示出中国市场 AI 手机与手机 AI 功能的基本情况。

img img

坦率来说,上面两个调查的样本数实在是太小,但这也的确当下 AI 手机或者手机 AI 可以突破的领域,如果你在 2018 年购买了新款的 iPhone 或者安卓旗舰机,大概率也能感受到所谓 AI 的能力。

这也意味着,包括苹果在内的智能手机行业,必须面对一个残酷的事实:尽管所有人都知道 AI 会给手机带来变革,但没有人知道到底从何处入手,以及如何去做。

对于手机应用开发者而言,尽管苹果、华为、高通已经陆续开发了所谓的机器学习开发工具,但也仅仅集中在脸部识别、语音理解以及简单的自然语言处理等领域,不是每个应用都需要这样的 AI 能力,更何况在面向消费者的应用里,集成上述 AI 能力的应用已经太多了。

2019 年的手机 AI 领域,上半年的竞争核心,会在新尺寸新模样的手机(比如打孔屏、折叠屏)体现出一定的 AI 能力;下半年则还会出现新的 AI 芯片竞赛,华为、苹果、高通的比赛不会停止。

但这些都不应该是最重要的事情,我更关注以下三点。

其一,Google、苹果如何在新的手机 OS 里提供更多 AI 开发能力,从而让开发者能够开发出更多 AI 应用;

其二,Google、微软以及其他 AI 创业公司,能否继续降低 AI 开发门槛;

其三,华为和小米之间 AI 开发生态的博弈,会如何影响中国智能手机市场走势。(完)

AI 公司如何转型、数据为什么不是 AI 公司的护城河以及 AI 是否是新电力?

2017 年 12 月的时候,阿里巴巴技术委员会主席王坚博士曾发表过一个观点:「今天最需要转型的不是传统公司,而是互联网公司」。

这句话当然有不少潜台词。王坚博士主要关注的是互联网与制造业的融合,比如他说:「没有互联网的制造业没有未来,没有制造业的互联网更没有未来」。而随着制造业与互联网之间的关系越来越密切,衡量经济发展的标准也会从用电量转为计算消耗量。

由此也引发了我的一系列思考。如果互联网公司需要转型应对赋能实体经济,那么「人工智能公司」是否也应该转型呢?或者,是否可以推理出,所谓「人工智能公司」是一个伪命题呢?吴恩达曾将人工智能比作「电力」,那么这个「新电能」是如何发挥作用的,是否也和王坚所说的「计算消耗量」是同一个事情?

差不多一年前,我曾在当时的会员通讯里提出一个观点,人工智能不仅需要技术上的突破,还需要一场全新的社会协作。我引用了 Google 大脑团队的女科学家 Hanie Sedghi 的一段话:

The other issue is the need for collaboration between social scientists and AI researchers. You know, you can’t expect AI researchers themselves to come up with a clear understanding of fairness. Not only we need people in social sciences to collaborate with us in defining these words, but also we need to keep this collaboration all along to the end of the product research and development.

这种社会协作正在越来越多的垂直领域里发生:

脸部图像的标注是一个几乎没有门槛的工作,智力正常的成年人都可以很轻松地在脸部图像中找到鼻子、眼睛、嘴巴。但当图像识别从人脸延伸到垂直领域,比如医疗影像时,就面临一个巨大挑战,毕竟,不是每个人都具备医疗知识,而且从医疗安全的角度考虑,也无法有所谓的速成教程。因此,标注医疗影像的工作必须是一件人工智能工程师与经过专业培训的医生来一起完成。

类似的案例也出现在工业制造、环境保护、法院审理等多个领域。以法院庭审为例,长期以来,如何将庭审时的记录自动化,曾是一件遥不可及的事情。这是一个可以运用语音、自然语言理解的综合场景,同时也是一个专业化、场景化非常突出的领域。有一些公司将语音识别卖给法院使用,当另一个尴尬的事实是,当一个语音识别系统将一个小时的庭审语音转化为几百页的文本记录时,不管是原被告双方现场签字还是后续的搜索摘录,反而又成了一件效率低下的事情。

更进一步的问题:放眼全球,过去三四年的时间里,不管是 Google、Facebook、百度、阿里这样的巨头,还是商汤、旷视这样的独角兽企业,他们的人工智能技术到底开创了一个个新行业还是被一个个传统行业所改变?

答案也显而易见。以全世界公认人工智能技术最强的 Google 为例,其人工智能各项技术的用途大致分为两类:

  1. 内部:用于改进搜索结果;用于打造 Google 语音助理,并提升语音交互体验;用于打造基于算法的手机相机;
  2. 外部:将 AI 能力(硬件、服务)包装为单独的模块,通过云服务提供给不同领域的企业或开发者;与包括医疗、零售等行业合作,将 AI 能力用于他们的业务体系里。

类似的尝试,我们也可以在百度、阿里巴巴、微软等巨头公司新闻稿里看到,阿里云更是提出了「产业 AI」的概念,并一次为口号,开始向各个行业销售自己的 AI 技术。

从技术角度去看,当下 AI 最火的领域主要集中在机器学习。过去三四年的实践的确证明了机器学习可以实现某种意义上的 AI,但机器学习也面临两大无解的难题:其一是只能解决特定领域的问题;其二是需要海量的数据。

上述两大难题也注定了目前所有的 AI 巨头或独角兽只能选择「下沉」到各个行业,利用这些行业里丰富数据,一个个地解决行业问题,而这些特定行业的解决方案是否具有通用性,目前还留有巨大的疑问。

这也让我不得不得出第一个结论:当下的人工智能公司,或者人工智能产品,根本无法开启一个「AI 产业」,他们所扮演的角色,不过是各个行业转型过程中的助推器罢了,一如 a16z 投资人 Ben Evans 所言,机器学习(人工智能)更像是「新时代的 SQL」。

那么,如此多的 AI 公司与 AI 产品以及当下各行各业对于 AI 的拥抱,能否让 AI 成为如电力一般的技术呢?

吴恩达将电和人工智能放在一起对比,其中隐藏了一个条件,人工智能也是一个通用技术:

Just as electricity transformed almost everything 100 years ago, today I actually have a hard time thinking of an industry that I don’t think AI will transform in the next several years……

但正如上文所言,目前人工智能只能局限在某些特定领域,学术上曾经用了「弱人工智能(Narrow AI)」来定义只能在特定领域的 AI 技术。这也意味着,目前的 AI 根本无法成为一种通用技术,也无法像电力一样带来如此大的社会和经济影响。

即便我们假设,吴恩达所言的「人工智能」是学术界的「强人工智能」,也就是具备了通用技术的潜力1,那么 AI 又该如何像电力革命那样,影响世界呢?

投资人 Rob May 在一篇文章里探讨了这种可能性,他首先提出了一个观点:电力革命价值的最大化,来自于用电价格的平民化。

他提到了一位企业家:塞缪尔‧英萨尔(Samuel Insull)。一位英国出生的美国商业巨头,富豪,爱迪生早年的私人秘书和密友,通用电气创始人之一,他的一生备受争议,但他用大型蒸汽涡轮机来生产廉价的电力,实现规模经济以此来克服市场成本,这就使千家万户都能用得起电。

Rob May 认为,如果将电的发展规律作为 AI 的参考,势必要思考 AI 的成本结构,主要包括三个方面:

  1. 数据成本
  2. 推理成本
  3. 训练成本

先说数据。如上文所言,数据是人工智能里的「燃料」,尤其在已标注的数据。然而,AI 的数据与发电时的燃料所不同的一点:尽管数据越多越好,但当数据量达到某个阈值之后,其 AI 模型的精准度并不会继续提升。也就是说,AI 的数据无法成为一种规模经济,依靠更多数据来降低整个 AI 成本,几乎是不可能的事情。

另外值得一提的是,数据不会成为 AI 巨头们竞争的第一要务。原因也不难理解,即便是中美两大数据量最大的公司——阿里巴巴与 Google——其所拥有的数据还是自身业务数据,阿里的电商数据可以直接应用到制造业的 AI 模型训练吗?显然不能,同理,Google 的搜索数据,也无法帮助其 AI 模型应对零售业的需求。

从这个角度去看,AI 数据成本,既无法通过数据量扩大形成规模经济而降低,也不能依靠 AI 巨头们自身的数据优势。

再来谈推理和训练成本。我同意 Rob May 的观点,目前推理成本受限于硬件。过去的 2018 年,我们也看到了包括 Google、亚马逊、华为、阿里等巨头开始布局芯片领域,也涉及到了推理芯片,这是一个非常好的信号,有望推动这个领域进入规模化阶段。

而 Rob May 所言的训练,则是广义层面的「训练」,他这样写道:

……and by training I don’t mean training a neural net. The current model of doing so is way too targeted to be a generic benefit like we need for the AI-as-electricity framework to make sense. At some point, I think training will be a more generic process that includes humans training machines, and machines learning by reacting to a broad based environment like humans do — not just narrowly targeted applications. I think broad based training is the place to really get economies of scale — train a thing once and see it execute that training as many times as the world needs it to for all kinds of applications.

利用这种更广义的人与机器、机器与环境甚至机器与机器的「训练」,有望可以大幅降低 AI 的训练成本,比如某一天,你可以用 1 美元事业 GCP 上的机器学习服务器。Rob May 还援引了经济学家罗宾·汉森 The Age of Em 一书里观点,当 AI 成本最终接近电力成本时,整个 AI 的使用成本结构也很发生变化:你也不是为目前执行的任务付费,而是像用电一样,为你使用 AI 技术的时间与总量付费。

到这里,我也可以逐一回答本文一开始的几个疑问。

第一,当下,人工智能公司或者人工智能产品突破的唯一途径就是「下沉」到各个行业,打造各个垂直领域的人工智能;

第二,没有「人工智能产业」一说,但「产业人工智能」会有巨大市场;

第三,数据当然是「新石油」,不过,这种新能源并不你直接带来规模效应,数据也不是人工智能公司的护城河,至于护城河是什么,参加第一条;

第四,人工智能会不会成为像电一样的通用技术?有可能,但前提是,我们可以进入「强人工智能」时代。(完)


  1. 此处我只是假设,因为 50 年甚至 100 年里都不会出现真正意义上的「强人工智能」。  ↩

回顾 2018 AI 格局以及关于 2019 AI 的五大预测

上周,AI Index 2018 年度报告正式发布,我在上周的「Weekly Spot」里提到了里面的几个关键要点,但这份报告还有诸多值得关注的内容。

通过梳理和回顾 2018 年 AI 领域的发展,我也想对 2019 年的人工智能做一些预测和展望。

先从权威性的角度去看,参与该报告的人包括斯坦福大学的 Yoav Shoham、MIT 的 Erik Brynijolfsson、OpenAI 的 Jack Clark 等人。其中,Yoav Shoham 是斯坦福的计算机科学荣誉退休教授,而 Erik Brynijolfsson 则是 MIT 斯隆管理学院教授,长期关注数字化发展对于社会、企业以及个人的影响,至于 Jack Clark,他是前 Bloomberg 的神经网络领域资深记者,如今担任 Elon Musk 的非盈利组织 OpenAI 的战略总监,同时他也在运营一份 Newsletter「Import AI」。

正是这样的人员组成,也让这份报告不仅局限在 AI 技术领域,更具备了经济层面和道德层面的思考。

AI Index 2018 报告试图通过多个指标来衡量 AI 的发展总体状况。这些指标包括三大部分:

  • 数据
  • 政策
  • 暂时无法衡量的领域;

我们一个个来展开。先来看「数据」。这里的「数据」包括了两个维度的数据:

  1. 全社会对 AI 的关注度数据;
  2. AI 各技术的突破数据;

这两组数据相互独立又相互关联,共同构成了观察 2018 AI 发展的重要视角。其中,全社会对于 AI 的关注点又体现在学术论文、AI 课程/培训、大型会议参与度、创业公司融资、大公司 AI 适应度、专利、人才需求、媒体关注等等

来看几个有趣的数字,下面两幅图里,科技行业公司与其他行业公司在财报会议上提及的技术名词有着明显的时间差。再比如,为何其他行业一直都在关注 AI 和 ML,而科技行业会在 2015 年集体爆发?

img img

再比如,下图是媒体文章里关于 AI 的情绪,2016 年 1 月是个重要的时间拐点,这个时间点恰恰是 DeepMind 首次披露 AlphaGo 可以战胜人类棋手的时刻。

img

与 AI 参与度并行发展的,则是 AI 各技术的发展数据,这份报告列举了图像识别、自然语言处理、机器人问答的发展状况,基本可以总结为一句话:机器识别率持续上升、训练时间持续下降。

以 ImageNet 的训练时间为例,仅仅用了一年半的时间,利用 ImageNet 训练神经网络的时间从将近一个小时下降到 4 分钟,这是一个巨大的提速

img

报告指出,这个数据至少有两大意义:其一,由于图像识别是典型的监督学习,这个领域的突破可以适用在多个监督学习领域;其二,这也充分体现了过去一年半,围绕 AI 的软硬件的进步。

在政策层面,该报告对比了美国、欧洲与中国近四年的重要 AI 政策,感兴趣的读者朋友可以直接去浏览,这个部分就不再赘述。

接下来,谈谈几个暂时还无法衡量的指标,这些领域目前还停留在相对早期的阶段,只是个别公司或研究者所关注的,但却极具潜力。

比如,IBM 研究者 Francesca Rossei 提出了一个关注领域「常识推理和自然语言理解」。这里探讨的是,如何将常识推理纳入到问答系统中。目前,机器问答系统依然无法具有真正的「对话」能力,而只有加入常识推理,才能最大限度提升机器对于对话的理解能力,这个领域的研究正在加速,该报告也强调,他们会持续关注这些新指标的发展。

再比如 ,来自 MIT 的 Rodney Brooks 将 AI 与机器人放在一起,就目前来看,机器人的出货量还没有一个统一的指标,更多的机器人出货量统计还是工业机器人,但工业机器人缺乏或根本就没有 AI 能力。随着越来越多的机器人拥有了 AI 能力,这些机器人的出货量统计也会成为一个观察 AI 发展的重要指标。

至此,关于 AI Index 2018 年度报告的主要内容已经梳理完毕,如果你关注 AI 发展,我强烈建议各位阅读这份报告,从而可以进一步感受全球 AI 的发展和进步。

在即将到来的 2019 年,我对全球 AI 领域也有几个预测。

首先值得关注的是 AI 硬件创业领域。过往几年 AI 创业热点聚集在算法和软件上,但围绕 AI 的硬件创业公司也非常值得关注,比如 AI 芯片,这个领域的会在 2019 年出现爆发增长,从而成为资本重点投资的新赛道。

其次,过去几年创业热门领域,如自动化、预测分析、机器视觉等,将步入大量「大鱼吃小鱼」的新阶段,一方面,创业公司之间的兼并会加速,另一方面则是巨头的收割已经开始。

第三,AI 领域的新工作需求开始凸显,比如「数据标注师」和「数据训练师」也成为热门职业,这也是当下 AI 需要大量标注数据的必然要求。

第四,GAN(Generative Adversarial Networks),即生成对抗网络将具有真正的应用落地。

GAN 是近四年来深度学习的一个热门领域,简而言之,就是通过两个神经网络的「对抗」,来提升最终的算法质量。微软一位工程师曾经这样解释:

……一个是摄影师(男生),一个是摄影师的女朋友(女生)。男生一直试图拍出像众多优秀摄影师一样的好照片,而女生一直以挑剔的眼光找出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。于是两者的交流过程类似于:男生拍一些照片 ->女生分辨男生拍的照片和自己喜欢的照片的区别->男生根据反馈改进自己的技术,拍新的照片->女生根据新的照片继续提出改进意见->……,这个过程直到均衡出现:即女生不能再分辨出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。

GAN 拥有巨大的应用场景,比如图片、机器翻译、对话、语音合成等领域。甚至也有人在研究,将 GAN 应用到自动驾驶中,这个领域的发展,非常值得期待。

第五,深度学习之外,我们还应该注意其他方法。如今,关于深度学习局限性的争议越来越多,事实也的确如此。数据量始终是深度学习无法克服的难题,更困难的事,深度学习无法产生人类习以为常的「常识」,这也将大大限制机器智能的发展。

长期以来,人工智能研究中都存在「联结主义」与「符号主义」两大门派的对抗,前者催生了目前的深度学习,而后者则强调常识推理,这恰恰也是当下人工智能所欠缺的。在这个领域,Google 正在发力,预计在 2019 年,符号逻辑的人工智能研究方法会初露锋芒。

伴随着技术突破的激动与技术伦理问题的担忧,AI 的 2018 即将画上一个句号,但这一切也仅仅只是一个开始(完)。