← Dailyio 历史存档 | 搜索

标签: Archive

共有 63 篇文章

040:数据、DT 时代背后的潜台词

如果仔细去看,过去几年中文互联网三大巨头 BAT 的进化路径会非常有趣:

  • 百度:从网页搜索到人工智能;
  • 阿里巴巴:从电商平台到数据驱动的公司;
  • 腾讯:从 PC 社交工具到移动社交平台(QQ 到微信);

这三家公司里,百度、腾讯的路径或者说公司口号几乎和硅谷目前的舆论和资本关注点一样:现在没有一家公司不在谈人工智能、也没有一家公司不在谈论社交或社交平台。 (更多…)

038:观察人工智能的三个维度,创业者、研究机构与技术观察家

我曾在过去几期会员通讯里多次指出,当下不同领域的人对于人工智能的理解是有偏差的,这种偏差并非简单意义上的对与错,而是缺乏一个对话频道,导致多数人自说自话。而在本期的会员通讯里,我会提供一系列围绕人工智能的多角度观点和思考,有从业者的反思、智能机器行业年度总结报告以及一篇颇具含金量的演讲。

创业者的反思

华盛顿大学人工智能博士徐宥曾在 Fitbit 负责机器学习,去年离职后参与到人工智能创业大潮中,他在 2016 年年底写了篇反思人工智能创业和投资的文章,他直言这个行业已经开始浮躁:

这一波的 “AI” 创业热潮,准确的说应该是“深度学习算法”创业潮…….而大量的创业公司都纷纷采用 .ai 做为域名后缀,实质上只是在“深度学习”这个子领域,解决一些特定的,以前只能靠人的智慧才能解决的问题。

就和 .com 时代一样,域名后缀的符号意义远大于实际意义。媒体,投资人和创业者都默默接受了 .ai 这个集体幻觉。总的来说,目前 AI 公司的井喷,是深度学习这项技术完成其技术扩散 (diffusion of innovations) 的体现。在 Google, Facebook 等技术领先企业的示范和大笔收购下,风险投资大量向 AI 倾斜。许多掌握机器学习和深度学习的人才,认识到深度学习可以用来解决一个具体的问题,也流动到创业公司开始创业。因为 AI 入门门槛很高,目前还是很容易从创业者的教育和工作经历来甄选到底一个公司做的是不是深度学习,还是挂羊头卖狗肉的。

其次,创业公司的真正机会在哪里?很多投资人在人工智能领域投资时会关注创始人的价值,比如早前蓝驰创投就在一篇分析报告中认为:

现在来看美国比中国还是领先不少,美国有4大名校:MIT、斯坦福、卡内基梅隆、纽约大学,还有Google、Facebook、MS这些大牛公司,培养了很多人才。在语音识别,图像处理等领域国际很多顶级专家都是华人。国内也有很多专家,行业薪资待遇越来越好,会吸引更多的优秀人才进来。这批人目前可能在百度、腾讯和阿里,将来可能加入创业大军(已经出现)。

然而摆在创业公司创始人面前的,还有产品方向的问题,徐宥提出他的思考:

AI 创业,还是要落实在深入解决一个非标准(不能拿标准的深度学习模型一套就能用)的问题上。只有在非标准的问题上,切实的了解用户需求才变成可能。标准的问题,如图像识别,自动驾驶,可以说,最终产品的亮点大家都差不多,因此人工智能也就不自动成为一个亮点。在非标准的问题上深耕,无形中就构建了两个护城河:1,竞争对手需要花时间了解这个问题之后才能提出解决方案和产品;2,你比竞争对手先收集许多解决这个领域特定问题的数据,因此在同一时间节点上,你的模型永远领先对手几个月。这就像微软的搜索引擎或许使用的模型很先进,但因为没有足够的数据因此质量永远落后 Google 几个月一样。

人工智能相关行业的发展汇总

从语义的角度来说,物联网、人工智能、机器学习、自动化其实没有任何真正含义,常将这些用于挂在嘴边的人也大多是外行人(比如,投资人),但在过去的 2016 年,上述四个领域还有一些值得关注的现象,尤其是一些可能会在 2017 年影响到技术行业发展的重要因素。

比如亚马逊的 Echo 和 Google Home;紧接着,VR、AR 以及 MR (Mix Reality)的持续火爆,尤其是 PokemonGo 引发的 AR 游戏热潮,而当 Google 的 AlphaGo 一举击败人类选手之后,人工智能、机器学习的热潮开始席卷全球;另一个战场上,Uber、百度、Google 又紧锣密鼓地争夺无人驾驶的未来话语权。

事实上,「物联网」这个词的外延也很大,从字面的角度来说,所谓物联网,是一些从前没有连接的物体被连接起来,比如过去我们会在书桌上使用笔记本,尽管笔记本是可以联网的,但书桌并没有联网,而物联网要做的,则是将这些传统意义上不具备智能属性、联网属性的物体连上互联网。

在 2016 年,物联网领域最有代表性的突破就是新一代交互模式的成熟,这就是基于声音的交互模式;但另一方面,物联网所遇到的挑战也非常大:Dyn 服务器被攻击导致 Twitter、Netflix 下线,再次引发了人们对于大量物联网设备接入网络后所面临安全风险的担忧;Google Nest 团队新产品难产,部分意义上也说明了这笔高达 32 亿美元的收购或许就是一个败笔;在可穿戴设备市场,Pebble 卖身 Fitbit,Android Wear 出货大户 Moto 360 无限期推迟新产品计划,只剩下 Apple Watch 苦苦支撑…..

下面这幅图以时间线的方式非常直观地展现了 2016 物联网领域的发展状况:

img

从硬件领域,以下这些事件影响深远:

  • Nvidia 通过 GeForce GTX 1080、1070 继续统治 GPU 市场,这些图形处理器也加入了很多支持 VR 的特性;与此同时,Nvidia 还在机器学习领域和包括 Facebook、IBM 在内巨头公司建立合作,将其自身研发的 Tesla 图形处理器装备到这些公司的服务器上。
  • 英特尔这年完成两笔重要收购:Nervana Systems 和 Movidius。接下来,英特尔计划通过整合上述收购,并结合自身的产品,比如 Altera、Phi、Xeon 处理器等产品,从而打包推出人工智能套件产品。
  • 高通 390 亿美金收购了汽车芯片制造商 NXP (恩智浦半导体),而软银也在今年花费了 310 亿美元买下 ARM 公司,TDK 则用 13 亿美元将一个重要供应商 InvenSense 收入囊中;
  • 9 月份的时候,Particle.io 与Google 云平台达成合作,将通过云端加速整个物联网的开发部署;

软件层面,语音交互之争还在另一个战场继续,三星买下了曾经一手缔造了苹果 Siri 的 Viv 团队;目前来看,语音交互呈现一超多强的局面,Alexa 继续领先,而 Google、Apple 与三星将争夺接下来的市场,这也会成为 2017 年最值得关注和期待的领域。

机器学习在过去的 2016 年迎来重大发展,这不仅包括 AlphaGo 历史性胜利,也还包括创纪录参会人数的 NIPS (神经网络研究大会),更重要的则是,围绕机器学习的大量创业公司的出现,也进一步推动了整个行业的发展。fnn这其中,深度学习毫无疑问赢得了几乎所有人的主力一,下面是 CB Insights 针对创业公司的梳理:

464a6e684bbb264e6636ef9df857b646.jpg

下面不妨来看看巨头们的动向:

  • Google DeepMind:由 AlphaGo 引发的公众情绪一定程度上也加速了人工智能行业的发展。而在强化学习之外,DeepMind 还在其他领域取得突破:比如研发了 Differential Neural Computer (DNC),这是一种建立在神经网络概念上的计算机,通过结合深度学习模拟思考的方式,而不再局限在模式识别。另外,DeepMind 还在还在研究如何让小规模数据集条件下,进一步提升机器学习的训练效果。
  • Google 大脑:就目前来看,Google 内部的人工智能项目也有两个团队,除了上文提到的 DeepMind,还有一支 Google 大脑。《纽约时报》年末用了大量篇幅报道了这个团队现在所做的事情,从中也可以基本归纳出Google 大脑和 DeepMind 的区别之处:Google 大脑更侧重于深度学习与 Google 自身产品的结合,比如在翻译产品方面的突破就得力于深度学习了;而 Deepmind 则在基础算法研发上保持优势。
  • Facebook:在 Yann LeCun 的领导下,FB 人工智能实验室主要聚焦在卷集神经网络和图像处理方面。2016 年,FB 发布了一款名叫 Caffe2GO 的工具,这是一个可以让深度学习网络在移动设备上完成部署的工具。
  • OpenAI:在 Elon Musk 的努力下,这家名叫 OpenAI 的非盈利人工智能研究公司终于成立了,这个机构背后还有包括 Reid Hoffman、Peter Thiel 等人。OpenAI 的研究者在 8 月份提出一个 infoGAN 的模型,这是一个基于海量数据、非监督性学习下的生成式模型。
  • 微软:和 Google 一样,微软在机器学习领域布局甚广。今年主要的突破是在语音识别领域,2016 年 10 月,微软的研究人会员宣布其语音识别系统的准确性已经达到人类的水准。而大量与机器学习相关的产品模块也融入到微软 Azure 云端。

技术观察家的「警世恒言」

Maciej Cegłowski 的名声并不大,他的影响力更多的还是局限在程序员、极客的小圈子。从履历上说,他曾在雅虎做过程序员,同时开发了一款书签产品 Pinboard,同时也是一位画家和作家。在他的个人网站 idleword 上,有很多对科技发展睿智的思考,包括文章和演讲。比如这篇以人工智能为主旨的演讲。

d86296cbce530cb97d0f67bf81d61905.jpg

Maciej Cegłowski 这篇演讲更多地站在技术伦理的层面,去探寻人工智能、智能机器所带来的各种影响——这并非杞人忧天,而是现实境况倒逼的选择。

1945 年的时候,随着一群美国物理学家准备测试原子弹,一些关于原子弹的疑问也开始增多,比如有人就质疑:「原子弹真的能在大气层里爆炸吗?」

这个问题并不愚蠢,因为构成大气的主要成分是氮,而氮是一种非常不稳定的元素。这就意味着物理学家们需要精确计算原子弹爆炸时的各种环境参数,既要保证能够完成爆炸,又要避免原子弹点火前出现任何偏差。

而在一系列精密计算之后,物理学家们给出一个答案——这个答案的公式对我们来说并无真正意义,但你我都清楚一件事:那就是人类能够活到现在,就是因为这一次的计算非常准确。

现在,人类遇到了另一个需要计算的「武器」——机器智能或人工智能。其实名字并不重要,重要的是这些技术将给人类的生活、工作带来重要影响。比如提升生产效率、比如让驾驶变得更安全,但另一方面也带来一系列隐患和担忧,就像当时人们对于原子弹的担忧一样——我们如何让新技术的发展不影响到人类生存?

英国牛津大学学者 Nick Bostrom 提出了一个思考框架,在他的畅销书《超级智能》[1]里,Nick Bostrom 进一步阐释了这个逻辑,用 Nick Bostrom「迷妹」Elon Musk 的话来总结:人工智能就是被召唤的恶魔。

仔细去看 Nick Bostrom 的分析框架,其实是有以下几个前提:

  • 前提1:一些显而易见的重要证据
  • 前提2:大脑是符合经典物理的存在
  • 前提3:相信生物进化
  • 前提4:相信计算能力的进化
  • 前提5:当计算能力达到一定高度后,时间变得无足轻重,比如 AlphaGo 只需要几天的时间就能完成一个职业棋手几年才能熟练掌握的棋谱;
  • 前提6:机器可循环的自我提升

如果你认同六个前提,那么一定程度上也可以接受 Bostrom 的观点,但更多的问题和争论也就此开始了……结合这几年不同行业、领域的疯狂反应,Cegłowski 特别指出了一点,也是我觉得最具洞察的一点:当下对人工智能的某种狂热就像一门新的宗教。他这样写道:

What it really is is a form of religion. People have called a belief in a technological Singularity the “nerd Apocalypse”, and it’s true.

It’s a clever hack, because instead of believing in God at the outset, you imagine yourself building an entity that is functionally identical with God. This way even committed atheists can rationalize their way into the comforts of faith.

The AI has all the attributes of God: it’s omnipotent, omniscient, and either benevolent (if you did your array bounds-checking right), or it is the Devil and you are at its mercy.

Like in any religion, there’s even a feeling of urgency. You have to act now! The fate of the world is in the balance!

And of course, they need money!

最后,让我们好好听听 Cegłowski 的这个精彩演讲吧:

036:2017年对自动驾驶的十六个疑问

我在此前几期会员通讯里多次提到自动驾驶或无人驾驶带来的潜在影响,在我看来,无人驾驶不仅是科技公司竞争后移动互联网时代的重要布局,更是塑造人类未来生活的开始,毕竟,当下我们生活的城市,都是汽车推动的,而接下来的城市,将由自动驾驶汽车塑造。

a16z 合伙人 Frank Chen 日前分享了一个非常有料的视频,他以 16 个问题的形式,系统探讨了当下无人驾驶面临的机遇和挑战,并提出的一些解决思路。视频原地址在这里,英文无障碍的同学可以直接看,我这里只针对几个要点做一些补充和阐述。

自动驾驶的等级

事实上,自动驾驶是一个非常广义的概念,也是一个很容易被误解的概念。根据美国汽车工程师协会(Society of Automotive Engineers)对于驾驶的自动化程度的标准,有如下六大等级:

img

简单来说,Level Zero 就是纯人类驾驶,level One 则是所谓辅助驾驶,也是目前绝大多数中高级汽车可以实现的功能,诸如定速巡航之类的功能,后面几个则需要着重说一下:

  • Level Two: Partial Automation,这是一种可以让汽车在某些特定情况下代替人类完成驾驶行为的等级,而驾驶员需要全程监控系统运行状况。
  • Level Three: Conditional Automation,这个等级比上面更高一些,驾驶员不必全程监控,但需要在某些紧急情况下取得汽车驾驶权;
  • Level Four: High Automation,这个等级更高,汽车可以应对绝大多数的驾驶任务;
  • Level Five: Full Automation,所谓全自动驾驶阶段,你需要做的,就是两个字:享受。

你的自动驾驶汽车采用什么传感器?

激光雷达,毫米波雷达和摄像头是无人驾驶的三大关键传感器技术,Google、Audi和百度等公司研发的无人驾驶汽车基本都采用了激光雷达。

目前激光雷达在无人驾驶的两个重要作用,其一是3D建模进行环境感知。通过激光扫描可以得到汽车周围环境的3D模型,运用相关算法比对上一帧和下一帧环境的变化可以较为容易的探测出周围的车辆和行人。其二则是SLAM加强定位。激光雷达另一大特性是同步建图(SLAM),实时得到的全局地图,通过与高精度地图中特征物的比对,可以实现导航及加强车辆的定位精度。

img

但摆在自动驾驶各个巨头面前的重要挑战则是激光雷达高昂的价格,比如一款 Velodyne 64线激光雷达的价格高达 8 万美元,配备这样雷达的自动驾驶汽车,价格不会低于 30 万美元,这也意味着,其与大众市场有相当大的差距。

当然也有一些好消息,比如全球顶尖激光雷达厂家Velodyne 在去年获得百度等多家公司融资后,其新品研发速度令人刮目相看,倘若能将雷达价格降低到 1 万美元以下,毫无疑问将给行业带来巨大影响。

地图之争

过去几年,中外的地图大战基本结束,全球范围内的 Google Map 据垄断地位,苹果地图也有一些份额,在中国市场,百度和高德瓜分天下,但上述地图都是给人类看的地图,而不是给汽车看的地图,换句话说,新一轮围绕汽车的地图之争已经开始。

所谓汽车地图,或者高精地图,需要的是交通信号灯、车道标记(如白线、黄线、双车道或单车道、实线、虚线)、路缘石、障碍物、电线杆、立交桥的信息,而麻烦的是一点在于,由于很多道路不可预知的情况,比如道路施工、维修等原因,上述信息也是动态变化的,这也提出了另一个问题:汽车的地图是提前编程还是实时计算?如果是实时计算,其网络能力能否应对如此海量的传输需求?

还有哪些新技术会来到汽车?

深度学习毫无疑问是最热门的技术候选,另外模式识别,云与本地的结合等等都有不小的潜力。

img

不过有意思的是,我们曾经一度被震惊的波士顿机器人,从来没有采用机器学习……

谁会成为赢家?

目前的自动驾驶领域从国别上说,是中美日之争,而从切入点来说,则是传统汽车公司、新锐汽车公司和互联网公司的竞争。

img

不过,一个有意思的事实则是,这些公司不管来自哪里,都开始在硅谷建立了办公室,也申请在加州测试无人驾驶汽车,而未来的胜者,或许将在这其中产生?

自动驾驶的商业模式

短期来看,自动驾驶汽车的价格不会完全亲民,这意味着每人一辆自动驾驶汽车的美梦短期内还无法实现。这也是当前 Uber 、Lyft 等共享出行公司努力的方向:在自动驾驶普及前,通过共享出行占领市场[1]

img

另一方面,自动驾驶本质上是软件层面、服务层面的竞争,互联网公司有着天然的优势,传统车企的命运十分危险。

自动驾驶的时间表

img

目前尚无明确的时间表,但 2020 年会成为重要一年,各大巨头的自动驾驶汽车或将正式商用。而接下来的 20 年,则是自动驾驶真正走入普通大众的时间。


  1. 我曾在去年多期会员通讯里谈过这个话题。  ↩

035:十年前的今天,iPhone 降临人间

当乔布斯 2010 年站在WWDC大会上展示具有里程碑意义的 iPhone4 之时,他一定不会忘记三年半之前发布第一代 iPhone 的那个寒冷冬日。

0754d857e59e8555de74c66c520a8f7b.png

以「百年孤独的句式」开始这个关于颠覆的故事再合适不过,也正如马尔克斯笔下被魔幻所笼罩的马孔多,乔布斯从2007年开始掀起的创新浪潮彻底地颠覆了一个行业,并开创一个属于他、属于苹果乃至属于科技的新时代。

然而故事的开始,却并非那么光鲜亮丽……

从音乐入手

2007 年之前的手机行业,整个行业都在几个手机厂商和运营商的控制之下。彼时,诺基亚以年均发布40 款手机的速度攻占了除美国之外的绝大多数市场,几乎完全实现了高中低通吃;已经老迈的摩托罗拉一边鄙视没有技术含量的诺基亚、三星,一边继续埋头研究如何让手机变的更轻薄;深居企业市场内部的黑莓,则继续享受来自军方、政府以及五百强企业的大宗采购福利;而度过经济危机之后的三星,则通过机海战术逐步占据了手机行业前四强的位置。

不管是 2005、06年开始的音乐手机、拍照手机噱头,还是 2006 年诺基亚一年卖出的手机就超过摩托罗拉三星之和的新闻抑或是2005年国产手机市场占有率将近半壁江山的自豪与荣耀……一切看起来都很平静,诺基亚稳坐行业第一,综合竞争力最强;三星、摩托罗拉以及一些日本厂商瓜分剩余市场;在欧美成熟市场,所有手机厂商都受制于网络运营商,制造定制机成为手机厂商的重要任务。这是一个拥挤且门槛极高的行业,从行业技术到行业游戏规则,外来者难有进来的机会。

颠覆者们却都在暗处酝酿着。

2005 年,摩托罗拉发布一款名为 Rokr E1的「音乐手机」,这款手机像很像一个棒棒糖,在功能方面,它整合了 iTunes 商店的音乐。用户可以在 iTunes 商店购买音乐,然后下载到手机。但由于容量限制,该手机只能存储 100 首歌,无法满足用户对于音乐的需求,更重要的是,这款手机在设计体验上极其不友好,传输歌曲、切换歌曲的速度都非常慢,从而最终消失在人们的视野里。

img

那时,最流行的数码产品莫过于苹果的 iPod。从某种意义上说,音乐播放器就等同于 iPod,用 iPod听音乐是一件理所当然的事情。越来越多的手机厂商认识到手机作为一种通讯工具,可以而且应该与音乐播放器合二为一。这也是摩托罗拉推出一款音乐手机的原因所在,但很不幸,Rokr E1 的尝试很失败,但与摩托罗拉一起开发手机的另一家公司却看到了新的契机。

这家公司就是苹果。

此时,苹果正利用「iPod+iTunes」积攒新的爆发力量。2005年一整年,苹果公司共卖出了史无前例的 2200 万台 iPod,是 2004 年的 5 倍,到了 2006 年,这一数字再次被刷新到 3940 万台。在 iPod 的推动下,苹果公司收入不断新高,2005 年全年收入达到 160 亿美金,较2004年增长了将近 40%,2006 年的销量则更创新高。

ef3fe3907f03f92fa719340e1c87fef3.gif

iPod 的成功与音乐手机的出现也促使苹果公司开始重新审视下一个战略产品。其实早在 2003 年,苹果公司内部就已经开始针对 iPod 进行一系列的改良研发,其中很多技术今后都体现在其他产品中。比如多点触控,当时大多数的触控设备只能一点触控,而且很多设备对笔或手指的支持度不统一(有的灵敏、有的迟缓),苹果工程师邓肯·克尔展示了全新的多点触控技术:只需要三个手指就能完成绝大多数的操作,还能进行屏幕旋转和图片缩放……

IMG_1366

这项技术并未直接进入产品阶段,却也为接下来那个改变世界的产品提供了基础,这就是iPhone……

秘密研发

乔布斯一开始并未直接采用触屏方案,当时的苹果高层为了不把所有的赌注放在一个篮子里,启动了两个不同的设计方案。整个手机产品的研发代号为「Purple」(紫色),用字母 P 作为简称,其中基于苹果第 4 代 MP3 播放器 iPod Nano 的设计代号为 P1;另一组设计是以全新多点触控设备为基础,代号为 P2。

几个月后,P1 小组的原型机出来了,这款「手机」将 iPod Nano 上切换歌曲的触控轮改造成手机的拨号键——几乎和老式的电话一样,通过滚动通讯录来拨打电话。但这款设计有着强烈的 iPod Nano「遗迹」,仅仅一个拨号功能就足以让很多人放弃了,而且,和 iPod Nano 类似,屏幕很小,比不上当时市面上的诺基亚手机屏幕尺寸。

4c553cd900e29a2b7c978f1d2c68aed4.jpg

乔布斯最终放弃了 P1,转而全面支持 P2 的研发,并授权P2团队可以调取公司内部的一切资源,但所有这一切都要建立在保密的基础之上。

在团队组建方面,他们会在公司内部寻觅有天赋的工程师,逐个谈话,而话术则充满了诱惑:

以你目前的这个职位看,你已经是超级巨星,深受上司器重。如果待在原来的岗位,继续做你想做的事,你会在苹果获得惊人的成功。而我现在要提供给你的是另一个机会、又一个选择。我们要启动一个新的项目,一个非常保密的项目,我甚至都无法告诉你这个新项目到底是做什么的……

紧接着,手机研发团队包下整整一层楼,并安装身份识别装置以及摄像头,这层楼的入口处挂着一个牌子:「搏击俱乐部」——这个名字的梗就在于,有部名叫《搏击俱乐部》的电影,影片里每个成员遵守的首要规定就是不能和别人谈论俱乐部的事情。换句话说,苹果公司也希望这些员工不要对楼层以外的人谈起他们正在研发的项目。

更极端的情况发生在第一代 iPhone 发布之后,那些为 iPhone 提供硬件的厂商才第一次知道自己的产品被组装到一部手机里。这是因为,苹果的工程师从来没有给他们看过真正的设计图或原型机,所有的图纸和设计都是假的,甚至于,苹果公司的员工还假扮另一家公司的人去拜访硬件供应商。

74d59f6a57b170c00579a8a65c65a19f.jpg

在核心的触摸技术研发上,2005 年初,苹果公司悄无声息地收购了一家名叫「多点触控」的小公司,这家公司在此之前有很多触控方面的产品。苹果收购之后,迅速地将之前的产品撤出市场。直到一年以后,多点触控的两位创始人韦恩·韦斯特曼和约翰·伊莱亚斯开始为苹果申请新的触摸技术专利,媒体才了解到这次收购。

围绕触摸技术,苹果天才般的设计师乔纳森认为:没有什么东西可以转移用户对屏幕的注意力。因此,他们要打造一个类似于「无边际游泳池」的屏幕。

但这样的屏幕究竟要使用塑料还是玻璃,却发生了一些分歧:设计师们考虑到塑料不容易摔碎,原型机都使用塑料作为屏幕材料,但乔布斯习惯将原型机和钥匙放在一起,当看到屏幕上的钥匙划痕后,乔布斯很生气,他后来回忆说:「我出售的产品绝不能这么轻易就被划破,我希望换成玻璃屏,而且希望你们在六周内完善它。」

当苹果团队最终选择位于纽约州的康宁公司生产的玻璃屏幕时,又一个难题出来了:如果手机摔倒地上,如何最大限度的保护屏幕?在《乔纳森传》一书里,我们看到了苹果工程师的精益求精:

解决的方法是,在玻璃屏幕和不锈钢边框之间垫一层薄薄的橡胶垫。可橡胶垫产生了缝隙,一些设计师出于私人原因在最初很讨厌这种橡胶垫。「因为我们大多数工业设计团队的成员都很少刮胡子,所以留有胡茬。如果我们把手机贴到脸旁,那种缝隙就会夹住脸上的胡子,」萨茨格笑着这样说。设计团队又在缝隙的大小上下了一番功夫,直到把它弄得合适为止。

现在离MacWorld只有几周的时间,苹果终于做出一台运行完美的原型测试机,当乔布斯向AT&T CEO 斯坦·西格曼演示完一系列操作之后,西格曼声称:「从来没有见过这么好的设备。」

这是对乔布斯最大的鼓励,接下来就是见证奇迹的时刻……

不像手机的手机

第一代 iPhone 发布时,乔布斯背后的大屏幕上出现了三个图标,分别是:iPod、电话和浏览器。

IMG_1369

乔布斯不动声色的说道:「今天,我们将推出三款革命性产品。第一个是宽屏触控式iPod,第二个是一款革命性的手机,第三个是突破性的互联网通信设备。」

大屏幕上出现了那个被苹果否决的 P1 手机,乔布斯开玩笑的告诉观众:「我们可不要制造这样的手机」,接着三个图标开始以不同方式旋转,最后归于一个,这就是 iPhone。

它看起来是那么的不像手机:没有键盘,正面除了一个 Home 键外只有屏幕;体验方面,触摸完全代替按键。乔布斯的介绍也恰恰体现出这款所谓「手机」的功能:

IMG_1367s

他先是听了会音乐,看了一段视频,把iPhone的屏幕优势展示出来。接着他希望让大家了解触屏打字时多么容易,于是发了一封邮件和短信;然后,他翻阅一堆照片,显摆缩放照片的「优雅」;最后,他打开浏览器访问了几个网站,并用Google地图找到一家星巴克。

期间,他只打了两个电话。

很显然,在乔布斯的逻辑里,iPhone 首先是一台可联网的计算设备,其次才是通讯设备。这当然是一种功能的叠加,但却完全跳出手机行业里的潜规则——在通讯模块之外的功能模块堆积,而这恰恰是诺基亚打败摩托罗拉从而登上手机霸主的重要武器。

2f8e13336d6cce2ff22036d7983fbff3.jpg

得益于长期积累的技术优势,摩托罗拉凭借天线技术和模拟信号处理技术曾统治了第一代移动通信市场。进入 2G 时代后,诺基亚在此基础上提升了功能性,并利用每年几十款手机横扫市场,不管那个价位的手机,诺基亚手机都能提供几乎一体化的功能以及多个颜色的定制:

  • 2004 年诺基亚就推出第一款触摸手机——7710;
  • 2006 年推出 N91,采用 200 万像素摄像头和 4G 内存,可存储大约 3000 首歌曲;
  • 2007 年的 N93i 拍照一流;同年推出的 N95(如下图),内置 GPS,采用 500 万像素卡尔蔡司认证摄像头,同时还拥有摄像和蓝牙功能。

7be042837ba95544a3d86174f2ccf7f0.jpg

这些功能在 iPhone 之前是那么的吸引用户,但随着iPhone正式发售的临近,越来越多的用户开始关注苹果广告里那令人陶醉的操作方式:触摸解锁(操作)、编辑邮件/短信时自动弹出键盘、巨大的屏幕……对很多人来说,iPhone 不再是手机,而是一款可以装进口袋的 Mac 电脑。

作为从未触碰通讯业的企业,苹果公司看起来没有任何手机的制造经验和积累,但这种劣势反而使得苹果跳出了手机行业固有的思维模式——让所谓手机模样、信号强、耐摔等规则见鬼去吧。苹果重新定义了一切——从外观工艺到核心应用,一切都是一种新的思维模式和游戏规则,正是在这样一套思维的驱动下,手机行业的颠覆革命,徐徐展开。

时光荏苒,我们似乎也忘记了何时开始,周围的人们开始用上了 iPhone—— 这个一直以来从未低于 4000 块的智能手机——而且也并非一个好用的打电话设备…..

2017 年 1 月 9 日,第一代 iPhone 正式迎来十周岁的生日,无独有偶,早前几天,曾一度远离公众视野的诺基亚手机再度回归,其新一代搭载 Android 的智能手机也即将问世。十年的光阴,苹果与诺基亚完成一个轮回,同样是十年的光阴,中国的智能手机厂商们,从无到有,从小到大,依托 Android 和中国广大的移动互联网市场,逐步成为苹果的重要挑战者。

智能手机的未来在哪里?这或许并非是媒体人所能预料的事情,我们唯一可以确定的一件事,正如一本名叫《重来》的畅销书里所言:

你无法创造出超越苹果公司的苹果产品,因为游戏规则是他们定下的,而你是无法打败游戏规则制定者的。

034:移动互联网「下半场」的新变数:Chatbot、微信小程序以及其他

如果套用一个时髦的词语来形容当下的移动互联网,那么我一定会选择「下半场」。

在这场没有「中场战事」的上半场里,智能手机新锐苹果、三星横扫全球,确立全球性的垄断地位;传统厂商集体谢幕,与之相对的,则是以小米、华为为代表的中国手机企业的强势崛起。当然,在这个上半场,那些安装到手机上的应用、游戏也不断刷新人们对于安装量、用户打开率、活跃度乃至财富的认知,下图是一份来自 应用数据和分析公司 App Annie 的统计数字,展现了基于 iOS 上的 App 收入情况:

img

但一个显而易见的事实则是:上半场已经结束,而下半场的竞争之惨烈也会远远超过上半场。

先来看智能手机市场,苹果的 iPhone 销量持续下滑,在 iPhone 7 发布前的财报中,iPhone 销量同比下滑了 5.2%,由于新财报还未公布,因此新一代 iPhone 7 的销量如何还未知晓,但站在一个个体消费者的角度去看待这个产品,无论是功能还是外形,并没有带来真正的惊喜,因此,其销量也不容乐观。

而与苹果的式微相比,中国智能手机厂商的厮杀则进入白热化阶段,从当初的所谓的「互联网手机」到现在的「线下渠道为王」,从当年的小米一统天下到如今小米、华为、魅族与蓝绿两厂的群雄逐鹿,这似乎是个令人欣慰的局面。但摆在这些手机公司面前的问题不少:

  • 手机同质化严重,从硬件设计到软件系统,并没有真正带来突破;
  • 专利隐患,不管是大厂如华为,小公司如魅族,都不得不面对一系列专利困难,而专利,也是中国手机厂商能否走入国际市场的重要条件;
  • 智能手机红利期的消退:如果说上面两个难题还能解决,那么这个难题就是个无解,它是行业趋势发展到某个阶段的必然现象,苹果、三星也解不开。

另一个展示智能手机被人遗忘的事实就是,一年一度的 CES 早已没有手机的「席位」,即便是每年 3 月的所谓世界移动大会(MWC),更多地不过是大公司如三星、华为发布手机的地方,而并未给用户和媒体带来尖叫的契机。来自美国消费技术协会的预测也显示:2017 年智能手机的销量达到 18 亿部,与 2016 年持平。

硬件之外,软件或应用所遭遇的「下半场战事」也不乐观。全球范围内,以 FB、Google 为代表的巨头形成了移动应用的绝对垄断地位,下图是一份来自市场调研机构尼尔森的统计数据,统计了全美 2016 年十大热门移动应用:

IMG_1343

Facebook 和 Google 占据了这个榜单的前八名,各自有 3 款和 5 款产品入围。

中国市场的情况几乎类似,不过目前还缺乏更多来自第三方机构的年度数据支持[1],仅以百度年度热搜报告来看,十大热门应用当中,BAT 三家占据了几乎六成:

IMG_1349

另一份稍早一点的数据来自易观,这是一份 2016 年 11 月移动应用 1000 强,大致也是这样的分布:

IMG_1344

正是在这样的背景之下,智能手机或者说移动互联网不得不进入一个新的战场,所谓「下半场」的争夺战,颇为有趣的是,这个下半场里,硅谷和中国的公司几乎都在一个领域—— 社交应用,前者瞄准了 Chatbot,后者则是微信的小程序。

从产品形态来说,Chatbot 部分意义上也「抄袭」了微信的服务号的功能,如果你经常在微信里使用诸如招商银行信用卡这样的服务号,也能明白所谓「Chatbot」的真正面目:将所有服务的交互变成一种对话的交互。也因此,如果你再从其他媒体上看到诸如对话机器人、对话界面、聊天机器人等等名词,可以直接理解为微信服务号就可以了。

Chatbot 毫无疑问是过去 2016 年硅谷最火热的装逼词汇之一。大公司大规模开放基于聊天应用的 bot 开发框架、风险资本的追捧以及媒体不间断的热议,让 Bot 变得无处不在。Evernote 创始人,如今已是投资人的 Phil Libin 这样描述自己对于 Bot 的态度:重新感受到2007 年在波士顿 Apple store 前排队四个小时买下 iPhone 的心情。

ChatBot 代表了一种全新的人机交互模式,要解决移动互联网「App 信息孤岛」的难题,而微软、FB 如此热衷 Bot 的主要动力则是打破苹果、Google 在智能手机操作系统中的垄断地位,换句话说,当聊天应用成为所谓「超级应用」时,移动操作系统的区别已经无足轻重了,就像国人现在对于微信之于手机的意义,我曾经不止一次地表带类似的看法:中国移动互联网用户有两类人,一类是微信用户,另一类则是移动互联网用户。

站在社会学的角度去看,Chatbot 的火热,也是一种人机关系的微妙体现。作为有史以来第一款 Chatbot——伊莉莎的创造者,约瑟夫·魏泽鲍姆(Joseph Weizenbaum)惊讶地发现,很多人沉迷与伊莉莎的聊天。伊莉莎「出生」在1966年的MIT,用于在临床治疗中模仿心理医生。

IMG_1346

尽管伊莉莎的实现技术仅为关键词匹配及人工编写的回复规则,导致对话是单向的而且也会产生一些很奇怪的回复,比如,当用户提到自己的妈妈时,伊莉莎会以「你说你妈妈?」这样的句子来回复。魏泽鲍姆后来提到,很多用户喜欢这种体验,甚至会透露一些私密的个人信息。

对此,硅谷资深记者约翰· 马尔科夫在《与机器人共舞》里这样评价:「这一发现对机器的本质来说或许用处不大,但对人类的本质来说则是了不起的,这证明人类习惯在与自己互动的对象中寻找人性存在的迹象,从没有生命的物体到提供虚拟人工智能的软件程序,无一不是如此。」

而在 2016 年的 Chatbot 领域,所谓「对话」已经不再局限在文本,语音、图像也逐步成为新的「对话」方式,得力于深度学习的快速发展,语音识别、图像识别、自然语言交互等技术开始大幅被武装到 Chatbot 领域。苹果和 Google 希望牢牢抓住智能手机上的虚拟助理,将虚拟助理的角色上升到系统层面的 Chatbot 产品,以此对抗 FB 、微软们的侵蚀,这场战役还将在 2017 年继续打下去。

在中国,微信的小程序走向了另一个方向。

魏武挥在一篇文章里简要归纳了微信小程序以及张小龙的野心

他(张小龙)决定站在微信庞大的用户群和超高粘性的基础上,让web卷土重来。

这就是小程序。

小程序,就是小网站。

而微信,像极了一个浏览器。

如果说微信是浏览器,那么也形成了一种与曾经 PC 时代几乎一样的格局:

  • PC 时代:微软掌控操作系统,浏览器逐步开发,国内百家齐鸣,国外 Chrome、Firefox 两分天下;
  • 移动互联网的下半场:苹果、Google 掌控系统,微信成长新的浏览器,掌控国人一切移动互联网的操作;

魏武挥特别提到了一点:

他(张小龙)充满恋旧之情地回顾到了这样一点:网站,并不需要一个订阅关系。

网站是用户想上才会和用户link的,它并不会下发消息。

网站是“用完即走”的。

「用完即走」出自张小龙的演讲,也同样构成了观察和判断微信小程序产品走向的基础。上述这番类比同样引出另一个话题:微信小程序的入口究竟该在哪里?

张小龙给出的答案是「二维码」,这是一种类似于曾经要在浏览器上输入网址的做法,更重要的一点在于张小龙也明确表示不会有所谓的小程序导航或者小程序商店,倘若张小龙的这番表态最终落实,其意义不言而喻。比如没有官方商店的做法,就能大幅减少官方层面的流量干预,对前期小程序的发展极为有利,也将让微信——这个新一代的浏览器更具价值。

某种意义上说,这的确是一种反潮流的举动。当 iPhone 重新定义了手机,App Store重新定义了移动互联网的应用使用方式,一个个 App 就成为用户与手机产生交互的唯一触点,在移动互联网时代,传统的浏览器,如 Chrome、Safari 变得无足轻重,用户不会在浏览器上输入「taobao.com」购物,也不会打开12306 的网站买车票,这些需求都可以在相应的 App 中完成,而微信接下来要做的,就是改变用户使用移动应用的习惯,从打开一个个 App 到打开微信,扫描二维码,进入相应的小程序。

这是一个比 Chatbot 更具野心的尝试,因为 Chatbot 要做的,不过是提升消息应用的粘性,而微信的此举,是颠覆或者重新定义用户的认知。

2017 年是 iPhone 发布的第十个年头,各种不确切的消息都声称今年的 iPhone 会带来质的变化,不过相比于 Chatbot、微信的变化,iPhone 以及其他各种移动设备的进化都显得无足轻重。因为在美国,你离不开 Facebook 、Google 以及它旗下的多个应用,在中国,你也离不开微信、淘宝、百度,所有这些「离不开」与设备、操作系统的关系越来越小,换句话说,移动互联网真正绑架我们的,不是智能手机,而是 FB、Google 、微信、淘宝、百度。

在这个下半场,还有一些略显另类的挑战者们。比如 Snapchat,再比如亚马逊。a16z 合伙人 Benedict Evans 前两天发了一条推文

Last year every damn thing at CES had a camera. This year will probably be a microphone.

Evans 的感慨也对应了 Snapchat 与亚马逊这两家公司对于行业的影响。我曾在之前的会员通讯里详细分析了 Snapchat 所带来的意义,这里重点谈谈亚马逊以及 Echo。

严格意义上说,Echo 并不是移动互联网产品,它根本无法移动、无法携带,它只是「安静」地呆在家里,或客厅、或厨房、或卧室,你所能做的,只是一句语音唤醒:「Alexa,blabla」。但 Echo 却展现亚马逊对于移动互联网下半场的想象力:用声音操控一切。

对,Echo 唯一的入口就是声音。基于声音,你可以直接在亚马逊下单购物,直接安排日程、打电话,直接操控家用电器运转情况,当然,你还可以之结合它聊天…..如果以微信小程序的野心来看待亚马逊 Echo 的野心,你或许会发现,两者几乎都是新一代浏览器的雏形,所不同的只是微信以相机(二维码)为入口,Echo 以声音为入口。

a1fda767a5123ef73760253dc0b00458.jpg

与当前程序员对于小程序跃跃欲试的态度类似,围绕在 Echo 周边的生态体系也开始逐步完善。据研究机构 CIRP 的统计,截至 2016 年 4 月,Amazon Echo 的销量已经突破 300 万台。同时,第三方开发者为 Echo 内置的语音助手 Alexa 开发的技能已经从最初的十几个增加到数千种。

5850baa1d906aa9c05a9527604817e90.jpg

完善的生态圈与简单到极致的交互,成就了 Echo 的快速崛起,也带动了亚马逊股价的上涨,可以毫不夸张地说,在智能手机、平板毫无建树的亚马逊,利用 Echo 成功翻身,再加上 AWS 的成长潜力,亚马逊的未来早已不是所谓电商公司所能概括的。

另一个潜在的挑战是在汽车领域。汽车可谓一款不折不扣的「移动产品」,放眼中外主流科技公司,几乎都与汽车行业产生了各种关系,随便举几个例子:

  • 百度、Google 的无人驾驶项目;
  • Uber 的共享出行与无人驾驶;
  • 阿里巴巴与上汽荣威的互联网汽车;

….

而最近几年无论是 CES 还是 MWC,汽车公司或汽车行业的产品都成为业界关注的重点。Benedict Evans 同样也认为,汽车会成为移动互联网「下半场」的新变数

The obvious next market is cars, which in aggregate are much larger in revenue terms, and where a large part of the supply chain will be fundamentally remade by the shift to electric and (in due course) to autonomy. Cars are a Big Deal for the tech industry.

下面的这幅图也极具参考性:

img

但这里的汽车,已不再是工业时代的产品,而是数据时代各种传感器的综合体。譬如无人驾驶,就是一种人机交互的进化,所带来的深刻影响则是整个汽车行业乃至交通以及城市的变革。

不过,当下更大公司对于无人驾驶的过度渲染,有意无意地让公众以为无人驾驶即将「降临人间」或触手可及,但众多无人驾驶汽车上路测试新闻的背后,则是用钱堆起来的机器,比如百度的无人驾驶汽车,且不说汽车价格如何,单就其核心传感器激光雷达的价格,保守估计都在百万人民币左右。相对而言,特斯拉的「摄像头+传感器」的解决方案在价格上更合适,不过可用性上也要大打折扣。

从这个角度出发,无人驾驶落地的第一步绝对不是普通消费级市场,而是商用市场,更确切一点来说是共享出行领域。这也是我看好 Uber 无人驾驶的主要原因——通过共享经济的长尾效应,可以大幅降低无人驾驶汽车的使用成本,最终让普通人也能享受到无人驾驶的乐趣——这和当年 Uber 一度让普通人坐上豪车的感觉是一样一样的。

写在最后

用「一个最好的时代」来形容当下,往往还会接一句「一个最坏的时代」,这同样适用于移动互联网的「下半场」,旧王老去,新王将立的背后,是技术、商业与政治的多重博弈,2017 年就这样在一种惶恐中开始了。


  1. 当然,你可以不会轻易相信这些所谓的第三方数据  ↩

033:Nicholas Carr 的三本书以及他眼中的「浅薄时代」

中文世界里关于 Nicholas Carr 的所有介绍都指向了一本书《浅薄——互联网如何毒化了我们的大脑》(The Shallows: What the Internet Is Doing to Our Brains)。这本书的中译本出版于 2010 年 12 月,彼时,中文互联网市场还处在 BAT 垄断的前期,门户网站话语权惊人,四大门户(新浪、网易、搜狐、腾讯)争相押注微型博客,微型博客 140 个字符(中文语境是汉字)的限制,让当时的主流网络阅读、写作都呈现出碎片化的态势,而在 Nicholas Carr 眼里,这一切不过是互联网公司或者说互联网技术又一次对于人类大脑的改造,他在书中写道:

对互联网的使用涉及许多似是而非的悖论。其中,必将对我们的思维方式产生长远影响的一个最大的悖论是:互联网吸引我们的注意力,只是为了分散我们的注意力。

e2155570914390672345df2aa95543b2.jpg

事实上,Nicholas Carr 这本书主要批判对象是 Google 这样的搜索公司,Nicholas Carr 认为,当人们越来越依靠 Google 的搜索引擎获取知识的时候,我们的阅读、理解能力毫无疑问是下降的:

对于我们的大脑,工作记忆相当于便笺本,长期记忆相当于文件柜。长期记忆的内容基本在意识之外——但它一直存在着,且不只是事实,还有复杂的概念,“图式”,即知识模式。在思考过程中,为了使用积累的知识和以前的事情,大脑需将相关内容从文件柜中调取至便笺本。反过来,把信息从便笺本转存至文件柜,进而形成概念性的图式,这个过程决定了我们的智力深度。

….

超文本中增加的对作出决定和视觉处理的需求削弱了阅读功效”,在跟“传统的线性呈现方式”相比较的时候尤其显著……“超文本的很多特征导致认知负荷加重,从而对工作记忆提出了超出读者能力的容量要求。

这本书秉承了麦克卢汉的媒介理论,并通过更多的案例佐证互联网媒介所带来的危害。不过很遗憾,Nicholas Carr 的这些告诫并未对网民产生多大的影响,中美互联网用户还是大踏步地步入了社交媒体时代。

而到了 2014 年,Nicholas Carr 出版了另一本书The Glass Cage:Automation and Us (中文版:《玻璃笼子——自动化和我们》),在这本书里,Nicholas Carr 试图证明一件事情:人类对于自动化的不懈追求可能走向一个危险境地,特别是为了节约成本的效率提升的最后结果就是人类成为整个人类社会的最大成本…..他继续批判 Google 等硅谷公司对于所谓「软件吃掉世界」的热衷:

软件可以帮助人们摆脱生活的「摩擦」。但是,如果进一步思考这个问题,你就会意识到,永不迷路是一种错位的生活状态。如果永远也不必担心身在何处,那么你也永远不需要知道你现在的位置。我们生活在一种依赖的状态下,生活在手机和应用程序的牢笼里。
…..
计算机就像亚里斯多德所说的「工具中的工具」,它降低了手的参与感,限制了任务的物质性,使得建筑的感知域变得狭窄。

768b6ab5c65ba4e023f9906e72e18728.jpg

在那个「遥远」的 2014 年,Nicholas Carr 的上述看法已经成为当时经济学家们热议的话题,比如在 2013年 9月,两位牛津学者——Carl Benedikt Frey和Michael Osborne——发布了一篇研究报告,该报告预测在未来20年内,美国将有约50%的工作岗位因机器人而消失。他们观察了700种职业,发现最易受自动化影响的职业包括信贷员、前台接待、律师助理、店员、出租车司机和保安。就算是靠写算法为生的计算机程序员也没有幸免。根据Frey和Osborne的计算,在今后的二十几年内,50%的编程工作也会外包给机器人。

自动化浪潮所带来的最直接冲击就是工作机会的丢失,在 12月 20 日,美国白宫发布的《人工智能、自动化与经济》(Artificial Intelligence, Automation, and the Economy)报告里指出,47%的美国职位在这一时期有被人工智能技术和计算机化取代的风险。同时,该报告还指出一个事实:时薪越高的人类职业,被取代的可能性越——相比每小时工资在40美元以上只有4%和20美元到40美元之间只有31%工作受到影响,每小时工资低于20美元却高达 83%工作将受到自动化的压力,如下图:

而 Carr 更是将法律工作的自动化列为其重要论据:

计算机能在几秒内解析数千页的数字文件。借助基于语言分析算法的电子调查软件,计算机不仅能识别相关的词汇和短语,还能理解事件链、人际关系,甚至是情感和动机。一台电脑就能取代十几个高薪专家。

但自动化带来的影响远不止如此,由新技术引发的新一轮不平等正在加剧整个社会的分化——这不分中美也没有任何意识形态的差异,技术成为一股强大的内力推动着整个人类社会步入一个波兹曼所言的「技术垄断」的世界,在这个世界里:

学会新技术的人成为精英,没有学会技术的人赋予这些精英权威和声望。

MIT经济学家 、自动化的拥趸Eric Brynjolfsson 和 Andrew McAfee 指出一个可怕的事实:最富裕的15名美国人中,6个人拥有数字技术公司,这些公司中最有历史的微软也不过诞生于1975年。另外6个人则是某个家族的成员,拥有庞大零售帝国沃尔玛的 Waltons家族,其臭名昭著的低薪意味着人比仓储机器人更为廉价和易耗。即便如此,沃尔玛也得益于自动化的销售管理系统 point-of-sale system,这使业主们能准确知道何时何地销售什么,这样一来就能避免滞销品库存,从而在库存方面比竞争对手占用更少的钱。

有趣的是,Carr 这本书出版后没多久,特斯拉创始人Elon Musk 与比尔·盖茨、霍金等人发表了警惕人工智能为害的公开信…..而从这个时间点,也就是 2014 年年末开始,围绕自动化、人工智能背后的伦理争议和讨论逐步被主流媒体所接受。

换个角度去看,Carr 的呼吁也是对 2014 年之前人工智能技术突破的一种自然反应。比如 2012年,多伦多大学的一个研究团队通过深度学习算法在 imagenet 竞赛中获得完胜,震惊业界;到了 2013 年,扎克伯格参加了一年一度的神经信息处理系统大会,并宣布成立 FB 人工智能实验室,邀请纽约大学教授 Yan lecun 执掌整个实验室;到了 2014 年,IBM 进一步推动 Watson 的商业化进展,要让人工智能走入各个行业。

2014 年以后的故事或许早已被大家熟知了。但 Carr 提出的那个问题却被淹没了,原因就在于,当人工智能成为一种大众术语之后,这个词汇的寓意开始被无限地延展,随之而来的,则是各种误解、误读,尤其是在大众文化的塑造之下,所谓「人工智能」要不被人理解为类似终结者那样的怪兽,要不则是所谓大白那样的贴心管家,抑或是像电影《Her》里的电脑 OS,英国风险投资人 David Kelnar 前不久写了篇文章,用一种通俗易懂的语言解释这一切,比如下面这幅图很好展示了人工智能、机器学习、深度学习之间的关系[1]

面对人工智能快速发展所带来的潜在危害,Carr 在书中提出了一个他的解决方案:

“以人为中心的自动化,”人占据优先位置。系统在设计上把人类操作者放在一个工程师所谓的“决策环”—即行动、反馈及判断的持续过程上。这会让工人时刻留意、参与和促进了此类可强化技能的挑战性任务。

在这种模式下,软件扮演的是一个必不可少但却是次要的角色。这次它接管的是人类操作者早已掌握的常规职能,当非预期情况发生时发出告警,提供实时信息来拓展操作者视野,并抵制往往歪曲人类思维的偏差。这时候技术变成了专家的合作伙伴而不是取代专家。

然而 Carr 的上述提议更像是对过去 60 年来围绕人工智能与人类关系争议的重复,一如刚刚退休的《纽约时报》资深记者马尔科夫在《与机器人共舞》里所说:

人工智能定义的世界与恩格尔巴特的“智能增强”理论之间的鸿沟已经非常明显。事实上,20世纪60年代恩格尔巴特造访麻省理工学院来展示自己的项目时,马文·明斯基就抱怨说,那是在浪费研究经费,这些钱充其量只能造出一些华而不实的文字处理器而已。
……
在已经过去的50年中,麦卡锡和恩格尔巴特的理论仍然各自为政,他们最为核心的冲突仍然悬而未决。一种方法要用日益强大的计算机硬件和软件组合取代人类;另一种方法则要使用相同的工具,在脑力、经济、社会等方面拓展人类的能力。尽管鲜有人注意这些方法之间的鸿沟,这场新技术浪潮的爆炸(一个正在影响现代生活方方面面的技术浪潮)将极力压缩这种分化,并防止反弹的发生。

Carr 最新的一本书叫 Utopia Is Creepy ,And Other Provocations 中文版还没有出版,严格意义上说,这并非一本新书,而是早前一系列文章的合集,事件跨度从 2005 到 2015。所不同的是,这些过去的文章在现有语境下依然有可读的价值,正如 《洛杉矶图书评论》 在一篇书评里所言:

If, as people say, one internet year corresponds to seven calendar years, then the earliest selections in this collection go back to the digital equivalent of the Truman presidency. It’s hard to work up any interest in Carr’s thoughts about Steve Jobs’s presentation of the first iPhone or the controversies over the commercialization of Second Life.

29317223ebff235fa4fa96141de1ff83.jpg

从 2005 到 2015 的十年也是技术,或者说互联网氏的新乌托邦主义盛行的十年。十年间,我们送走了曾顶礼膜拜的乔帮主(乔布斯),又满心期盼新的帮主出现——或是贝帮主(贝佐斯)、马帮主(马斯克)抑或是扎克帮主(扎克伯格)…..当这个世界的唯一「希望」就是硅谷时,似乎一切都可以通过互联网的方式解决。

某个层面,Carr 与中国互联网的「老朋友」凯文凯利是严重对立的,从 Web 2.0 的参与精神到博客(自媒体)带来的权利虚无:

Kelly described them as part of “a vast and growing gift economy, a visible underground of valuable creations” that turns consumers into producers. Carr, himself a blogger, pointed to the limits of the blogosphere: “its superficiality, its emphasis on opinion over reporting, its echolalia, its tendency to reinforce rather than challenge ideological polarization and extremism.” In short, “Web 2.0, like Web 1.0, is amoral. It’s a set of technologies — a machine, not a Machine — that alters the forms and economics of production and consumption.”

与此相对应的,则是 Carr 和凯利在中国互联网界的待遇,前者不过是某些媒介研究者谈论的对象,而后者则早已成为一代网红——尽管如今凯利的境况并不好,但其倡导的万能理论还是鼓励了一大批年轻人走上忽悠创业的道路,他们或是追随扎克伯格、或是成为中国的扎克伯格,比如今日头条的张一鸣,比如滴滴的程维。

这是属于扎克伯格们的黄金时代,他们用新时代的魔法——算法描绘了一个未来——这也是 Carr 笔下的「Creepy Future」,你的所看、所听、所思、所想在自动化、人工智能等口号中被一次次塑造、一次次改变,并最终成为你眼中的真实世界。

2016 年 9 月的时候,Snapchat 做出一个被外界看起来很古怪的举动——发布一款佩戴相机的智能眼镜,用户可以通过这个眼镜拍摄 15 秒的视频,并可以添加滤镜效果然后分享给 Snapchat 上的好友们。在外界一片质疑声中,很少有人注意到一个事实:SnapChat 走上了 FB 们的道路,所不同的是,Snapchat 要用影像塑造一个新世界[2]

站在 2017 年年初的时间点上眺望,一个被算法左右的增强现实世界正在走来,你所能做的,可能就只有好好守护自己的眼睛了。


  1. 我也曾在第 11 期会员通讯里做过详细分析。  ↩
  2. 关于这方面的详细分析,可参见第 16 期会员通讯《滤镜+照片,Snapchat 们如何构造一个「增强现实」的世界?》  ↩