最近沉浸于了解和研究人工智能的早期发展,那是属于科学家和思想家的田园时代。
在微软和 Google 在新世纪进入 AI 的军备竞赛之前,人工智能还是处于学术圈颇有争议的领域,但最光辉和最有洞见的思想,在上个世纪其实都已经提出。
世界上最早的神经网络计算机,在 1950 年代就出现了,而 ChatGPT 这样的物种,在那个年代还是科幻小说一般的存在。研究当下的同时,不妨也关注下往昔,看早年间人工智能的路径,也许会有更完整、准确的理解,毕竟关于人工智能会不会替代人,是每隔一段时间就会在媒体渲染中被提出的话题。
这次想分享一位早期,甚至可以说人工智能史前人物,克劳德·香农(Claude Elwood Shannon)的一些生平和他的经验分享。
香农的简单介绍
香农的名气和他的贡献并不匹配。虽说通讯行业的朋友会知道自己的祖师爷,但大多数朋友往往知道图灵、冯诺伊曼是计算机之父,却不熟悉信息论之父。实际上比特、字节这些概念,我们生活中的无数编码(从 5G、计算机和手机的存储,到视频和音频的格式、二维码)都是建立在香农理论基础上的大厦。这个基础的地基,大半个世纪以来从未撼动,更惊叹的是,这一切几乎都是逻辑推演,并不是实验室里的偶遇结果。
香农提出的信息熵理论,定义了信息量,同时也用量化的方式对所有人类能掌握的信息进行了重制,以让它们能够成为可传输、可编码、可处理的对象。他还提出了香农公式,证明了信道宽度(也就是常说的带宽)与信息流速和噪声的关系,进一步说明了我们在信息传输上可追求的极限(香农极限),如今的 5G 就是最逼近香农极限的一种编码,而就像光速一样,这个极限是不可突破的。
香农是个特别聪明的人,这些理论是他在二战时期为贝尔实验室做密码相关工作时「顺手」创建的,而且在资料完备三年后才发布,别人问为什么不赶快发出来,他就回答了一个字:懒。
香农在学术上并没有在另一件事情上勤奋:发明。他童年的偶像是他的远房表亲爱迪生。在壮年之后,他突然激流勇退,成为了隐居的状态,很多人以为香农跟图灵一样英年早逝了。
但实际上他依然特别勤奋,专注在做杂耍玩具和各类有意思的玩意儿的研究上,比如发明了各式各样的独轮车、吹奏时候能喷火的小号等等。
他跟 MIT 的另一位教授还发明了一个微型电子设备,可以在赌场里的赌球机旁边出老千,听到球大概掉落的位置(为此甚至还花巨资买了一台机器摆在家里),后来由于担心被黑手党揍没有实践。这台做着玩的设备,被称为人类历史上第一台可穿戴计算机设备。
香农在圈外的知名度比同级别的科学家要低,可能与他长期以来的低调有很大关系。他自己长期乐于关注很多新鲜事物,对各类有意思的事情充满兴趣并着手研究。信息论和杂耍,碰巧都是他个人兴趣所在,在他眼里,没有高下之分。
香农提出的 6 个策略
在贝尔实验室工作的时候,香农做过一次分享,这是少有的公开演讲,他在其中提到了 6 个解决数学和设计问题的策略。这浓缩了他长期的思考,也是信息论创建的底层策略。让我们跟数学家学习下怎么思考。
第一,简化。
「几乎你所遇到的每道难题都混淆着各种无关数据,你可以抛开它们,将难题简化为主要问题,由此你才会更明白你到底在试图解决什么。」
先拆解问题,是首先要做的。很多时候我们对问题的认知都并不清楚。例如,当我们面对大量充满噪声的互联网和社交圈的信息时,我们产生的焦虑情绪背后究竟是什么?是担心错过而失去赚钱的机会,还是看到很多朋友都在关注而潜意识里在模仿?
又比如,我们做一个产品功能时,有没有想清楚到底为什么要做?这些让我们做的信息,无论是外部的,还是内生的,它们都意味着什么?
香农做的最出色的一个简化,就是把世界上所有的信息传递过程,都用完全一致的信息理论给囊括了。他看出了 DNA 在传递蛋白质信息,和美军在传递诺曼底登陆的计划,背后的一致性。当简化到更底层的逻辑,问题就不同了。
似乎跟马斯克的第一性原理有异曲同工之妙?
第二,类比。
「利用类似问题的现成答案去套自己的问题,进而推断出它们的答案具有共同点。」
我们要看在做的事情,有没有经验可谈。香农认为,如果真的是一个专家,脑海里应该已经存在大量的问题和答案了。这些经验可以快速捕捉,并且复用到当下的研究课题中。
香农提出信息论,大概率是由于他对计算机(硕士论文是自动机相关的话题)、密码和情报学(工作内容)、生物学(博士论文是有关遗传的话题)等课题都相当熟悉,从中对比和抽象的。
就像在互联网行业,大家逐渐发现,美团、滴滴这样的公司是一类,过去的百度、腾讯的公司的产品又是一类。它们背后有着不同的逻辑。同一类的产品中,可类比的问题和答案就足够多了。像张一鸣在上个时代的创业中积累的旅游和房产内容平台的经验,在新的时代也发挥了重要的作用。
那么接下来的 AI 的机会,应该跟 iPhone 类比,还是跟互联网类比、工业革命类比,还是跟更小的改变类比,就是值得思考的问题。
第三,重新提问。
「改变用词,改变观点……从影响你看问题的方式带来的思维障碍中解脱出来。」
如果前两种方式还不能奏效,可以试着重新提问。这时候抛弃「经验」、抛弃思维定式显得就更重要一些。这也是为什么很多科学问题都是被「新人」解决的,而不是有思维定式的老人。科学界和商业界都有很多这样的案例。
人工智能的发展历史也是如此,明斯基是创始人之一、早期的领袖,他引领的符号派一度是只手遮天的门派,一直在打压神经网络派,甚至试图证明理论上后者都是错的;而神经网络的领袖人物杰夫·辛顿,处于边缘的研究领域,肉体都被排挤到了加拿大多伦多,但他开创了深度学习时代;到后来,杰夫·辛顿反而站在了强化学习的对立面,不支持最新的这些领域。
同样的,创新者的窘境也反复在说明、互联网企业的时代更迭也反复在验证这一点。拼多多长期以来,都不太主动接受阿里系的电商产品经理,因为后者会带有做淘系产品的惯性思维,这在拼多多的逻辑里是不奏效的,反而不如培养新人更能有创造力。
第四,结构化分析。这里说的结构化,就是大问题拆成小问题。
「数学中的许多证明实际上是通过非常迂回的过程实现的。在证明定理的时候,证明者发现自己在路线图中游走。他从头开始证明出了许多结果,而这些结果似乎并不能指向某种结论,但最终他会发现给定的难题被证明出来了。」
这个方法我个人的理解就是,当我们对大的问题,诸如一个产品的基本用户需求是什么、一个播客的根本定位是什么,还没有结论时,应该做的是,先解决相关的小的问题。比如产品的使用体验还有哪些问题、播客的下一期内容怎么能够更好些...... 拆解下来的小问题陆续解决后,最终的意义可能就自行浮现了。
很多事情,事后总结大概率是对的,但事前我们很难开天眼能看到结构化的全貌,那就不妨先脚踏实地,把手头能掌握的问题都解决掉再说。
第五,反向推导。
「倘若你的前提不能佐证你的结论,你就不妨先认定结论为真,看看会发生什么,并反过来推导那些前提。」
这就是所谓「因为相信,所以看见」的力量。我们先有一个目标,或者先承认一个结论,再倒着看看,有哪些路径和前提。这些路径和前提也许就更加清晰,结合结构化的拆解,也许会比正向的方法更加有效。
这在做很多人生选择时很有用。比如,你在做一个产品,设想一下「10 年后它应该是什么样子?」,比如你在选择一个职业方向,可以设想一下「我如果做了这个选择,5 年后会变成什么人?」。然后倒退,也许该做什么就有答案了。
第六,复用。
「你一旦找到了解决方法,就花点儿时间看看它的适用范围:通常适用于一小部分情况的数学规则,也能应用到绝大多数的情况中。」
这一点就相对好理解了。当你发现做某个具体的功能有了一定经验后,可以考虑一下,它是不是也是做别的功能的原则?当你写过一篇很好的公众号文章后,可以考虑下,是否底层有某些规则,也是能复用在播客或者视频领域的?
香农还总结说,这六种策略未必是所有人都意识到的,或者像按照指导手册一样去执行的。但我们反观优秀的研究人员和设计人员,他们实际上都在有意无意践行着这些策略。
这些策略本身的总结,也是香农这些策略的践行。
回顾一下:
- 简化
- 类比
- 重新提问
- 结构化分析
- 反向推导
- 复用
伟大的见解不来自于好奇心,而是建设性的不满
香农在同个演讲中还提到了一个很有意思的观察,即:
「伟大见解的产生并不仅源于好奇心,而且有对现状的不满。这种不满不是令人倍感压抑的不满,而是一种 建设性的不满,也就是说,因为感觉事情不对劲儿而产生的些许恼怒。」
我自己身边就有类似的案例。中文播客的头部,文化有限的创始人杨大壹,就曾经说过,他做这档读书播客,就单纯是对「没有这样的播客」以及「类似的播客都不满意」背后的不满。这种不满是建设性的,于是他自己起炉灶、自己做播客,做成了如今这样。身边很多优秀的产品经理也是如此,他们带着一种不满和愤怒,并非是针对某个人的,而是针对「这些事情不该是这样」的不满。它们会制造更多、更大、更远的成就。
最后,有兴趣的朋友,推荐三个作品:
传记书籍《香农传》吉米·索尼 罗伯·古德曼
传记纪录片《香农传》Mark Levinson
播客·半拿铁「人工智能风云录系列」(这是我自己的播客)
来源:刘言飞语