《临界:智能的设计原则》于 9 月 30日上市,欢迎大家购买!本文是《临界:智能的设计原则》这本新书的目录和内容提要,欢迎大家将本书推荐给其他对相关问题有兴趣的朋友。
购买链接:http://zhuanlan.zhihu.com/DesignPrinciple/20233232?from=groupmessage&isappinstalled=0
序·赵思家
“物理真美啊。”
“那当然,它可是我们科学里的女王。”
------
对我来说,科学就是找规律。
在极繁的世界里,找到它的极简『设计原则』。
然而,一直以脑洞大开作为人生使命的我,也从来没有想过,『证明我妈是我妈』的这种官僚主义问题居然能够用物理模型来描述。
现在好像大家都在说模型:股票模型目的是能够预测近期股票的走势;天文学家可以通过计算机的模拟,推算出过去的夜空,得知千年以前的某一天当时月亮和星星的位置;而神经科学做的模型,旨在模拟人的大脑,让它能够像有生命似的一样看、听、学习、思考、交流…
但话又说回来,到底什么是模型?说实话,我也不知道是不是有一个精准的定义。模型(model)这个词使用的相当广泛,站在T台上就是模特(model),放在存库里就是型号(model),所以当我们说到理论模型和模拟模型,只有依赖列举各种各样的『模型』来理解对『模型』的概念。
傅渥成前辈的这本新书,提供了各种各样有趣的『模型』,让你从新的角度来看日常生活中大大小小的细节。
从西藏坛城沙画到黄石公园的森林大火,再到恐怖组织的活动;从鸟群的行为到大脑的行为,从黑客精神到互联网产品的黏性,从我们每天用的语言到金融市场;真令人感叹,物理学家们简直像是在脑门儿上装了探测仪一样,到处寻找隐藏的关联,简直就是团战『连连看』嘛!
有时候看到一个东西,感叹,“哎呀,看起来像是活的一样”。那到底是什么让它像是一个活的呢?生命有什么特殊的特征,让人看着觉得『有生命』?
我是学认知神经科学的,就拿我昨天才看到的一篇神经科学的论文举个栗子吧。当我们准备做一个动作(譬如,按按钮)时,相应的肌肉会受到神经信号:『激活!(动起来!)』,照理来说,它就应该立马接受命令然后该怎么动就怎么动。骚年,记住要透过现象看本质。长久以来神经科学家观察到,在准备动作之时,肌肉里的相关运动神经会先被抑制(inhibited)。为什么不直接听话地做该做的,而是要先抑制呢?这是不是多此一举了呢?这篇论文给出来的解释是:想象我们在一个闹哄哄的教室里,一个学生被老师点名起来回答问题,在这个学生开始说话之前,老师会要求所有学生,包括这位马上要回答问题的学生,安静下来,当教室安静时,这位学生才开始发言,大家就都能听到了。一样的道理,肌肉们就像是一个个叽叽喳喳的学生,被选上要去做动作的肌肉就是那个被点名的学生,为了确保它的『声音』嘹亮且清晰,就要让旁边嘈杂的同类安静下来;同时也会减少『学生误以为被点,随便起来回答问题』的乌龙情况:不会老师看你一眼,你就腾地一声起来回答问题。
这听起来好像还是有些多此一举,并不怎么复杂,但要是真要设计一个机器人手臂,让它做各种人类的动作(如,端茶杯、写字、切菜、弹竖琴)都和我们人类的一样『自然』、『灵活』,却一点都不是一件容易的事儿。要么太多错误了会使得动作不流畅,磕磕碰碰,要么完全没有错又是太机械不自然。可能就是忽视了这样一些看似多此一举、实则画龙点睛必不可少的简单的小机制们。
和“俯卧撑”前辈搭上话,是半年多前无意间看到他的一篇专栏《鸟群的统计物理:模型与模拟》。当时我刚刚开始读神经科学博士,开始用模型模拟人脑是如何学习语言和音乐的。当时看到前辈这篇浅而易懂,干货满满的专栏,心中那种激动,如同在一个语言不通的地方,遇到一个会说成都话的老外...
昨天晚饭时收到前辈的邮件,说他的新书里有一大章节是关于大脑的,我老激动地把这本书当成睡前读物读完了。手上拿的这本书的第二部分关于『大脑的临界性』,在我看来,是针对生物群体系统模型讨论的『升华』。我这么说不仅仅是因为我是学神经科学的,有先入为主的偏好,更重要的是,模拟动物的群体行为,虽然本身就非常有趣,但模型的精彩之处正是在于,它能够把『个体』从不同的层面、规模、角度,突破常规的想法来定义。一只大雁是一群大雁的单位,它们的集群行为是飞行中不同的队列,而一个小小的神经细胞就是大脑的单位,它们的集群行为 ,引用这本书里的话『… 人类并不是被训练成智能解决某些简单问题的机器,而是能够用同样的一个机器(我们的大脑)尝试去解决各种不同的问题,…』。很多人问过我,神经科学和人工智能最大的不同在哪里?这,就是两者的本质区别 —— 我们设计一个物体、工具,一定是针对“已知”的目的去设计、优化的;而大脑却是个『万能工具』,为了解决看见世界后的每一瞬会出现的新“未知”任务。
单靠我们人类现在制作工具的 『设计原理』,是走不近真正的智能的。那如何能够用现有的工具往智能前进呢?现在看来,很可行的方向就是去发现生命本身的设计原理。在现在这一刻我们可能还不知道这个原理为什么这么设计,甚至不知道是不是发现了真正的『原理』。但找规律,然后模仿,是『学习』的第一步。
每次看到前辈的专栏和微信公众号名字——『生命的设计原则』——我都心里感叹这名字取得太好了。生命的美丽,在于无论多小多简,都如『专业设计』一般得精妙无比,却又像是强迫症似的不允许出现任何一件复制品。
无论你来自任何一个专业领域,只要你的兜里还对这个极繁的世界有着好奇心,都应该了解什么是模型(model),至少该试一试。那么,这一本书一定是个非常好的开始。
赵思家
2015年8月10日 于雨蒙蒙的国王十字火车站,伦敦
自序 迷宫的十字路口
第一章 集体智慧和模仿游戏
从沙堆到生命
(一)沙堆的比喻
(二)自组织临界和自相似结构
(三)「临界」和「幂律」
在许多「智能」的系统中,「临界点」可以自发地吸引着那些不处在临界态的系统朝着该点运动,并且一直让系统保持在这样的临界点附近。当系统处在临界态时,常常会出现许多自相似结构,而包含了自指、递归和自相似结构的「无限循环」给人留下了深刻的视觉印象;其中有的符号已经成为了我们流行文化的一部分;这些独特的结构还会让人思考其背后显得有些诡异的逻辑悖论、或者考虑这种迭代背后的数学和物理(相变、湍流等等);更重要的,这些结构还可能暗示了「自指」与「意识」之间的某些联系。
森林大火、恐怖主义和反脆弱
(一)森林大火
(二)恐怖主义的模型
(三)炸裂的临界:爆炸渗流
森林火灾模型也是沙堆模型的一个变体,从森林火灾的规模和概率之间的幂律关系来看,它也是处在「临界」态上的。 在森林大火问题的讨论中,我们已经知道「先放一把火」可能会是降低大规模森林火灾出现概率的重要方法。 在日常生活中,黑天鹅事件常常都在各种各样的网络上发生。网络上的各种事件与森林大火模型相比有更复杂的拓扑结构:森林大火只会从一个位置烧到与之相邻的少数几个位置,而在各种各样的复杂网络的局部一旦出现各种崩溃性的事件,则由网络拓扑结构的不同,可能会造成或大或小的影响。在「看得见的手」的种种调控因素的作用下,我们连「先放一把火」的类似局部调整都很少见到,这种控制策略是理性的吗?
临界的鸟群:集体行为中的临界现象
(一)自驱动粒子群的模拟:Vicsek模型及其它
(二)集体行为中的临界现象
「临界」的特征对生物群体来说有着重要的意义,在草原上迁徙的羊群,天空中飞翔的鸟群,河流中洄游的鱼群都常常会遇到相似的问题,因为捕食者可能会从各个方向靠近来捕猎群体中的某些个体。 生物群体能对外界环境的刺激做出快速的集体反应,这暗示着群体被组织在了某种「团结紧张,严肃活泼」的「临界态 (critical state)」上。
模仿游戏:信息论、进化和集体智慧的起源
(一)模仿游戏
(二)从「模仿游戏」到「机器学习J
(三)对称破缺和 Goldstone 模式
(四)动物的社交网络和集体智能
如果博弈有多人参与,我们并不能期待周围存在一个稳定的环境,而且每个玩家的目标并不相同,当不同的玩家抱持着不同的目标时,互相影响、互相博弈,系统究竟会往什么方向演化呢?对于集体而言,「集体智慧」应该怎样定义呢?是否可能存在一个最优化的状态,从而可以让整个群体变得「最智能」呢?
第二章 临界的大脑
我们真的需要一个临界的大脑吗?
(一)分支过程图灵的错误
(二)适应性:输入驱动的临界
(三)长程关联和临界的大脑
(四)模块化、层级化和临界性
(五)物理问题、生物问题或是算法问题?
大脑对于复杂环境的适应性是大脑结构的「临界性」的最佳例证。我们的大脑也像鸟群、沙堆,是一直处在临界状态上的。这种「临界性」同样反映了某种稳定性和可塑性的平衡,正是通过这种平衡,我们的大脑才实现了这种适应性。 人类并不是被训练成只能解决某些简单问题的机器,而是能够用同样的一个机器(我们的大脑)尝试去解决各种不同的问题,并且可以通过训练,像机器一样,在某些特殊的方面表现出优秀的能力。 不过下一个问题马上也就又来了,这种临界是怎样形成的?如果大脑需要精确地根据外界的输入调节其分支率才能实现「临界」——正如我们必须非常小心地选择恰当的温度才能让相变停留在转变态附近那样——那么这种临界是怎么维持的?或者,大脑有某种神奇的方法可以比较容易地就达到临界?
意识和机器学习
(一)意识和智能:从「信息整合」到「整合信息」
(二)深度学习:设计临界的大脑?
A. 无监督学习和临界的大脑
B. 监督学习和蛋白质折叠
如果找到了某些特定结构形成的方法,这些方法对于我们理解生物过程以及各种心理学实验是否又可以有些帮助呢?对大脑中结构和连接形成物理机制的研究是否有可能应用于当前迅猛发展的机器学习领域呢? 根据整合信息理论,我们可以把所有的事物都看成是有意识的(或者有智能的),只是「意识」的程度不同,而整合信息 Φ 就是对「意识」的水平的度量。 「整合信息」与「特征提取」二者其实异曲同工,而临界的大脑可能为最强的「整合信息」提供了结构基础。 我们很可能忍不住会思考下面的两个问题:其一,临界的大脑是怎样处理类似无监督学习的问题的;其二,对于那些有监督学习问题,应该怎样设计类似的「半智能」系统——或者,是否存在着其它的一些与机器学习的问题高度相关的优化机制。
第三章 黑客和物理学家
黑客和物理学家
(一)先「建构」、后「理解」
(二)从「本质」到「普适类」
(三)寻求更多的可能性
在我看来,理论物理学家才是更具有黑客精神的人。因为物理学家还常常更进一步——著名的物理学家费曼(Richard Feynman)曾经说过一句著名的话 “What I cannot create, I do not understand1”,费曼的这句话并不意味着实验物理学家必须工作在理论物理学家之前,的意思其实是「如果我们无法从一些(我们已经理解或者假定的)基本事实出发建构一套(用以解决某些问题的)理论,那么我们就无法理解这些问题。」如果这种「建构」是「出于兴趣,解决某个难题」,这种思路其实是极符合黑客精神的。
幂律与互联网产品的「黏性」
(一)将「幂律」设计为 KPI 考核指标
(二)产品的竞争力:层次种群和分层网络
(三)「探索者」与「保守者」
(四)大数据时代的黑客物理学家
我们回到「知乎」,将它作为一个躺枪的实例,来分析「幂律」和一些互联网产品黏性有关的问题。 假如有两个非常类似的网络社区采用了不同的反馈机制,那么这两个社区的用户成长就会完全不同,即使它们有相似的用户总量,但用户的活跃程度以及对社区的黏性也是非常不同的。说到这里,读者马上会想到:刻画「优先连接」幂律的指数可能可以作为一种 KPI (绩效考核指标)。 如果关注于推广和社区的黏性,我们需要的是用户数,而社区的维护不但需要 UV 和 PV,还需要有健康的讨论空间。随着新用户的涌入,在短期内,社区的黏性自然还是存在的,幂律可能也依然很稳定,社区还可以持续成长甚至更快地成长,但对于一个问答社区而言,这却不一定总是一件好事,因为这样的社区依然是热闹的,但对追求高质量的问答社区来说,这却可能造成「生态环境」的破坏,造成高质量用户的流失,对社区的运营而言是很不利的。类似的问题应该怎样建立模型进行简单的分析?
第四章 寻找隐藏的关联
超越幂律
(一)自然语言处理和自关联函数
(二)阵发:重新思考技术面分析
(三)高阶关联和股票的杠杆效应
(四)混沌、噪声和非线性数据的降维
(五)抓住突变前的警戒信号
Zipf 定律或许是最为著名的一个「幂律」。这一定律与人类的语言有关,在各种不同人类语言中,如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的「频率」与它的「排名」也满足幂律的关系。 如果一个语言中各种词不存在关联,那么这对猴子来说将是一个特大喜讯,因为它们有了简单的方法可以敲出莎士比亚,只要保证猴子们敲击按键时按照「莎士比亚式」的词语出现频率随机出现各种单词,那么猴子甚至还有希望创作出新的莎翁作品,可这显然是不太可能的。这些例子都告诉我们,如果要超越幂律,我们需要考虑的「组合」和「顺序」的问题。本节中将介绍许多分析这种「组合」和「顺序」的方法,这些分析中我们可以看到一些有意思的方法,这些方法试图寻求的就是一个时间序列自身内部的关联。
临界性:批评和自我批评
(一)自我批评:物理约束和设计原则
(二)总结:「临界」的几个特征
国外的畅销书常常整本书反复强调一个事实,并为这个事实不断添砖加瓦、添油加醋,最终整本书显得极具说服力。不过当我自己合上这些书的时候,我总会想,似乎情况并不完全如此——例如:一万小时的训练常常可能不能让一个人变成天才,因为他还可能会进行低水平的重复、或者反复挑战远高于自身能力的一些技巧、又或者缺乏正确的训练方法等。考虑到这一点,我想,我的这本电子书应当与此恰恰相反,在介绍完各种有趣的临界现象之后,我想来泼几盆冷水。
后记