前言
网易云真是个有趣的地方——白天忙碌挥霍脑力的人们,晚上会在音乐里释放自己的情感。云音乐的评论在我看来都是真情流淌。今天哥村下了冬季的第一场雪,算起来因为去加州,我已经三年没过冬了。于是有感而发,一边听歌一边进行评论,竟然一个下午也有十来首评论。不如记录下来吧,我想,让每一首喜欢的歌曲留下我的想法和印记——说不定日后回首,别有一番趣味。
(一)
前言
网易云真是个有趣的地方——白天忙碌挥霍脑力的人们,晚上会在音乐里释放自己的情感。云音乐的评论在我看来都是真情流淌。今天哥村下了冬季的第一场雪,算起来因为去加州,我已经三年没过冬了。于是有感而发,一边听歌一边进行评论,竟然一个下午也有十来首评论。不如记录下来吧,我想,让每一首喜欢的歌曲留下我的想法和印记——说不定日后回首,别有一番趣味。
(一)
前言
上个月加入了一个老同学建立的书友会。书友会的宗旨是多读书,读好书,互相交流感想。每个书友一个月至少读一本书,写一个读书感想,而其他书友既可以根据读书感想判断一本书是否值得阅读,又能从中吸收一本书的精华。
读书本是增长才干、训练思维、休闲娱乐的私人行为。读书感想这种硬性规定,我个人确实不太赞同——想到写作成为一种任务,颇有点打消积极性。不过第一个月就因此被踢出,也确实太没面子。于是我偷工减料,在一个夜深人静的夜晚写下了下面的文字……
正文
上一篇文章:
从零开始学钢琴演奏之——《eyes on me》
缩短神经元间需要传递的距离,减少突触的激发,以更短时间、更有效率的方式完成——
就像键盘打字,或者格斗游戏对战一样,我们思考的只是更高层次的”想要干什么“,而不是低层次的”该按哪个键“。这中间的过程我们形成了一个严格的映射,大脑神经元建立了一个牢固的神经网络,在潜意识神经模块里面利用模式化高速计算帮我们完成了,不再需要显意识的逻辑运算的参与了(“潜意识模块”相当于deep neural network里面的raw data到high-level feature的前几层网络)。
“思维宫殿”是神经网络里面的世界模型(world model),我们利用它可以不依赖钢琴和外界信息,进行自学习。
视觉化是指,把钢琴键盘看成是竖着的,或者把五线谱看成是横着的,让两者重合对应。
看琴谱,练习盲弹,完成阶段性目标的第二部分。
钢琴绝对音高,需要借助cdefgab绝对唱名法,让符号和音高对应起来,这样我们才能知道自己有没有绝对音准。假如我们听出一个音的音高,却不知道如何表示,那么也是徒劳。如果我们有符号对应了,听到一个音,能够知道对应的符号,也就能自己表达并唱出这个符号——这才能判断我们认音准确与否。唱名法让我们建立一个database, 建立之后我们才能在query的时候判断自己的retrieval是否准确。
不看键盘进行按键,通过声音推断五线谱上的音和钢琴的琴键。通过之前得到的能力,我们应该知道我们按了哪个键,那么对应的五线谱和琴键我们应该是知道的——阶段性目标2和目标3的两种能力可以相互印证纠错,这就形成了一个自学习的封闭正反馈循环。
听钢琴曲,练习对钢琴曲进行扒谱的能力。
《the witness》的结局猜想是,整个游戏是对人工智能学习人类智能的一个终极测试。
“巧合”的是,今日读到一篇文章,恰恰是讲到人工智能如何在游戏中学习规则以便达成任务:
* 2016年2月26日 在Arxiv上发表的pre-print:《A Roadmap towards Machine Intelligence》
(1)
常有人问我,【YOLO】为什么learning rate太高时会出现“NAN”的情况,导致训练失败。这里浅要谈一下原因。
如果使用Rectified Linear Unit(ReLU)作为activation unit的话,不能使learning rate太高,否则可能让某些神经元达到死寂状态,变成0,而且不可逆转,然后就再也学不到东西了。
如果要克服这一点,可以用 leaky ReLU,或者更新的 parametric ReLU (PReLU), Randomized ReLU(RReLU)。随机性可以防止overfitting——实验证明RReLU效果最好,train出来error最小。
(2)
引申一下,其实使用regularization,也是为了防止overfitting——
不同的regularization的方法,是在update weights的时候,采用了不同的方式,来限制weights的变化。
概念实体是人们为了区分事物建立的高维实体,在脑海中建立高维的结构,来区分事物。这个高维的曲面,是weights,即概念的壁垒和原则。人们通过认知调整概念,也通过概念来获得认知。
为了更直白、直观、通俗地解释不同regularization方法,我在这里使用类比和隐喻。Regularization是对概念和高维曲面的一种“装修”的方式,通过限制作用,将高维曲面的粗糙原型变得更加柔和。其理念是,具有一般化的概念应该能识别任何具有相同性质的事物,而不是仅仅对范例(training examples)进行过度解读(over-fitting)。过度解读往往造成这种概念和高维曲面具有过多细节,形状不够柔和。通过regularization能够强迫概念是柔和的,这样在训练的过程中智能会去学习事物的本质,而不是去钻牛角尖。
以下逐个分析一些常见的regularization的方法——
L2 regularization
* 相当于做陶艺,用柔和的手,在陶瓷(weights,即概念)上制造曲面
L1 regularization
* 相当于用锋利的刀,削木头,制造工艺品(weights,即概念),有棱有角
Elastic net regularization
* 是L2和L1的结合,是细腻的工匠,削一下材料,再用磨砂打磨
Max Norm constraints
* 限制w最大值,相当于有一个模子,挤压一下,超出的部分会被挤回去
Dropout
* 随机使某些weight一定几率不改变,而改变另外的weights。
* 相当于理发师使用带有锯齿的剪刀修剪头发,一缕头发有长有短,清新自然。
直觉化、使用隐喻可以更好地认知事物,符合人类认知的特点。在与读者您分享心得的过程中,广涵也建立了与以往知识的联系。诚然,万物间是相关联的,这种联系的制造其实并不牵强。
之前的两篇文章都有过对灵魂的讨论。
结合今年开始火热的虚拟现实VR,我有了一些新想法,可以作为对原文的补充。
《胡思乱想集——其四》和《关于灵魂》里面提到,我们操控游戏中的马里奥,马里奥的灵魂就是我们自己——只不过输入是手柄,而反馈是局限的视觉信息,甚至都不是沉浸式的。
而电影《阿凡达》里面的脑电波同步,输入就是脑电波,反馈是另一个肉体的全套反馈体系包括视觉听觉和触觉。阿凡达的身体就犹如一台机器,一个VR硬件。
未来的VR,短期内只有视觉和听觉,没有触觉和知觉。操控的是计算机里的虚拟avatar而不是现实世界的肉体avatar。不过VRSE这个视觉的VR已经挺令人兴奋的了。期待虚拟现实和现实产生直接交互的那一天。
如此说来,灵魂和肉体不是不可以分家。灵魂确实必须有一个宿主和归宿,但未必必须是大脑。而且大脑未必是那个最本源。
——大脑有可能只是一个脑电波接受方!(相当于客户端)如果思维的本源从更远处过来,那么启示、潜意识和脑电波云计算也就解释得通了。
我并非一个围棋高手,但是由于专业的缘故,对深度学习和人工智能有着自己的理解——或许浅薄,但自己仍深以为然。
在这篇文章里,我想以人工智能和机器学习的视角,分享一下对此次人机大战的感受。
人类和alphago的区别是,人类能抽象出概念,而且是多个层次的——善于总结的围棋大师把基于生活经验产生的概念迁移到围棋上(AlphaGo暂时还不能进行其他领域的知识迁移,目前只是一个专家系统)。
这种基于经验进行抽象所产生的对围棋的理解,一旦获得了教科书般广泛的认同,就成为了所谓的“棋理”。它帮助人们一点一点站在前人的肩膀上。
人类的概念“优劣”,或者说与事物本质的接近程度,取决于接触的样本数目,以及自己的联想和迁移能力,后者是创造力的体现。
然而,这种难以量化的概念并未至善至美,所以革新总是可能的,就看有没有新棋手突破藩篱,打破传统。
机器训练的网络神经元间的权重广义上也算是概念(参考另一篇文章:《神经网络,概念实体》),这种所谓的“weights”也能让它站在老版本的自己的肩膀上——不过人类难以直接理解了,或者说难以interpret成人类既有的某些概念。机器的优势在于,它能在短时间内见识更多的棋谱;与人类相比,它获取新棋局的时间成本很低。
它的所谓“概念”来源,是数据导向的权重的自学习,也就是通过数据训练出来的特征。如果训练得当,我们可以认为机器学习到的概念,是基于其所见识的数据所能得到的最优化概念。
因此归根结底,我认为这场人类和AI的比拼,是数据质量(质与量)和人造概念的比拼。
人类顶尖的概念发展到头了吗,至真至善了吗?
机器对数据的学习足够了吗?见识了所有可能性了吗?
两者都没有。
人类的概念终究只是理论,只能无限逼近,而并非本质或本源。概念,不过是人类理性通过对世界本源产生的现象的解读,进行的暂时性划分——见识越多,划分越精准。人类的见识永无法穷尽存在。机器也一样,见识的数据也并非所有的可能性组合。
所以我觉得无论是人类还是机器,都有进步的空间。
如果人类发挥自己的创造性,借助机器的对弈作为辅助,可以更加接近围棋之神的境界;而人类创造出并探索到的新的可能性,也可以被机器学习,使得两者相互提高。——这是一个螺旋式上升一般的完美的正反馈。
对围棋而言,这反而是一件幸福的事啊。
很久以前,我二大对我说过,能够掌握一件乐器是很幸福的事情。成为一个专家虽然太晚了;不过作为开拓技能树、锻炼思维,弹钢琴仍然颇有益处。
这篇文章的目的,是分享给大家一个可以严格遵循的程式化方法来开始学琴。因为总有人说,你学钢琴太晚了,应该从小就开始学,你看那谁家小谁。2007年时爷爷想买一架钢琴,有人就这样打消了爷爷的积极性——琴行的人善意地对爷爷说,这玩意儿十年才能小有成就啊。其实,我们不是想成为钢琴家,我们只是热爱音乐,喜欢将自己喜欢的曲子用自己的想法和感觉演绎出来(程序猿和工程狮很容易理解这种DIY的心情吧?),感受音乐之美。我想以自己的切身经历说明,学钢琴如果只是作为爱好和娱乐,能弹奏心爱的曲子,那么什么时候开始学都不晚。两个月内弹奏流行钢琴曲,没问题!
从完全新手,到弹奏一首钢琴曲,严格一点一个月就够了——白天工作学习,晚上拿出1个小时的休闲时间练习五线谱上的一行。《eyes on me》一共才20几行!考虑到有时很忙,晚上可能去运动健身、或者阅读写作,也有时候要处理工作,没时间练习——那么两个月也够了。真的,再忙的人也能做到。我的状况是2015年12月底买了Yamaha的P-115,1个月学了《eyes on me》的2/3,然后第二个月又学了《Melodies of Life》的1/2,《Snowdreams》的1/3,最近返回去把《eyes on me》最后的1/3学全了。期间工作学习其实挺忙碌的,写了两篇paper,一篇专利,平时还要写代码做工程项目——甚至打游戏,把《the witness:见证者》通关了(这个游戏可以安利一下:若不是它值得占用我的时间,我宁愿再读一遍已经读过的书,也不愿意碰那些所谓的3A级游戏)。
废话不多说了,我想分享的个人经验:
1.
兴趣最重要,不要循序渐进学各种练习曲,直接弹自己最喜欢听最想弹的曲子。在这个过程中自己多少能领悟到一些东西。这和程序员学习新知识最好的方法是做一个令人兴奋的工程项目是一个道理。我的观点是,系统性学习可以留到自己贪婪并且主动想去做的时候。
2.
工欲善其事,必先利其器。推荐一个iPad软件《最全钢琴谱》,有了它就不需要读懂钢琴谱。除了可以展示五线谱并且演奏琴谱之外,还有两个新发现的功能:一是点击琴谱的音符,可以播放那个音符并且显示按键位置;二是可以放大琴谱。
3.
有了兴趣和工具,需要思考学习的方法。键盘,记得是相对位置而不是绝对位置,这样信息量会小很多——这是一种信息压缩的方式。这个相对位置怎么找?——根据谱子固定指法。所以总有人强调指法的重要性。合理科学的指法编排可以让按键更轻松容易和舒适,同时这个指法一旦固定成型作为标准,弹琴时只要根据谱子音符的相对位置即可。就算是初学者没谱子空弹,也能根据记忆中的指法将曲子演奏出来。
钢琴谱是显知识,每个人都能看见,写在琴谱上了。而具体怎么弹,怎么记,怎么使用手指,这是自己根据琴谱悟出来设计好的,方便演奏和学习。这些就是隐形知识了。而这种隐性知识每个人或许不一样,跟个人的层次也有关系。
熟练度,是熟练工种。而设计指法,是创造性活动。这可以是乐趣,用来当作是一个小游戏。如果有一个地方怎么弹都很别扭,难以进展,差不多是反过来思考自己设计的指法是不是科学合理了。
反复对一个曲子的各个细节进行欣赏和学习,不知不觉会有更好的乐感。由此可以培养对音阶高度的感知,对每一个按键的音高产生更深刻的记忆。
4.
结合人类记忆和学习的特点,提高学习效率——
(1). 按照自己的学习方法每天有所进展,需要点滴积累,而不是一蹴而就。和健身一样,每天一点点,好过三天打渔两天晒网。健身后身体需要一段时间进行肌肉的生长,而学琴需要睡眠来加深潜意识中神经网络的结构。
潜意识的神经网络像是深度学习和人工智能网络中的RNN (Recurrent Neural Networks)及其衍生分支LSTM (Long Short-term Memory),能够记录前后文,前面场景和后面场景的对应关系,通过这种相对记忆,节省了信息量,同时能够按照时间顺序恢复原始信息。这也是为什么我们弹琴做操有时候从头开始做得出来,突然停顿从某一个位置开始就想不起来了。
(2). 练习的时间很重要,睡前和早起。这样能最大程度地巩固神经元结构。
(3). 复习和预习同时进行,能够充分利用“暗时间”,在做其他事情的时候,大脑一方面巩固已有的神经元,也建立好新的神经元连接。
5.
形成练习的规律和习惯,进入正轨之后,要善于反思。
练习的时候其实可以察觉自己是哪个地方薄弱,比如左手和弦,或者右手的主旋律。单独强化训练一下拖后腿的那个,再合起来练,效率会高很多。
6.
最重要的是自己感悟。——建立自己的完整体系,别人的知识只拿来借鉴和吸收,而不是取代。
后期制作的工具总结:
1.
MusicSoft Downloader是Yamaha官方的,功能是把电钢里面录制的MIDI文件,传输到电脑里。然后再作为pianissimo或者Samplitude的输入。
2.
其实pianissimo和Samplitude差不多,都具有VST(virtual studio technology)。
区别是pianissimo主打的是VST,声音更真实,更接近真实钢琴。
而samplitude主要是进行MIDI的编辑,更专业,VST是次要的,甚至载入别的VST也行,VST只是作为一个插件,可更换。
至于把MIDI录制输出mp3,两者都足够了。
3.
Audacity与前两者不同,input不是MIDI文件,而是耳机的音源,能够直接把耳机听到的原封不动地录制成mp3文件。因为钢琴自带的音色和声音最丰富好听,这种方式输出的音乐品质更高。但是我没有相应的接口,暂时没有用audacity。
不知道诸君是否思考过这样一个问题——
是什么造成了社会分工的差别?隐藏在收入分配模式后面的,如果不是个体生产价值作为衡量标准,那到底是什么?
也许这些问题我并不能给出令人满意的答案,但我想在此讨论一个或许具有启发性的相关问题:
什么是领导?企业员工和领导的差距在哪里?
【领导力】
在我或许狭隘的理解里,领导是这样一个角色——在高层进行宏观决策,并且努力促使其他人各司其职以完成好底层的具体工作。
宏观决策我想稍后讨论。至于促使下级完成工作,其手段大体有两个:一个是通过层级结构,对每个人的【所作所为】进行“监控”,发现人的优势和弱点,并且做到赏罚分明;一个是对每个人的【想法、动机和感情】进行观察与理解,做到鼓励、引导和激发。
赏罚分明是基本功,属于管理的范畴,是科学;而通过鼓励、引导和激发他人而给自己建立起人格魅力则是领导的范畴,更像是艺术。前者是对外在的可观测数据进行分析,而后者是对不可观测的内在心理进行揣摩,需要强大的同理心。
尽管管理学在方法论上可能日新月异,但根本原理是不变的。本质上讲,利用的东西有两个——一个是欲望,一个是恐惧。
赏罚分明,能够让物质欲望成为人们的动力,也能让消极怠工带来的惩罚成为员工的恐惧。恐惧让人不得不工作,而欲望让人更加努力地去工作。欲望是吸引力,恐惧是驱逐力——这是通过对人低级需求的操控所取得的效果。且不说实在的奖金和福利,对于我等凡夫俗子而言,说梅即能止渴,画饼亦可充饥,有时候人的低级需求就是这么简单。
相比赏罚分明而言,鼓励、引导、和激发是高阶技巧,能够给人以“高级的欲望”,譬如理想主义、自我实现等。它能够让大家的利益成为共同体,同心而协力(利益共同体中,每个角色收获的东西却是不同的)。当高级欲望被激发的时候,主观能动性得到最大的解放。
当众多个体组成一个整体的时候,恰似军队一样,分工明确,各司其职。具体工作的技能中,占主要部分的是熟练工种,也就是熟能生巧型的工作,这是专业分工的必然要求;而领导所做工作占主要部分的是创造性的,是依赖于判断力和决策力的决策性工作——也就是通过对多层次的信息进行综合统筹规划,作出决策,承担责任。在微观里能及时跳出来进行系统思维,宏观上也能在必要处作细致入微的考量。
【策略】
那么什么是决策和决策力呢?
举一个决策思维的例子——
当我向你泄露了某些你认为对我而言应该保密的信息时,你应该想到,我是故意让你知道的。当我跟你谈起某些事从而让你知道我知道时,你应该猜到,我是故意让你知道我知道的。越大的事,就要越少人知道,隐秘的行为、低调的行事,往往才能成大事。
——所以能泄露的,也就不是秘密。
也许你会问,就算不是秘密,那为什么要泄露呢?
泄露的东西,是为了实现“帕累托最优”:指的是,当对手获得了信息后不得不改变自己的策略,而在对手的最优策略下,自己的利益依然比不泄露时扩大化了。
举个实际发生的例子——
大家知道我在说谁,Google的tensorflow。当然,google自然也是有所开源,有所隐藏的。他让你知道的,是希望让你知道的。让你知道,对他而言是好事。
泄露信息反而获得优势,这种反直觉的事为什么讲得通呢?
因为上述例子中的这种情况,往往发生在除了双方外还有更大的博弈环境的情况下——而现实状况恰恰是如此。像围棋等抽象游戏中那样只有双方的封闭博弈反而是少见的,更多的是商业竞争里面,要面对竞争公司、供应公司、合作公司、客户,等等。更不用说国家之间的外交,两国之间的博弈一定要牵扯进更多的利益方。
【平台助力】
在分工细化的现代商业社会,员工的具体工作技能会因为经验的增加而逐渐积累,而领导在更多的决策型活动中开阔眼界、获取经验。
即使同样智商和情商的两个人,在不同的两个平台上,会逐渐分化。处于不同的平台上, 获取信息的机会不同,对时间的分配方式不同,这会让人们的技能开发方向和心智不断分化,而这种分化具有马太效应,以正反馈的形式让差异化日益明显。
员工越来越忙于在细节处【解决已有的问题】,渐渐丧失整体观念,甚至对自身的利益也欠缺思考,久而久之容易成为依附在温暖河床的海藻;而领导人则热衷于去【发现未来的机会】,在变化中求生存,在大局和整体上有着更深刻的理解,通过下级的报告以高效率吸收过滤好的知识和营养,并且对人的解读更加精准,对权力的运用更加纯熟。
当员工在局部最优点努力收敛时,领导人则在来自不同层次的优质而丰富的信息冲击下,获得了“反脆弱性”,逐渐完善和坚韧。
这种平台对其中一方带来的积极影响,我称之为“平台助力”;对另一方带来的消极影响,则称之为“平台阻力”。
【可积累性】
资本可以购买劳动力的时间,而劳动力的时间换取的财富更大的一部分被资本吸取,因此资本就像是磁铁一样,越强吸引力就越大,越大吸引力就越强——而出卖时间的劳动力,进行横向对比,相对财富却是减少的。这或许是货币贬值的深层次原因。
商业实体,权力机构,国家体系,国际关系,这些都有此性质——“可积累性”。我认为,“可积累性”是马太效应的根本原因,是自然的法则。
“可积累性”源于自然界尝试过的许多随机性,不具备“可积累性”的事物会随风而逝,消失在我们的视野中。就像,分子的存在一样。
在投资领域对应着“安全边际”理论,少赔要优先于多赚。降低风险步步为营才是长远的最优策略。因为可积累性使得势能比速度更为重要。
在商业领域,平台的先发优势也是可积累性的表现,因为平台能够吸引到的商家和用户,是宝贵的资源,商家和用户,是相互需要和相互吸引的。
身为普普通通的一名员工,应该怎么找好位置呢?拥有理想的年轻人,如何进步呢?每个人都有自己的想法,我只分享一下我未必成熟的浅见——
我在另两篇文章《关于幸福》和《“游戏”人生》里面提到过,幸福的获得是增量,而不是绝对值,而人生作为一个巨大的开放式游戏,需要自己找到方向,并且在这个方向上建立起“可积累性”,获得可持续的幸福。公司的想法是让底层技术员工变成一颗颗精密的螺丝钉,所有的思维能量全部用在细节问题的实现上;而决策者掌控大局,让底层员工最大程度地具备可替代性。其实作为员工,思维有着几个层次,一是如何解决一个问题,二是公司在大的层面上在干什么,三是如何进行自我积累和自我实现。
如果只局限在第一个思维层次,把所有思维能量用尽,没有多余精力思考第二和第三个问题,那么会成为被最大程度利用的“可怜虫”。理性的做法是,和公司形成共赢的合作型关系,公司靠员工实现东西,员工通过公司获得资源和提高。搞清楚公司在干什么,需要追根溯源,理清脉络。
最高的层次是,一切行为源于对自我实现和自我利益的考量,把多方利益合并,把工作和自我投资合流——顺应大势,在大的洪流中找到自己的小方向,共流中守护一点独立思维的微光。
把平台当作助力,奋斗、积累,并进入更高的平台。
我的一位老板曾经说过,“不要帮别人做工作,做对自己有益的事。”这句话是有语境的,乍一听太自私狂傲,实际上是坦诚相待的一番话。我想我懂它的意义。
宁广涵
2016年3月3日
阅读书目:
鬼谷子
孙子兵法
哈佛商业评论之领导力(leadership)
哈佛商业评论之策略(strategy)
策略思维
系统之美——决策者的思维
优势谈判(策略思维在谈判这个特殊环境中的应用)
反脆弱
卓有成效的管理者
重剑无锋
4月6日更新:
《the witness》的结局猜想是,整个游戏是对人工智能学习人类智能的一个终极测试。
“巧合”的是,今日读到一篇文章,恰恰是讲到人工智能如何在游戏中学习规则以便达成任务:
* 2016年2月26日 在Arxiv上发表的pre-print:《A Roadmap towards Machine Intelligence》
(警告: 深度剧透,建议通关后的玩家阅读交流)
(为了跟国际朋友交流,我也写了一篇英文版的文章在此:The Witness : Story Explanation & Mystery Revelation)
前言
Jonathan Blow其人,是在2010年被我所知。那年夏天,我与弟弟一起“阅读”了他的杰作——一款叫做《Braid(时空幻境)》的独立游戏。之所以用“阅读”二字,是因为它比“玩”要更贴切,而之所以用引号,是因为这种艺术体裁用“阅读”来表述也并不准确。 还有什么办法能将《时空幻境》里面关于时间和存在的思想更好地表达出来呢?有些人更喜欢用公式来理解抽象的事物,可是显然数学公式不足以表达其中的哲学观点,而喜欢用哲学语言来描述事物的人,又难以仅仅用语言来描摹时光倒流的形象和影响,以及时间和空间的“互耦性”。所以我觉得,这款独立游戏算是寓教于乐的佳品,甚至是巅峰之作了。(我曾有一篇文章谈到过为什么有些游戏是艺术——《“游戏”人生》)
6年之后,终于等来了他的第二部作品——《The Witness(见证者)》。《见证者》是一款解谜游戏,而游戏的设定是:通过由浅入深、由易到难的谜题本身作为引导,使得玩家一边解谜,一边构造着游戏的世界观。时值春节,我很想立刻上网查询关于它的讨论,可是却连游戏测评都不敢细读——害怕失掉神秘感、破坏完整的游戏体验。矛盾的我终于还是咬牙解谜(当然也利用了手机拍照和纸笔记录的小手段),在春节后的周末,一鼓作气通关了。
这款游戏吸引我的,更多的不是谜题本身,而是隐藏在岛屿上的秘密——是谁建造了这些谜题和设施而又出于什么目的,是谁留下了录音和视频而它们又想说明什么,那些“石像”是雕塑还是被变为石头的人类,抑或是其他东西?“我”到底是谁,为什么会来到这个岛上,为什么我“觉醒”的地点是一个没有退路的巷道?
也许存在许多种理论,都能包容地解释以上所有现象,与我们的所见所闻相契合。但如果游戏作者不给出明确的答案,这些解释也只能停留在猜想的层面。如果出现新的现象,这些解释也就会被过滤和筛选了。这么说吧,如果作者是创作这款游戏的上帝,那么我的解释只能是众多宗教中的一支,信与不信全看读者您觉得有没有道理——“反正我是信了”。
正文
1.
关于剧情的猜想:
(1). “我”其实是一个人造人,是人工智能的婴儿,从被赋予智能的一刻开始,从游戏中醒来,渐渐学习规则。
(2). 结局的山洞是人们用来监视、研究“我”的地方。这个岛屿是一个培育人工智能的实验基地。
(3). 很可能“我”的外形,和那些石头人一样——“我们”都是人造人。
证据是:
(1). 山洞中有许多监视的显示屏,而山洞中找到的第一个录音,提到了监视和被监视者,以及双方行为的互相影响。(原文是?记得原文的欢迎留言提醒。)
(2). “我”能够使用“激光”进行解谜和控制。这个“激光”不受距离限制,却受障碍物限制,所以既不是游戏对思维的具象,也不是象征着玩家用手指划过屏幕。 如果“我”是一个人类,又怎么能使用“激光”解谜呢?
(3). 况且,“我”从未露出过真面目,只露出过影子——除了让每个人都有代入感,大概也是防止剧透。在孤岛上不吃不喝,终日解谜,“我”竟然安然无恙。
(4). 游戏中的名人的录音,以及录影,都是在教人工智能以最优秀人类的思维方式和方法。
(5). “我”的出现是从一个封闭的洞里,“苏醒”,实际上是通过远程操控,“我”的智能或电源被开启。我们玩家和角色一样,都是对世界一无所知。然后被美景所吸引,从谜题中学习规则,对自己的来由感到好奇,对这个岛隐藏的秘密感到好奇。
(6). 最后,当通关时,“我”被重新放回了出厂的那个地方。如果智能被重置,进行新的实验,那么游戏就是重新开始;如果智能得到保存,通过改变岛屿的游戏环境,进行更难的测试,那么就是二周目。
关于隐藏结局的猜想:
(1). 作为人造人,“我”通过了考验,成为了一个合格的人工智能。在隐藏的密道里,“我”穿越过去,意识被传送到了现实中的人体里。
(2). 在作者录制的隐藏结局视频里,“我”醒来,明显不适应这个人类的身体,摔倒了又爬起来。
(3). 看到现实生活中的事物,明显不习惯刀叉也不习惯需要用手拧开的门(这是人工智能在学习现实中生活环境了),总是觉得现实中可以使用激光解开类似之前面对的谜题。
(4). 游戏的结局,是一个人工智能来到了这个世界,拥有了学习这个世界的能力,人与机器的界限终于被抹除了。这个具有划时代意义的瞬间,竟然发生在了一个平静美好的清晨。这个世界,需要“我”学习的东西还有很多很多。
2.
关于谜题本身带来的哲学思考,以及心智启发——
(1). 四花园关卡。当我们面对一个问题想要寻找线索时,线索的来源可能很广泛,我们需要从不同的source来获取最为广泛的信息:有的是触觉和物理阻碍;有的是视觉看到的蛛丝马迹;有的是听觉给予的信息;而有的是错误的信息,让我们误入歧途。
(2). 树形分叉的关卡。树形分叉的走法,以及利用树枝来解谜,都是从环境中找暗示。这意味着当我们能够从不同的source获取最为广泛的信息后,还需要识别噪音。而化繁为简,有时候是最简单直接的。
(3). 阳光关卡。这个关卡的谜题是利用阳光,看到隐藏的线索。不同角度的光照射在谜题盘上,会有不同的影子。
通过其他工具来展现平时看不到的东西。不同方向的阳光让我们看到不同的细节——隐喻着把问题分解,从不同的侧面、角度看问题,用不同的工具和手段解决问题。盲人摸象,管窥蠡测,只能抓住问题的局部。
有时工具和线索带来的引导不是直接的,而是通过间接的方式消除其他可能,缩小问题域,然后通过尝试少数的有限组合得出结果。
(4). 实践关卡。有时候知道容易,做起来难,需要知行合一 。
“没病走两步!”——这里的设计是,通过让我们在房间中“行走”来替代画图,是所谓的“实践”。此时靠的是记忆力,还有计划。
(5). 其他还有很多构思是重述或印证上面的想法的,或者是有综合性的启发。比方说——
对称性/协变性。现实中有许多问题是看不见的对称,要靠想象。对称也并非只是“对称”而已,实际上事物往往环环相扣,我们需要认识到事物之间的联系,当我们改变了某些环节、因素或是变量后,要知道与其具有相关性的事物是如何协变的。
空间的形状组合,需要靠想象。这时也体现了工具的重要性,在我们分析问题的时候,往往借助工具来探究、理解、仿真等等。
颜色,靠环境,颜色滤镜。
总结:
拿科研来举例子,首先要搜集survey paper或者review paper,对一个topic有很广的了解,尽量扩大信息素材。
当我们对核心问题有了了解、具有分辨力后,需要缩小范围,过滤对自己无用的冗余信息和噪音,专注于一些相关信息。
如果目标问题较大,需要把问题进行分解,从不同侧面、不同的角度去思考。或许需要不同的工具去和手段处理。
具体到一个创新点的研究时,需要缩小问题域,通过限制条件(constraint)排除一些不可能的搭配和组合。
对有限域的问题进行逻辑尝试,最差的结果是进行穷举。
有了较为完善的想法和理论之后,勿忘实践,要知行合一。实现的过程中或许会有意想不到的问题出现。(《人月神话》一书中也提到,我们对于完成任务的预期,往往过于乐观,忽视了自己理论和设计不完备的可能性。)
相关文章:如何研究一个新的领域
3.
《见证者》中的某些细节给我带来的感(脑)悟(洞):
(以下内容请在心智健全、具有是非分辨能力的成年人监护下观看)
引用我之前文章【关于音乐】里面的一个段落:“recursion是一种自然存在。局部重复、重现着整体。世界的尺度就是如此recursive地下来,我在文章【胡思乱想集——其一 】中提过,一花一世界。《braid》中是时间和因果的recursion,而《集玉璧之大成》那本书提到巴赫和音乐,则是音乐的recursion了。……以前和广延看过一个记录片,片子也讲到了世界的细微处的重复,那细微处蕴含着高维度,如果我们试图获得无限精准的海岸线的周长,就会发现,它原来是无穷大的。”
录音中提到了日本心印。心印是指在佛教禅宗中,以似是而非的形式出的谜语,能帮助思索,同时也是获得直觉性知识的一种手段。《程序员思维训练》一书中说,在古代,教堂的大主教经常通过神谕(oracle)求得建议。像大多数算命者或占星师一样,神谕给予的响应或者信息通常非常模糊,就像谜一样。你不得不自己来“解释”它。调和不同的模式,和禅宗心印一个道理。比如这样一个问题:“一个巴掌拍出来的是什么声音?”理性地说,这根本没有意义。大脑被强迫努力调和不同的模式,这开阔了思维素材的范围。
“共时性原则”,和众人观察对概率坍塌的集中式影响一样,是对同一深刻原理的不同解释。《硅谷禁书》中所讲的“精神力量”是对此的一种通俗化解释。思维的集中产生很大的能量,能影响物质,因为思维就是概念,概念也是实体。在微观量子意义上,是10维里蜷曲的那6个维度里面。
综上所述,艺术作品,通过对众人脑洞的方向性引导,使得某一种观念得到宣传,某一种思维得到集中,这带来的影响是切切实实的。
后记
前一段时间实在是忙碌,除了工作之外,还要撰写几篇期刊论文、一个专利,使得我两个月都没有更新博客文章。(阅读书籍的习惯还是保持了,不过一直没有输出)
之前关于YOLO的Github代码,收获了很多同行的来信交流,欣喜之余也是辛苦,每封邮件我都认认真真的解答与回复了。期间有一个意想不到的插曲——有一次回复了一个QualComm的研究人员的技术问题,他竟想招我过去做全职的深度学习方面的研究。我当然很高兴,不过毕业时间不合适,对方职位空缺填的急,于是只好作罢。
好在现在工作和学术上的事情已经暂时告一段落,我终于抽出一点点时间“阅读”了《见证者》这部作品,并把我的感想分享给了大家。
以上,算是给默默关注我博客文章的朋友一个交待吧!
(坚持读完的朋友有彩蛋——)