如果一些睿智非凡的神经科学家是正确的话,在能够进行足够多次的数据运算以及拥有一个超强的大脑扫描仪的情况下,科学将能够直接从你的大脑里获知你看到的事物——甚至有一天可能读取你的思想。
在美国加州大学伯克利分校亨利·小惠勒(Henry H. Wheeler Jr.)脑成像中心,我正脸朝上躺在一个重达13吨的管状物(磁共振扫描仪,译者注)里。扫描室里的灯光很昏暗,我独自躺在仪器里面。一个白色的塑料框罩在我的脸上方,蓝色的电脑屏幕映入眼帘。我之所以来到这里,是因为一位名为杰克·格兰特(Jack Gallant)的神经科学家将要读取我的大脑。他已经严格告示我(在扫描仪里)不要动;哪怕轻微的抖动也会影响扫描数据的准确性。可是当我注视着前方的屏幕时,突然觉得大腿有点痒。“不要挠它,”我心中告诫这样自己。我试着不去想这些,因为机器运行的哼鸣声已经越来越快了,功能磁共振(fMRI)机器已经启动了——这个扫描仪将检测我大脑里的血流变化。
格兰特跟我说,我大脑中随意的想法不会影响扫描的结果。因为今天他只关注我看到了什么,以及我看到的事物是如何记录在大脑视觉皮层的(视觉皮层处在大脑的后部,负责加工我的眼睛所看到的事物)。所以我哪怕正想着晚餐吃些什么也没有关系,即便我正担心牛津路上的车位罚单也不影响。他说,唯一重要的是尽可能地保持不动,不久后他就可以在自己还没看到图片的情况下,重建出我看到过的图片。
在过去10年,格兰特一直在伯克利分校掌管着一个致力于大脑成像和视觉研究的神经科学和心理学实验室。在使用磁共振扫描和算法以及大脑激活模式分析法来研究读心的领域里,格兰特是世界最顶尖的少数几个开启这扇大门的神经科学家之一。在给我看一组随机排列的图片以及评估功能磁共振从我的初级视觉皮层读取的信息时,格兰特跟我说他的技术能够重建出我大脑里储存的图片。他目前采用的方法需要几个小时的分析时间,但他的目标是升级他的技术已达到能够实时推算并报告人们看到了什么。
如果他能做到的话,那将影响到我们处理任何事的方式。读心机将可以帮助医生理解幻想症患者、认知障碍患者、创伤后应激障碍患者和其他病人的心声。法官将可以运用读心机潜入犯罪嫌疑犯的大脑里去看一看,看看他们有没有编造事实以及他们到底看到了什么。这样的机器也可以确定那些以精神病作为自保理由的人是否在说谎,或者那些宣称正当防卫的人是否真正出于自卫的目的。但是另一方面,这项技术也将同样引发严重的伦理问题,评论家担心有一天这项技术使得我们的隐私便于被偷窥者和黑客所窃取。
当我一动不动地躺在大脑扫描仪里的时候,我就在琢磨这些;当格兰特和实验室的两名研究人员在我的眼前快速放映几十张图片(几秒钟一张)的时候,我就注视着前面的屏幕。我看到过牧场上的绵羊、一个岩石层、一个池塘和一个像爱因斯坦的人的侧面像。实际上我并没有必要去看这些图片,我唯一的任务只需要注视着屏幕中央的白点(注视点)。格兰特说,“看见”(这种体验)并不全然发生在意识范畴里。大脑视觉皮层像相机一样工作,自动地(无意识地)从视网膜上提取信息,并把物体的表象记录在大脑里。
十分钟仿佛十年,但是最终功能磁共振以另一种蜂鸣声宣告实验的结束。研究人员将我从僵直的状态中解放出来,护送我来到控制室,在那里一个巨大的监控器上显示着30幅从不同角度扫描的我的大脑扫描图。我在图上看到几排灰色圈里有一束一束的白色曲线和明亮的灰色V字形。“那是什么?我的大脑吗?”我问,努力保持头部不动使我的头有点累。我大脑里的一举一动都可以概括成一束束的几何图形,这一点让我有点吃惊。格兰特告诉我,大脑的活动基本上就是一束束的神经元的激活——根据新近的研究结果,仅仅在大脑初级视觉皮层估计就有3亿个神经元。
为了便于理解这些形状,大脑扫描仪将扫描图像划分成一个个类似立方体的三维结构里,这些单元格叫做体积像素,或者体素。对于我而言,每一个体素都像是黑白灰三色的随机混合。但是对格兰特那能够从这些形状里获取更精确信息的计算机模型而言,体素就是0或1的简单矩阵。通过运算这些矩阵,计算机模型能够非常准确地将这些形状还原出是像爱因斯坦的人还是牧场上的绵羊。格兰特和他的研究团队没有时间为我的大脑生成足够的图像来进行运算工作,但是他们给我展示了一些令人信服的来自志愿者的研究结果。“这不是很完美”,格兰特的一个博士后西本真治(Shinji Nishimoto)说,“但也很不错了”。
当我离开实验室的时候,有一个想法一直萦绕在我的脑际,我好好想过之后就明白,他们的技术不会在这个层次上停留太久。格兰特的“神经解码”——他用来替代“读心”的一个术语——发展地越来越快、越来越成熟。实际上,去年10月份,他的实验室已经通过分析人们观看视频片段时的大脑激活模式重建了参加者观看的完整的视频片段。在一个示例里,一只大象在沙漠上行走的重建视频,显示着一个稍有瑕疵的小飞象形状的物体在屏幕上缓慢地移动。其中详细的细节丢失了,但是这仍然使人印象深刻,因为这是从某个人的大脑里提取的。运用类似的技术,其他研究者正在揭开记忆和梦境的神秘面纱。
抛开其中超自然现象的重重阴霾,读心只是我们能否拥有一个好的工具的问题。“只要我们拥有好的仪器来检测大脑活动,并且建立了合适的大脑计算模型”,格兰特在他2008年发表在英国《自然》杂志上的一篇论文的附属材料里写道,“原则上我们将可能解码诸如梦境、记忆和表象等心理加工过程的视觉内容”。
对于你看到的每张图片,你的大脑会产生一种独特的活动模式。通过分析上千张功能磁共振扫描图,软件就能够将你大脑的模式和特定的物体进行匹配。凯文·汉德
你的大脑里有什么?
仅仅通过分析你的大脑活动,科学家就能非常准确地预测你刚刚看到过的事物。这种技术就是神经解码。为了做到这一点,科学家首先必须在你注视上千张图片的时候,扫描你的大脑。然后计算机分析你的大脑对于每一张图片是如何反应的,最后将大脑活动与形状和颜色等各种细节进行匹配。随着计算的进行,计算机能够建立一种主解码密匙;这种密匙稍后能够在没有预先分析观看某张图片产生的扫描图像的情况下,识别和重建几乎所有你看到的物体。
头部先进入:类似这台机器的功能磁共振仪器帮助科学家解码人类大脑的活动。承蒙ATR大脑活动成像中心神谷之康先生供图
磁共振的魔法
格兰特是一个留着马蹄胡须的瘦小但结实的男人,他身上有一种威利·卡旺(WillyWonka;威利·卡旺是罗尔德·达尔写于1964年的小说《查理和巧克力工厂》里的人物)式的气质。他说话时喜欢友好地使用一些生动的比喻。“大脑就像感恩节的火鸡”,去年夏天我造访他在伯克利分校简陋的工作室时,他这么跟我说。他在黑板上迅速地画着,试图用简单的术语向我解释视觉皮层的内在工作机制。“火鸡的外层是皮肤,就像大脑的皮层。火鸡所有的内脏就相当于大脑的皮层下核。”他拿着粉笔在他那“火鸡”示意图上指向一个巨大的气球样空腔的后部。“这就是初级视觉皮层,我们视觉系统的核心。”
我们的大脑通过一个复杂的装配线来建构我们周遭的世界。初级视觉皮层,或者简称V1,通过复杂的方式与V2、V3等其他区域相连接。(“没人确切知道那里到底有多少这样的区域”,格兰特边说边拿手指指着自己的头。)每个区域负责一个特定的与视觉相关的功能,比如分辨颜色,识别形状,探测深度,或者感知运动。例如,当我看着一条狗时,我不仅仅只是看到一条四条腿的动物的外形;我还会意识到我小时候曾经有过一个这样的棕白色的狗,在我生活过的后院里也这样地活蹦乱跳;甚至可能会勾起我跟它一起玩闹的记忆。“看见”(这个状态)所包含的所有这些方面,都将会在视觉皮层以不同模式得以表征。
格兰特的研究关注的V1区域的核心功能——记录视觉刺激——在20世纪早期被发现;当时发现脑袋后部(大概就是他们的视觉皮层)有枪伤的士兵,尽管视力正常,但却出现了部分的失明。来自啮齿动物的实验证实我们所看到的事物的方位和形状在V1区域被重建。假如我看着一棵树,眼睛的后部将把一个正立的树的表象记录在V1区域。但是直到1990年代,神经科学家通过一种叫多体素模式识别的方法,才得以对人类中的非侵入性表征进行精确定位。这种技术运用功能磁共振将视觉皮层投射到微小的结构——体素——上;而体素又与脑部血流的模式相一致。比如,这个区域一个负责表征形状的模式,可能会告诉我们某个人正在看一只狗;而该区域另外一个负责表征颜色的模式将显示这条狗是褐色的。
格兰特的项目将这一技术提升到了一个新的水平,他使用计算模型来识别图片的同时重建了它们。在对我进行功能磁共振扫描的晚上,我见到了格兰特实验室里的五个成员。他们在过去三年内与概率理论作斗争,争取提出最优的算法来推动这个计算模型的发展。当我问他们到底如何设计出这些算法编码时,托马斯·纳斯拉瑞斯(Thomas Naselaris),一个高个子卷发的博士后在黑板上写下了一个很长的叫做贝叶斯理论的方程。这是概率理论的基本法则,可以计算对于全新的信息而言,其概率变化如何。他说,这是他们的技术的核心。
为了计算某个人的大脑表征特定图片的模式的概率,研究者首先必须使用相当数量的抽样数量来启动这个特殊的方程,他们需要使用被试的功能磁共振扫描数据中的1750个来训练这个模型。“对于每个人可能看到的任何一张图片,贝叶斯理论会告知我们每张图片被正确预测的概率,”纳斯拉瑞斯说。这有点像试图预测隐藏在防水布下面的汽车的品牌:为了提出准确的猜测结果,你首先必须分析所有可以获得的线索——防水布的外形、大小、甚至是车主的类型、可能还有引擎的声音。获取的信息越多,你就猜得越准。同样的道理,投入方程里运算的数据越多,你的预测准确性就越高。
跳舞的熊
从某人的大脑里提取他所看到的图片的能力是一项让人印象深刻的技艺,但是一个更大的挑战是计算出这个人看到这张图片时的确切想法。格兰特没法知道,比如,当我躺在扫描仪里到底想了些什么。这是因为思想,不像图片一样被规则地记录在大脑后部。
那么思想到底记录在大脑的什么位置呢?汤姆·米切尔(TomMitchell),一位美国卡内基梅隆大学的计算机科学家,同他的同事马塞尔·贾斯特(Marcel Just)一起,使用功能磁共振和多体素模式识别的方法回答了这个问题。他们已经成功地将大脑的反应投射到图片、词汇和情绪上,米切尔相信他的实验室在未来十年内也可以解码思想,而不仅仅只是图片。
为了精确定位思想在大脑中表征的位置,在最近的一项研究中,他让志愿者进入功能磁共振仪器,同时给他们呈现两个物体——比如,一个锤子和一套房子,并且运用软件来分析大脑多个区域触发的体素模式,最终确定被试在想哪个物体。像格兰特一样,米切尔能够达到90%的准确率。“当你想着锤子时,你想到了锤子的所有属性。你可能会想着挥动锤子,这就会激活运动皮层的神经元,”他说。“你也可能会想它像什么,这会激活视觉皮层。”他的团队同时将杏仁核和前扣带回——这两个区域与诸如愤怒和爱等情绪相关——的功能磁共振数据集中起来,来识别当人们听到“爱”、“公平”和“焦虑”等词汇时的大脑模式。
神谷之康(Yukiyasu Kamitani),日本高级电信国际研究所的一名计算神经科学家,相信他能够将该技术再推进一步,进而可以解梦。今年夏天,他计划通过功能磁共振解读熟睡中的人的大脑信号,像格兰特一样,再重建梦境。
同时,格兰特和他的博士后西本真治正在尝试重建大脑中储存的电影影像。在我完成我的功能磁共振扫描后,格兰特在他的电脑上向我展示了一个视频片段,视频像幻觉一样描绘了漂浮在雪山前的一只熊。每隔几秒,一只新的熊被放大到视频前面,然后又像抛向空中的水皮球一样漂走了。偶尔一个彩色的立方体飞过熊。仅仅只是看着它就让我眼晕。“这是一个运动增强的影片,”格兰特兴奋地说,“它会让你的视觉系统绝对的疯狂,所以你的视觉系统充满了血流和信号。”
西本真治,实验室里典型的“运动控”,可以从大脑扫描数据里重建出这些熊的颜色、位置和运动,并生成原始视频片段的复制版本。在一个类似的实验里,他让一名志愿者躺在功能磁共振仪器里观看一个电影预告片两个小时。然后计算机将被试的大脑模式与影片里的颜色和移动形状进行匹配。为了逐步建立计算模型的参考数据库来启动贝叶斯方程,研究者用上千个小时的YouTube视频来训练这个模型,并且使用它来预测人们观看这些视频时大脑将如何反应。然后,当被试观看一段全新的视频片段时,计算机就能够将新的大脑模式与数据库中的汇总的图像片段进行匹配,进而重建原始视频片段。重建的视频,像重建形状和颜色一样,刻画了运动的综合流程,虽然它丢失了详细的细节,比如脸部特征。研究者称,只要有更多的数据参入计算模型的计算,重建视频的分辨率将会提高。“当我告诉任何人我能够做到这点时,”格兰特说,“他们都说绝不可能。”
回想起我在进行功能磁共振扫描时看到的老鼠家族的巢穴图片——我所看到的只是简单的黑白图片——而想到我们的心理加工过程在这种方式下能够被简化成一个个二进制的值,稍微有点不可思议。但话说回来,这就是控制着我们任何所见所闻、所思所想的一个神秘黑盒子里的神经元的真实图景。“所有的都是数字,”格兰特说,“而诀窍就是做好记录。”
摘自中国心理学家网