利用神经编码理论分析功能性磁振造影(fMRI)
加州大学柏克莱分校的神经科学家发使用receptive-field的神经编码理论发展出计算模型。将此模型的计算结果与功能性磁振造影(fMRI)的数据相比对,可以有效的译码出受测者正在观看的影像。自从核磁共振被用在观察大脑活动之后,从fMRI的数据完全译码人类的思考与认知就是许多科学家的终极目标,而达到这个目标的第一步是从fMRI数据读出受测者正在观看的影像或是聆听的声音。过去在这个被昵称为\"读心术\"的领域里,测试影像只限于简单的非自然图形(例如黑白交错的条纹),或是只能解读出受测者观看的图片的类别(例如人脸或房子)。另外一个限制是能从fMRI数据解读出的测试图片(或是图片类别)必须与当初建立译码法时所使用的测试图片(或是类别)相同。
在今年五月初将出刊的Nature上,加州大学柏克莱分校的研究人员Kendrick N. Kay以及其同僚发表一种崭新的译码方式来解决上述的问题,使得fMRI\"读心术\"可以扩展到自然影像(nature image),并且可解读与建立译码法时用的图片不同的测试图片。他们首先让测试者观看一组自然影像并用fMRI纪录其大脑活动。接着他们用测得的fMRI数据来建构一个大脑视觉处理的模型。这个模型假设在视觉皮层中fMRI纪录的每个数据点都包含了一群对不同影像性质起反应的神经。比如说某一数据点所包含的神经对空间上某一点的明暗起反应,另一数据点的神经则对空间上某一点的图形方向起反应。这样的模型称作receptive-field model。
建构出受测者的receptive-field model之后就可以开始解碼的工作。他们让受测者观看另外一组与先前测试图片不同的自然影像并且使用fMRI测量大脑活动。接者他们使用先前建立的receptive-field model来计算这组自然影像,可以得出每一张图片的预测fMRI数据。最后将预侧的fMRI数据与实际测得的相比,与测得数据最相近的预测fMRI应该就代表受测者所观看的图片。
当译码测试图片的数目只有120的时候这样的解碼法可以达到72-92%的准确度。准确度随着测试图片的数目缓慢递减。当测试图片的数目达到1000的时候,这个方法还可以有60-80%的准确度。
虽然目前这种译码法只能在一组数量不能太多的已知图片中译码,但是相对于先前的实验算是向前跨了一大步。或许当未来fMRI的时间与空间分辨率大幅提升之后,这种receptive-field model的译码方式可以真正解出受测者观看的随意影像。不过即使这一步可以达到,这也只是科学\"读心术\"的第一步,离真正读出人类的思考与认知还有很长的路要走。对于那些忧心科学\"读心术\"可能造成社会与伦理问题的人来说,目前还暂时可以放一百个心。
原始论文: Kay, K.N., Naselaris, T., Prenger, R.J. & Gallant, J.L. Nature advance online publication, doi:10.1038/nature06713 (5 March 2008).
页:
[1]