澳大利亚悉尼科技大学(UTS)的研究人员最近取得了一项重要的突破,他们开发了首款便携式、非侵入性人工智能系统,能够解码无声思维并将其转化为文本。这项研究的目标是帮助那些由于疾病或伤害而无法说话的人进行沟通,也有望实现人与仿生手臂或机器人等设备之间的无缝通信。该系统利用原始脑电图记录头皮上的脑电活动,并通过名为DeWave的人工智能模型将脑电图信号翻译成单词和句子。
以往的将大脑信号翻译成语言的技术要么需要进行手术植入电极到大脑中(例如埃隆·马斯克的Neuralink项目),要么需要使用体积庞大且昂贵的MRI机器进行扫描。与之相比,这项研究采用了一种更为便携且无创伤的方法,只需要戴上一顶帽子来记录脑电图信号。
这项研究涉及了29名参与者,这意味着与之前仅在一两个人身上测试过的解码技术相比,它可能更加强大、更具适应性,因为不同个体之间的脑电图波存在差异。
尽管这种方法所接收到的信号可能会受到噪音的干扰,但研究结果显示,新系统在脑电图翻译方面的表现超过了之前的基准。这项研究已被选为12月12日在美国新奥尔良举行的NeurIPS会议的重点论文,该会议旨在展示领先的人工智能和机器学习研究成果。
目前,该系统在BLEU-1上的翻译准确率约为40%。研究人员希望未来能进一步提高系统的性能,使其接近传统语言翻译或语音识别系统的水平,即接近90%。
这项研究是科学家首次将离散编码技术纳入大脑思想转化为文本的翻译过程,标志着该领域取得了重大突破。它将神经科学和人工智能相结合,为无声沟通和人机交互提供了新的可能性。