万维读者网 > 信息时代 > 正文  

脑机接口奇迹!重度语言障碍者竟能唱歌

www.creaders.net | 2025-06-15 09:48:21  科普中国 | 0条评论 | 查看/发表评论

一名患有严重语言障碍的男子,借助大脑植入装置,能够富有表现力地说话和歌唱。该装置可以将他的神经活动转化为话语,不仅能实现语调变化,强调他选择的单词,还能让他以 3 个音调哼唱一串音符。

该系统被称为脑机接口(BCI),使用人工智能解码参与者说话时的脑电活动。该装置是第一个不仅能再现一个人的意图,还能复制自然语言特征的BCI。而音调、音高、重音等自然语言特征有助于表达意思和情感。

在一项研究中,一种模仿参与者声音的合成声音,在他的神经活动发出说话意图信号的 10 毫秒内就说出了他的话。这项 6 月 11 日发表于《自然》的研究成果标志着对早期 BCI 的重大改进。早期 BCI 通常在 3 秒内输出语音,或者仅在用户模拟完整个句子后才能生成语音。

“这是语音 BCI 领域的圣杯。”荷兰马斯特里赫特大学的 Christian Herff 说,“这是真实、自发、连续的讲话。”

这项研究的参与者是一名 45 岁男子,在患上一种运动神经元疾病——肌萎缩侧索硬化症后,失去了清晰说话的能力。这种疾病会损害控制肌肉运动的神经,包括说话所需的神经。虽然他还能发音和说话,但说得很慢,也不清楚。

在症状出现 5 年后,这名男子接受了手术,在控制运动的大脑区域插入 256 个硅电极,每个长 1.5 毫米。论文作者之一、美国加利福尼亚大学戴维斯分校的 Maitreyee Wairagkar 和同事训练了深度学习算法,能够每 10 毫秒捕捉一次大脑中的信号。团队的系统实时解码了该男子试图发出的声音,而不是他想要表达的具体词语或基本音素——构成单词的语音亚单位。

“我们并不总是用语言表达想法。我们还有感叹词,以及一些词汇表里没有的富有表现力的发音。为了实现这一点,我们采用了这种完全不受限制的方法。”Wairagkar 解释说。

该团队还通过训练人工智能算法,根据病人生病前的采访录音,将合成声音个性化,使其听起来像病人自己的声音。

图片

植入运动皮层的电极有助于记录和语言相关的大脑活动。图片来源:Kateryna Kon

研究人员要求参与者尝试发出“啊”“哦”“嗯”之类的感叹词,并说出虚构的单词。 BCI 成功产生了这些声音,表明它可以在不需要固定词汇的情况下生成语音。

使用这款 BCI ,这名男子可以拼写单词、回答开放式问题,并使用解码器训练数据库之外的一些单词说出想说的话。他告诉研究人员,听到合成声音说话让他“感到高兴”,感觉就像他的“真实声音”。

在其他实验中,BCI 能够识别出参与者是想把一个句子说成疑问句还是陈述句。该装置还能判断他在一句话中想强调哪些词语,并相应调整合成声音的语调。“我们正在引入人类语言中所有这些重要的元素。” Wairagkar 说,以前的 BCI 只能产生单调的语音。

瑞士日内瓦大学的 Silvia Marchesotti 说,该装置的功能“对于患者的日常使用至关重要”。“从某种意义上说,这是一种范式转变,可以真正带来一种现实生活中的工具。”

   0


24小时新闻排行榜 更多>>
1 习张胡3人公开决裂
2 向“新中央”服软 习近平要保命
3 上海、深圳正在出现3大怪现象,开始逐步蔓
4 被逼无奈 习变相做检讨
5 习设局老胡拒陪 习张胡3人公开决裂
热门专题
1
四中全会
6
何卫东
11
叙利亚
2
中美冷战
7
AI
12
苗华被抓
3
川普
8
中共两会
13
美国大选
4
俄乌战争
9
大S
14
以哈战争
5
万维专栏
10
洛杉矶大火
15
巴黎奥运
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.