在寂静的影厅中,漆黑笼罩着每一位视障观众,突然,一段细腻的旁白响起:“风卷起她鲜红的围巾,像一团不肯熄灭的火焰,远处疾驰而来的列车正刺破暮色……” 原本只能存在于想象中的画面,此刻化作灵动的声音,在耳畔勾勒出鲜活的故事。浙江大学科研团队用 AI 技术,让电影突破视觉边界,为视障群体搭建起一座通往光影世界的 “声音桥梁”。

一次在中国盲文图书馆观看无障碍电影的经历,彻底改变了浙江大学软件学院副教授周晟的科研方向。放映时,“播音腔” 旁白将画面转化为声音,视障观众沉浸其中的模样,与制作团队手工制作一部无障碍电影需耗费数百小时的疲惫,形成强烈反差。这份沉重却温暖的爱,让周晟和团队决心用人工智能为无障碍电影制作提速,让更多视障人士能便捷地 “看” 电影。
他们研发的 EagleMovie 智能制作系统,如同一位技艺精湛的 “声音魔法师”,由三个 AI 引擎精密协作完成光影到声音的 “翻译”。“空隙捕捉者” 利用语音和文字识别技术,在电影声轨中精准找到静默区间,为旁白预留 “舞台”;“视觉解说员” 基于多模态大模型,不仅能识别画面中的汽车、樱花,还能用充满文学美感的语言,解读角色的微妙神情与场景氛围;“声音魔术师” 则通过先进的语音合成系统,调节语速和情感浓度,让解说与电影原声带完美融合。曾经专业人员一周的工作量,在 AI 助力下缩短至几小时。当视障朋友发来语音感慨 “原来超人披风飘扬的声音是这样的” 时,研发团队感受到了科技传递的温度。
在浙江特殊教育职业学院,视障学生对 “听电影” 的热爱与执着,更坚定了团队前行的决心。一位男生坦言,为了在 “听电影” 时能清晰分辨每个角色的脚步声,他总坐在教室第一排。他们渴望的不仅是知晓故事,更是通过声音与社会情感共鸣,这份渴望成为团队攻克技术难题的动力。
尽管 AI 技术取得了显著成果,但前方仍有诸多挑战。面对电视剧复杂场景,AI 的理解能力还有待提升;在直播实时解说场景中,系统的反应速度和准确性亟待加强。曾有测试中,系统将古装剧里的玉佩误认成手机,暴露出通用视觉理解的不足。此外,如何针对不同地域、年龄的视障群体,提供符合其语言习惯的个性化解说,也是团队需要探索的方向。
如今,越来越多志愿者加入到家乡方言版无障碍电影的录制中,视频平台也开放 AI 解说插件接口,科技与人文关怀的融合正形成强大合力。从实验室里的代码与算法,到视障观众饱含感激的语音回复,周晟和团队用行动证明:科技有温度,AI 能让光影的魅力,通过声音,温暖每一个身处黑暗却向往光明的心灵。