3月3日,围绕现阶段建设无障碍校园,推动清华师生对无障碍建设的广泛参与,清华大学无障碍发展研究院组织清华师生举行了通用无障碍校园体系研究交流会。
为了让更多有障碍同学能够参与其中,交流会引入了捷通华声提供的“灵云智录”智能语音转写系统,可将讲演者的发言实时转写成文字上屏,精准的识别效果引发一致好评。
“这是我第一次亲身感受到,人工智能技术所带来的便捷。”一名负责组织交流会的志愿者说道,“有了这个智录系统,再组织尤其是有听力障碍人士参加的活动时,会议的沟通真变得‘无障碍’了。”
灵云智录系统现场转写效果
此前,灵云智录系统已经在去年的无障碍发展国际学术大会成功应用,受到现场各国研究学者、清华师生及各界人士高度好评。
无障碍国际大会现场转写效果
在一些有残障人士参与的会议中,尤其是有听力障碍的人士,“听会”成为了巨大的问题。灵云智录系统可以让会议现场的发言实时以字幕的形式展现出来,一方面便捷、加快了会议的交流,另一方面也极大地方便了听力障碍人士。
清华交流会上应用的灵云智能转录系统,采用灵云最新一代语音识别技术,拥有超快的转写速度和超高的准确率,对不同口音、语速的发言人都能轻松适配,面对远场讲话等场景亦能准确识别并转写。系统可实现会议场景的现场语音转录、发言实时上屏、离线录音转写、语音自动合成播报、实时编辑、关键词优化等多种功能。
实时语音转写:通过多个话筒预设发言人角色,系统可将每个人的发言实时转写并分别呈现在系统中,极大地方便了多角色会议记录。
除了支持中文普通话,系统也可支持四川话、广东阳江话、粤语以及维吾尔语、英语、哈萨克语、藏语安多、藏语康巴、朝鲜语、蒙文等多种语言的转写,并针对金融、电信、公检法、会议、医疗等领域训练了专用ASR模型,可根据自身企业需求进行定制。
在线实时编辑:记录人员根据实时转写的内容,可在编辑框里实时对语音转写输出的文字内容进行修改、删除、替换,使会议记录更为准确、精炼。
发言实时上屏:针对不同会议的需求,系统可将实时语音转写的结果,以弹幕的形式展现在大屏上,方便现场听会者阅读。
离线录音转写:历史录音文件针可直接导入系统进行转写,系统支持wma/wav/mp3/m4a/amr等多种格式音频,转写结果支持录音文字同步调听矫正,让录音整理者可快速完成文字校核。
语音合成播报:系统为会议主持者提供语音合成服务,可通过输入文字,选择男声、女声等不同的音色,完成广播音频合成。通过采用深度神经算法的语音合成技术,合成的声音清晰优美、抑扬顿挫,满足会议会场广播等各种场景需求。
文本训练优化:针对不同行业、不同会议场景,系统可以预先进行语音识别模型的优化训练,并在会前预先导入与会议相关的文字材料,或直接输入人名、地名、专业术语等关键词进行优化,从而提高专业领域会议的语音识别准确率。
“让每家企业都拥有人工智能,让人工智能像‘水和电’一样便捷服务大众无处不在”一直都是捷通华声的企业愿景,清华交流会上灵云智录系统成功服务残障人士即是一次典型的AI技术落地应用。捷通华声将继续专注于AI技术与产品的研发,不断深入行业了解需求,开发更多能够“落地应用”的产品与方案,从而让更多人享受到人工智能所带来的轻松与便捷。