语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟一些,并已开始向产业化方向成功迈进,大规模应用指日可待。
自动语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。
语音评测技术,又称计算机辅助语言学习(Computer Assisted Language Learning)技术,是一种通过机器自动对发音进行评分、检错并给出矫正指导的技术。语音评测技术是智能语音处理领域的一项研究前沿,同时又因为能显著提高受众对语言(口语)学习的兴趣、效率和效果而有着广阔的应用前景。
自然语言是几千年来人们生活、工作、学习中必不可少的元素,而计算机是20世纪最伟大的发明之一,如何利用计算机对人类掌握的自然语言进行处理、甚至理解,使计算机具备人类的听说读写能力,一直是国内外研究机构非常关注和积极开展的研究工作。
“面对面翻译”是讯飞输入法升级的新增功能。该功能支持中英、中俄、中日、中韩四种对话翻译模式,并配备有真人发音,中文用户通过它可以直接与外国友人面对面交流。
文字扫描识别是讯飞输入法新上线的又一功能。该功能可通过拍照和上传已有图片实现。但是受限于文字特别是艺术字体文字的颜色及阴影等变量的干扰,该功能尚不能实现较高的识别率。
方言识别是科大讯飞在AI能力开发上独具特色的“卖点”,支持22种方言,其中粤语、四川话、东北话、河南话等方言的识别率均已超过90%。