百度语音识别为开发者提供业界优质且免费的语音服务,通过场景识别优化,为车载导航,智能家居和社交聊天等行业提供语音解决方案,准确率达到90%以上,让您的应用绘“声”绘色百度也在做语音技术,现在已经完全免费开放了语音识别和语音合成技术,个人开发者都可以免费的使用。由吴恩达带领的百度大脑团队,也在为语音识别、语音合成等技术提供支持,百度的语音技术在未来不容小觑。科大讯飞是国内语音产业的先行者,应用领域从军用到民用,包括移动互联网、教育、车联网、智能家居等。讯飞提供语音云,支持多种方言,国内大部分应用的语音识别功能都是用了讯飞的接口,如高德地图。百度、搜狗、腾讯等互联网公司也有自家的语音识别技术,依托自身丰富的用户资源和数据,发展迅速。从语音识别技术上来说,上面提到的公司用的都是深度神经网络(DNN)算法,降噪方面可能有所差异,更多的差异是在语料库,讯飞经过多年的积累,已经有了丰富的语料库,当然那些互联网公司的大数据也不容小觑。从个人体验来说,目前讯飞在方言识别上是最出色的,标点符号根据停顿和语义自动给出。
百度语音识别服务能将语音文件(指定格式,不是所有格式都可以)识别成文本。语音识别我们都接触过,手机输入法里就有语音识别服务。简单说来,就是无须在开发者的项目中写入代码,或引入jar包REST API 就是将音频文件转换成某种特定格式,通过 http 请求发送给百度语音识别的服务器,由百度语音识别的服务器进行语音识别,最后返回识别出的文本。在我看来,她好在可以很方便的调用,我们自己不用去维护语音识别部分的代码,接入也十分简单,关键是她是免费的!使用的方式简单说来是1、根据百度语音识别官方网站提供的App ID和API Key获取accessToken。2根据上一步的accessToken 连同其它请求参数一起向百度语音识别网关发出请求,获得识别的文本。是不是觉得和微信公众平台的开发有点像?的确是这样的。微信公众平台的开发的确也是先获取 token,再通过 token 去请求其它数据。