第197章 语音识别
,比如一个新奇的物种,并没有见过,然后你给他了一张照片,说这是神兽饕餮,然后等他再次看到的时候,他很容易就能认出来,那个是不是神兽饕餮。
林奇想做的是能通过少量的样本就能训练出来一个不错的模型,这样就可以解放语音的大数据。
同时一个人上手的时间更短,想想即使一个人口音很重,用了智能语音软件说了几十句话,或者十几句话之后,准确率大大提高,可以堪比用标准的新闻联播主持人那样的普通话说出来的识别率。
其实在自然语言方面,林奇之前有一些经验,是在创造自然语言编程的时候。
但是里面设计到的多是语义的一些解析,没有涉及到语音识别。
林奇相信只要自己能通过第一关卡,那么后面的应该都很简单。
为了这个目的,林奇疯狂的投入到了开发中。
林奇把每一个的汉字读音都收集了起来,然后有语料数据的时候,林奇把这个语料做了一个分类。
一个是标准读音串起来的语音,一个是真实的语音。
林奇先处理了真实语音,把真实语音分成了环境音和人声。
接着又拿出来人声和原来的标准读音进行对比,找出来了两者的差异。
<本章未完请点击"下一页"继续观看!>