黑科技超级辅助（3 / 5）

设置

第四十三章：语音通话模型的制作（二更）

然后把要说的话转换为文字，每次都只发送文字过去，这样需要传输的信息就会小很多。
    虽然这个方法想起来非常的简单，但是做起来可不是这么容易的。
    首先每个人都有一个自己的语音模型，训练这个模型需要有一个很优秀的训练好的模型，然后做迁移学习。
    但是训练基础模型的时候，是需要很多数据的，程序林奇很快的就做好了，但是没有语音数据是硬伤。
    最后林奇收集了很多的网络上公开的音频资料，来输入到模型中进行训练，刚开始的时候找来了很多的汉语的音频。包括从电视剧，电影还有广播，新闻等里面抽取的音频。
    等训练好之后林奇测试之后发现针对标准的普通话，这个表现很好，但是如果是方言甚至是另一种少数民族，比如蒙古语，这个软件表现的就非常的不尽人意。
    后来林奇换了一个思路，不把每个人的语音转换为文字。而是让机器自己发明一种能发音的文字，不需要人类能看懂，只需要这个软件自己能看懂就好，可以把听到的任何声音都转换为这种机器自己能识别的文字。
    修改了核心的算法之后，林奇再次把数据输入进去，同时这次增加了很多的其他的数据，包括英语，德语，日语……
<本章未完请点击"下一页"继续观看!>