不得不说,这些人的作为让人颇为钦佩。
每种方言音都不少,就比如说妖都语就有8781个字汇。要把这个字全部准确读一遍,然后储存到数据库中,工作量也颇为巨大。
要一个一个地去读一遍,张凯总觉得效率低得不行。
智能播报这玩意已经出现很多年了,它的核心程序就是拼读。
如果把这个拼读程序用到这个方言输入中,那势必会大大减少张凯的工作量。
拼读程序最关键的部分是,拼读的逻辑。码程序对于张凯来说,不难。
但是要把拼读的逻辑写进去,那就头疼了。
最后张凯不得不去研究潮汕话字典和妖都话字典的发音符号。
幸好,字典的编撰者也考虑到了读音的便利,也考虑到了印刷问题,他们的读音都采用了国际音标。
所以张凯把两个字典研究了一轮,发音逻辑基本已经清晰。
为了方便,张凯直接把国际音标规规矩矩的读一遍,把这作为两种方言的发音基础。
然后设计拼读程序,把国际音标的发音逻辑输入到程序当中。
这里不得不赞小蓝,运算速度真心是吊炸天。
妖都话字典8781个字的读音,他只是用了十分钟就完成。
潮汕字典也没有费多少功夫,就这样张凯天黑前就完成了数据库建设。
接下来就是互换工作,这个工作费时就比较多了。
更加是因为张凯不懂潮汕话,所以调试程序也是颇为麻烦。
很多时候,张凯都不知道翻译成那样对不对。
怎么办呢?
这个就没办法了。只有输入大量的作品,然后调整。
妖都话的电视剧数量众多,潮汕话的也不少。而且最最最关键的一点是,都有字幕。
大量的字幕扒下来,然后让程序读一遍,有错漏的就调整。
然后在反过来,听取电视剧的音频,拼写出它的华语意思,然后再检查。
因为电视剧长度问题,张凯不可能按常规那样看完。他需要快速播放,但是速度太快又会导致音不准。所以速度上限为125,然后采用分段多窗口播放。
上百个窗口,张凯肯定没法听了。解决多窗口播放的声音问题,然后采取程序判断发音正确与否。
不正确的就做好标记,播放完毕后,张凯再调整其发音。这样做,就大大提升了调试的速度。
然则,即便如此,调试花的时间竟然比码程序的时间多几倍。
但是好处是可以积累大量的常用语以及常用句式,从而避开语法的问题。
等常用语,常用句积累到了一定程度,就会形成语感定式。用运算的优势,碾压了语法的劣势。
折腾了一夜,张凯天亮时候才睡了个囫囵觉。
十点钟,张凯才提着早餐回公司,远远就看到黎雅云在前台安排工作。
张凯快步走上前去,用妖都话说了句,“今天你穿的衣服好漂亮!”
手机的同时发出声音,“gitiengecuengdiihghpiuiang!!”
黎雅云惊讶地转身,发现是张凯。她瞬间明白了,老板是来找场子的。
她捂嘴轻笑,说道,“siasia!”
张凯的手机旋即翻译过来,“唔该。”
黎雅云脸上的笑意,顿时化作无比的惊讶!