考场噪音对你的PTE考试究竟有多大影响?为什么有人Repeat sentence可以蒙混过关?PTE口语考试中有啥常见的发音问题?欢迎走进今天的Jasmine老师(墨尔本悉尼文波PTE培训学校优秀教师)小讲堂:
众所周知,PTE是Pearson研发的一款机考考试,口语的出题作答阅卷也都是由机器完成,因此研究PTE的语音识别系统及其评分规律就显得极其重要。
(这是一小段背景知识介绍,不感兴趣的同学可以选择跳过)目前主流的语音识别系统常见通过对语音前处理后分帧使用隐马尔可夫模型构建状态网络,从而进行状态匹配得到对应状态并组合成音素进行识别。整个过程大致分为编码,训练和解码三个部分,其中,训练是整个语音识别系统的重要部分,即从数据中学习对语音的判断。这种语音的识别过程表现出与人工语音识别的极大不同之处。
举一个例子。人与人之间的谈话交流,在巨大的噪音环境下,只要音量足够大,那么对方即可判断识别另一方发出的谈话。但是,如果在语音识别环境下,如果语音识别软件并未进行过在该种噪音环境下的训练,那么即使噪音音量很小,这句语音就难以被识别。在PTE考试中,录音设备(Plantronics 655)具备一定的降噪功能,过滤噪音,但是一旦作答者声音太小,环境噪音又过大,该降噪功能将大大减弱。因此,即使进行了噪音处理,环境噪音对于语音识别仍有一定影响。所以,同学们在考试中口语作答时,一定要保证自己的音量,并且当你感觉身边同学声音过大,造成干扰时,一定要及时汇报给考官。
此外,在PTE口语考试中,发音的重要性不言而喻。墨尔本悉尼文波PTE培训学校的老师不断强调PTE发音的重要性,但是也有一部分同学存在这样一个疑问,为什么我听说有人repeat sentence在没有听懂的前提下,就模糊不清的模仿了一下语调,仍然可以得到90分呢?
(这还是一小段背景知识介绍,仍然可以跳过)为了解释这个问题,我们就要回到前面提到的隐马尔可夫模型的原理了。其实在语音识别中,分帧后每一帧所对应的状态是一个概率,我们在构建的状态网络中,寻找每一帧对应的最大概率的状态,并将它进行识别,这里使用了声学模型。但是因为有的时候及时进行了音素的识别,识别出来的组合也毫无意义,为此,引入了语言模型和字典训练。也就是说,当一个单词,只有某几个音素被识别出来的时候,通过语言模型和字典,这个单词就可以被识别。
因此,在repeat sentence的考试中,墨尔本PTE和悉尼PTE备考的很多同学因为对于某些音素的识别准确,即使没有听懂,仍然能将其“哼唱“出来。但是,这并不是上上之选,因为只要有一点不准确,这句话/单词将不能被识别。而这种准确度的把握,需要大家不断的进行词汇语音的训练。
综上,为了更好的口语识别率,墨尔本悉尼文波PTE培训学校优秀教师Jasmine老师建议大家在PTE口语考试中提高音量,咬准发音。
在这里Jasmine老师提出几个最近同学们常见的发音问题:
元音发音时,嘴巴的纵向开合程度不够,嘴形过于扁平,导致元音发音不饱满,甚至于发成了错误的发音
清辅音发音受汉语拼音影响过大。例如/p/,在英文中这个辅音属于清辅音,发音时嘴唇紧闭而后突然松开,舌头保持放松状态,声带不振动。避免发成汉语拼音的发音。
辅音/l/和/r/区分不明显。/l/为舌侧音,舌尖抵住长牙根部,气流从舌头两侧而出。/r/为卷舌音,发音时舌尖卷起。
多音节单词没有重音,或者多音节单词中每个音都是重音。(因为文字描述的局限性,这一部分将由视频形式下期放送)
*语音识别理论部分,为了方便读者,省略了很多专业内容,欢迎语音识别大神一起来探讨PTE考试的语音识别问题。
Jasmine