侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

中文語(yǔ)音處理在數(shù)字助聽(tīng)器系統(tǒng)的開(kāi)發(fā)設(shè)計(jì)

  一.中文語(yǔ)音技術(shù)處理原理

  中文語(yǔ)音處理策略的英文詞有 “Chinese speech processing strategy” 或 “Chinese speech recognition”, ( 中文語(yǔ)音識(shí)別 ) 和 “hearing aid algorithm” ( 助聽(tīng)器算法 ) 等。其中, algorithm ,即 “ 算法 ” 一詞使用較多,尤其涉及到數(shù)字助聽(tīng)器的開(kāi)發(fā), “ 算法 ” 代表了某一特殊技術(shù)的核心。 “ 算法 ” 可以被簡(jiǎn)單地看作為實(shí)現(xiàn)某些特定信號(hào)處理功能的指令序列。中文語(yǔ)音特征可以通過(guò)算法研究來(lái)形成的。數(shù)字信號(hào)處理器和算法構(gòu)成了數(shù)字助聽(tīng)器的 DSP 線路。包含多通道動(dòng)態(tài)范圍壓縮、噪音衰減等處理,設(shè)計(jì)助聽(tīng)器的算法的主要目標(biāo)是利用中文語(yǔ)音處理技術(shù),即使在不同的聽(tīng)音環(huán)境中,須確保言語(yǔ)被聽(tīng)見(jiàn)并聆聽(tīng)舒適。同時(shí),利用數(shù)字助聽(tīng)器改善漢語(yǔ)可懂度,使有聽(tīng)力損失的中國(guó)患者能更容易地理解漢語(yǔ)。

  漢語(yǔ)是聲調(diào)單字語(yǔ)言,聲調(diào)是漢語(yǔ)的重要語(yǔ)音特征之一。聲調(diào)特征主要體現(xiàn)在嗓音基頻隨時(shí)間變化的模式上。 Eady 技術(shù) (1982) 曾考察過(guò)聲調(diào)語(yǔ)言 — 漢語(yǔ)的基頻模式與重音語(yǔ)言 — 英語(yǔ)有什么不同。漢語(yǔ)的聲調(diào)在詞語(yǔ)中具有辯意作用,在生活實(shí)踐當(dāng)中,大家也都能體會(huì)到聲調(diào)有助于我們聽(tīng)懂別人的話,而 “ 南腔北調(diào) ” 常表示不易聽(tīng)懂和不大好懂和不大好聽(tīng)的意思。

  對(duì)于連續(xù)言語(yǔ)來(lái)說(shuō),長(zhǎng)時(shí)間平均的正、負(fù)顫動(dòng)因數(shù),各種語(yǔ)言和男女發(fā)音人是差不多的。只是負(fù)顫動(dòng)總是比正顫動(dòng)大,而且出現(xiàn)頻率也較高。 Eady 的測(cè)量結(jié)果表明,漢語(yǔ)的說(shuō)話速度要比英語(yǔ)慢一些。這可能是由于說(shuō)漢語(yǔ)時(shí),說(shuō)話人要花更大的努力在每一個(gè)音節(jié)上來(lái)控制聲帶運(yùn)動(dòng),也就是說(shuō)聲調(diào)語(yǔ)言的音節(jié)喉運(yùn)動(dòng)控制有較大的語(yǔ)言學(xué)負(fù)荷,因而花的時(shí)間就多一些。結(jié)果就表現(xiàn)為說(shuō)話慢一些。

  因此,聲調(diào)信息主要存在于基頻隨時(shí)間的變化中,強(qiáng)度變化對(duì)聲調(diào)信息有補(bǔ)償作用,以及清輔音的存在與否對(duì)聲調(diào)清晰度是有一定的影響的。

  1  原理 (Principles)

  本文介紹一種可應(yīng)用于數(shù)字助聽(tīng)器的提高漢語(yǔ)可懂度的語(yǔ)音處理方法,其目標(biāo)是使以漢語(yǔ)為母語(yǔ)的聽(tīng)殘人士能更容易地理解語(yǔ)言。增強(qiáng)言語(yǔ)可懂度的思路來(lái)源于人們的實(shí)踐經(jīng)驗(yàn);叵胍幌,當(dāng)你為使一個(gè)有聽(tīng)力障礙的人更容易聽(tīng)懂自己說(shuō)話時(shí)所采用的方法:你不僅僅要提高音量,而且還要改變發(fā)音方式,說(shuō)得更慢和更清晰。一些研究表明清楚地讀無(wú)意義的語(yǔ)句,比在日常會(huì)話句子,大約能提高 17% 的單詞可懂度。這里所謂說(shuō)得更清晰是指強(qiáng)調(diào)言語(yǔ)信號(hào)中的某些暗示,這些暗示有許多不同的形式,如特定音段的持續(xù)時(shí)間,元音的共振峰位置或者音素之間的過(guò)渡等。

  不是所有人都會(huì)簡(jiǎn)單地、方便地對(duì)聽(tīng)力損失患者 “ 清楚地 ” 講話。因此,我們要采用言語(yǔ)增強(qiáng)的方法就是在說(shuō)話人和聽(tīng)話人中間構(gòu)造一個(gè)處理模型,該模型能強(qiáng)調(diào)并突出語(yǔ)句中的特定成分,使語(yǔ)句聽(tīng)起來(lái)更清晰。

  一切語(yǔ)音之所以能夠表達(dá)意義,是由于各個(gè)音之間存在區(qū)別。這些區(qū)別產(chǎn)生于聲腔內(nèi)部的器官和肌肉等活動(dòng)決定的發(fā)音方法和發(fā)音部位的差異,同時(shí)又表現(xiàn)為語(yǔ)音的聲學(xué)特征的差異。本文提出的言語(yǔ)增強(qiáng)的方法正是通過(guò)對(duì)語(yǔ)音信號(hào)的重構(gòu)來(lái)強(qiáng)化這些差異。所謂重構(gòu)是指對(duì)語(yǔ)音信號(hào)中不同性質(zhì)的信號(hào)進(jìn)行識(shí)別并有針對(duì)性地予以處理,強(qiáng)調(diào)其中對(duì)人的感知起作用的特征,從而達(dá)到提高言語(yǔ)清晰度的目的。該方法可以簡(jiǎn)單地概括為:放大輔音、強(qiáng)調(diào)重音和突出聲調(diào)。

<上一頁(yè)  1  2  3  4  5  6  7  8  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)