中文語(yǔ)音處理在數(shù)字助聽(tīng)器系統(tǒng)的開(kāi)發(fā)設(shè)計(jì)
一.中文語(yǔ)音技術(shù)處理原理
中文語(yǔ)音處理策略的英文詞有 “Chinese speech processing strategy” 或 “Chinese speech recognition”, ( 中文語(yǔ)音識(shí)別 ) 和 “hearing aid algorithm” ( 助聽(tīng)器算法 ) 等。其中, algorithm ,即 “ 算法 ” 一詞使用較多,尤其涉及到數(shù)字助聽(tīng)器的開(kāi)發(fā), “ 算法 ” 代表了某一特殊技術(shù)的核心。 “ 算法 ” 可以被簡(jiǎn)單地看作為實(shí)現(xiàn)某些特定信號(hào)處理功能的指令序列。中文語(yǔ)音特征可以通過(guò)算法研究來(lái)形成的。數(shù)字信號(hào)處理器和算法構(gòu)成了數(shù)字助聽(tīng)器的 DSP 線路。包含多通道動(dòng)態(tài)范圍壓縮、噪音衰減等處理,設(shè)計(jì)助聽(tīng)器的算法的主要目標(biāo)是利用中文語(yǔ)音處理技術(shù),即使在不同的聽(tīng)音環(huán)境中,須確保言語(yǔ)被聽(tīng)見(jiàn)并聆聽(tīng)舒適。同時(shí),利用數(shù)字助聽(tīng)器改善漢語(yǔ)可懂度,使有聽(tīng)力損失的中國(guó)患者能更容易地理解漢語(yǔ)。
漢語(yǔ)是聲調(diào)單字語(yǔ)言,聲調(diào)是漢語(yǔ)的重要語(yǔ)音特征之一。聲調(diào)特征主要體現(xiàn)在嗓音基頻隨時(shí)間變化的模式上。 Eady 技術(shù) (1982) 曾考察過(guò)聲調(diào)語(yǔ)言 — 漢語(yǔ)的基頻模式與重音語(yǔ)言 — 英語(yǔ)有什么不同。漢語(yǔ)的聲調(diào)在詞語(yǔ)中具有辯意作用,在生活實(shí)踐當(dāng)中,大家也都能體會(huì)到聲調(diào)有助于我們聽(tīng)懂別人的話,而 “ 南腔北調(diào) ” 常表示不易聽(tīng)懂和不大好懂和不大好聽(tīng)的意思。
對(duì)于連續(xù)言語(yǔ)來(lái)說(shuō),長(zhǎng)時(shí)間平均的正、負(fù)顫動(dòng)因數(shù),各種語(yǔ)言和男女發(fā)音人是差不多的。只是負(fù)顫動(dòng)總是比正顫動(dòng)大,而且出現(xiàn)頻率也較高。 Eady 的測(cè)量結(jié)果表明,漢語(yǔ)的說(shuō)話速度要比英語(yǔ)慢一些。這可能是由于說(shuō)漢語(yǔ)時(shí),說(shuō)話人要花更大的努力在每一個(gè)音節(jié)上來(lái)控制聲帶運(yùn)動(dòng),也就是說(shuō)聲調(diào)語(yǔ)言的音節(jié)喉運(yùn)動(dòng)控制有較大的語(yǔ)言學(xué)負(fù)荷,因而花的時(shí)間就多一些。結(jié)果就表現(xiàn)為說(shuō)話慢一些。
因此,聲調(diào)信息主要存在于基頻隨時(shí)間的變化中,強(qiáng)度變化對(duì)聲調(diào)信息有補(bǔ)償作用,以及清輔音的存在與否對(duì)聲調(diào)清晰度是有一定的影響的。
1 原理 (Principles)
本文介紹一種可應(yīng)用于數(shù)字助聽(tīng)器的提高漢語(yǔ)可懂度的語(yǔ)音處理方法,其目標(biāo)是使以漢語(yǔ)為母語(yǔ)的聽(tīng)殘人士能更容易地理解語(yǔ)言。增強(qiáng)言語(yǔ)可懂度的思路來(lái)源于人們的實(shí)踐經(jīng)驗(yàn);叵胍幌,當(dāng)你為使一個(gè)有聽(tīng)力障礙的人更容易聽(tīng)懂自己說(shuō)話時(shí)所采用的方法:你不僅僅要提高音量,而且還要改變發(fā)音方式,說(shuō)得更慢和更清晰。一些研究表明清楚地讀無(wú)意義的語(yǔ)句,比在日常會(huì)話句子,大約能提高 17% 的單詞可懂度。這里所謂說(shuō)得更清晰是指強(qiáng)調(diào)言語(yǔ)信號(hào)中的某些暗示,這些暗示有許多不同的形式,如特定音段的持續(xù)時(shí)間,元音的共振峰位置或者音素之間的過(guò)渡等。
不是所有人都會(huì)簡(jiǎn)單地、方便地對(duì)聽(tīng)力損失患者 “ 清楚地 ” 講話。因此,我們要采用言語(yǔ)增強(qiáng)的方法就是在說(shuō)話人和聽(tīng)話人中間構(gòu)造一個(gè)處理模型,該模型能強(qiáng)調(diào)并突出語(yǔ)句中的特定成分,使語(yǔ)句聽(tīng)起來(lái)更清晰。
一切語(yǔ)音之所以能夠表達(dá)意義,是由于各個(gè)音之間存在區(qū)別。這些區(qū)別產(chǎn)生于聲腔內(nèi)部的器官和肌肉等活動(dòng)決定的發(fā)音方法和發(fā)音部位的差異,同時(shí)又表現(xiàn)為語(yǔ)音的聲學(xué)特征的差異。本文提出的言語(yǔ)增強(qiáng)的方法正是通過(guò)對(duì)語(yǔ)音信號(hào)的重構(gòu)來(lái)強(qiáng)化這些差異。所謂重構(gòu)是指對(duì)語(yǔ)音信號(hào)中不同性質(zhì)的信號(hào)進(jìn)行識(shí)別并有針對(duì)性地予以處理,強(qiáng)調(diào)其中對(duì)人的感知起作用的特征,從而達(dá)到提高言語(yǔ)清晰度的目的。該方法可以簡(jiǎn)單地概括為:放大輔音、強(qiáng)調(diào)重音和突出聲調(diào)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
技術(shù)文庫(kù)
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國(guó)激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢(shì),以Edge AI驅(qū)動(dòng)機(jī)器視覺(jué)升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測(cè)量
- 1 2025高端醫(yī)療器械國(guó)產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國(guó)醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場(chǎng)在哪?
- 4 認(rèn)購(gòu)火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 中國(guó)創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來(lái)展望
- 6 核藥賽道解碼:高壁壘、國(guó)產(chǎn)替代與千億市場(chǎng)卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤(rùn)僅687.40萬(wàn)元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司
- 10 3月生物醫(yī)藥產(chǎn)業(yè)100個(gè)項(xiàng)目獲投,廣東最吸金