智能音響是眾多勝任智能家庭管家設備中最具有潛力的,即作為未來家庭人工智能(AI)的入口,作用至關重要。目前,美國的亞馬遜、中國的京東等科技公司,已經朝著這個方向不斷努力,并且初步顯露成效。亞馬遜在2015年推出智能音箱Echo,京東在2016年推出智能音箱叮咚(DingDong),谷歌的Google Home也正在后來者居上。這些產品,主要在三個方面將聲音的人機交互的作用加以發揮:智能家居中心;家庭購物入口;大數據獲取。
未來,預計會有更多形式的智能聲音獲取終端進入家庭,作為利用人機聲音交互的軟、硬件通道。
無論在何種方案中,用戶非常看重的一項功能,就是語音識別。如果這項功能缺失,那么人機通過聲音交互的方式就不能完全自主,必須依賴其它途徑開始、結束交互過程,用戶體驗必會大打折扣。因此,目前各個主流產品中,都具有語音識別功能。
然而,我們知道如果要想識別用戶說出的命令,麥克風必須一直在錄音狀態,并且語音識別算法也要一直在工作,這就是連續語音識別的基本前提。因此,設法降低這部分系統設計的功耗和復雜度,是整個智能音箱軟、硬件設計的核心之一。
2. 目前的麥克風信號處理的主流方案
智能音箱采用N個(目前多見7個或8個)麥克風芯片構成麥克風陣列拾取周邊的聲音信號。市面上見到的智能音箱通常采用“模擬輸出MEMS麥克風 + 音頻ADC + 處理器”的音頻信號通路形式,如下圖所示:
Amazon Echo的音頻處理板實物拆解圖
橙色:德州儀器TLV320ADC310192分貝SNR低功耗立體聲ADC(X4)
綠色:S10530090 V6麥克風(X7)
以亞馬遜的Echo為例,典型的信號通路形式如下圖,其中兩路模擬麥克風輸出共用一顆雙通道音頻ADC,ADC將信號轉換為I2S/PCM音頻格式傳送給應用處理器,應用處理器需要具有足夠多通道的串行數據接口來接收I2S/PCM信號。
例如圖中7顆麥克風,后續即需要4顆獨立的音頻ADC同時輸出4路I2S/PCM信號, DM3725CUS100處理器具有多達5路的串行數據接口(MCBSP)兼容I2S/PCM 格式的音頻信號。當然亦可采用通道數更多的音頻ADC 。
3. 用I2S輸出的數字麥克風形成的代替優化方案
相對于現在智能音箱“模擬麥克風 + 音頻ADC + 處理器”的方案,敏芯可提供直接I2S數字輸出的硅麥克風芯片,集成了上述“模擬麥克風 + 音頻ADC”的功能。I2S麥克風芯片在芯片內部先將模擬信號數字化后再轉化為標準的I2S信號,由于省去了音頻ADC,可以實現可應用處理器的直連,節省BOM,節省PCB空間,使設計更簡單化。 優化過的信號通路如下圖所示:
4. 未來智能音箱的發展趨勢 — 低功耗語音喚醒
目前的智能音箱解決方案為了保持聲音識別功能,麥克風陣列、ADC以及后續處理算法始終保持在工作狀態,因此功耗較大,這就造成了例如亞馬遜的Echo必須插電工作。然而智能音箱是一類移動互聯網時代的智能硬件,方便攜帶是其作為智能硬件的重要因素,插電工作必將嚴重影響產品的用戶體驗。
將來的新一代智能音箱,預期會借鑒智能手機中(例如中興天機手機)的語音喚醒功能,即在低功耗模式下,只有麥克風以及專用語音芯片處于工作狀態,而其他電路部分則處于休眠狀態。只有麥克風偵測到用戶設定的“特定語音信號”時,整個系統才被激活。通過語音喚醒功能,極大的降低了整個系統的整體功耗,才使用電池供電的智能音箱系統成為可能。
5. 敏芯推出之高一致性(靈敏度+-1dB)多模式數字I2S輸出MEMS麥克風
蘇州敏芯微電子技術有限公司研發的低功耗的多模式(Multi-Mode)數字I2S輸出MEMS麥克風芯片,內置完整的24位I2S音頻接口,無須額外添加Codec,可直接與DSP或MCU實現全數字化信號連接?蓭椭纛l系統設計師顯著降低信號鏈設計復雜度并降低系統整體成本。在系統體積、成本、功耗和抗干擾性方面都具有極大的優勢。
敏芯帶I2S接口的麥克風具有極低的工作功耗,并特別集成了低功耗模式,兩種模式之間可實現無縫切換。在普通模式下,產品以最優的性能指標工作,且具備業界同類產品之最低功耗(750uA);在低功耗模式下,功耗進一步降低,麥克風可以在保證一定性能的情況下以極低的功耗持續運行,該特性使敏芯I2S麥克風尤其適用于需要語音喚醒的智能音箱類遠場人機聲音交互產品中。
此外,針對多麥克風降噪、波束成形等應用進行了優化,具有+/-1dB的超窄靈敏度公差控制,確保了產品之間的靈敏度匹配。
總而言之,敏芯發布之新產品在技術上的領先性體現為如下幾方面:
* 在普通模式下,敏芯I2S麥克風已經具備業界同類產品之最低功耗(750uA)
* 業界首款多模式I2S輸出MEMS麥克風
* 業界首款具有+/-1dB的超窄靈敏度公差控制的I2S輸出MEMS麥克風
主要技術參數見下表。敏芯微電子未來還將繼續持續開發新產品,例如將自動喚醒功能內嵌在麥克風芯片中。
6. 敏芯微電子的高一致性(靈敏度 +/-1dB 范圍以內)多模式數字I2S輸出MEMS麥克風與現有“麥克風 + 音頻ADC”方案優缺點詳細/對比
1) 現有“麥克風+音頻ADC”方案成本高,需要配置單獨的音頻ADC,即使采用多通道,例如4通道輸入的音頻ADC。由于比雙通道ADC具有更高的單價,不能很好起到降低成本的作用 。由于I2S麥克風采用了一體化的設計,綜合使用成本低于采用音頻ADC的方案。
2) 現有“麥克風+音頻ADC”方案,由于音頻ADC引入的信噪比惡化。以德州儀器TLV320ADC3101為例,其等效輸入模擬噪聲為-95dbV,對應一個標稱-38dbv靈敏度的麥克風,最多只能達到57的信噪比,使得具有本征高信噪比的麥克風新能得不到體現。例如采用標稱為 60dB信噪比的麥克風,最后由于采用音頻ADC的緣故,整體只能達到 55.3dB左右的 整體信噪比,而采用 I2S麥克風則不會損失任何信噪比 。
3) 敏芯I2S麥克風方案可以達到更低的整體功耗。仍然以TLV320ADC3101為例,ADC雙通道同時開通時功耗為6mA ,加上模擬麥克風固有的 0.2mA×2=0.4mA 電流,而采用敏芯的低功耗I2S麥克風整體電流<2mA,雖然目前的主流的智能音箱都可采用外接電源的方案,但低功耗的需求已成趨勢。
4) 極大程度的減小BOM和PCB空間,數字信號的互聯不僅抗干擾強于模擬信號,BOM也能大為減小。
5) 相對于采用音頻ADC的方案,I2S麥克風更適合語音喚醒,例如為了在待機模式下實現低功耗的運行,敏芯的麥克風支持低功耗模式,配合語音喚醒算法,使得使用電池供電獲得更長的待機時間變得可行。
6) 相對于音頻ADC多少會引入一些通道間的不一致,敏芯的麥克風出廠時具有很好的一致性(靈敏度+/-1dB變化范圍以內),因此使用敏芯的I2S麥克風會使不同通道間匹配的更好。 尤其適合與對產品一致性要求較高的麥克風陣列應用。
|