東芝電子元件及存儲裝置株式會社(“東芝”)今日宣布成功開發出一款汽車應用圖像識別系統級芯片(SoC),與東芝上一代產品相比,該產品使深度學習加速器的速度提升10倍,功率效率提高4倍[1]。該技術成果的詳情于2月19日在舊金山舉行的2019 IEEE國際固態電路會議(ISSCC)上公諸于眾。
自動緊急剎車等先進駕駛員輔助系統可提供越來越先進的功能,但實現這些功能需要圖像識別系統級芯片在低功耗條件下高速識別道路交通信號和路況。
深度神經網絡(DNN)是模仿大腦神經網絡的算法,與傳統模式識別和機器學習相比,DNN的識別處理精度要高得多,預計將會在汽車應用領域得到廣泛應用。而采用傳統處理器的DNN圖像識別耗時較長,因為它依賴大量的乘積累加(MAC)計算。同時,采用傳統高速處理器的DNN還存在功耗過高問題。
東芝利用可在硬件上實現深度學習的DNN加速器解決了這一難題。它具有三大特點。
- 并行MAC單元。DNN處理需要大量MAC計算。東芝的新設備配有四個處理器,每個處理器包含256個MAC單元。因此提高了DNN的處理速度。
- 減少了動態隨機存取存儲器(DRAM)存取。傳統的系統級芯片沒有本地內存,無法在靠近DNN執行單元的位置保存臨時數據,并且在訪問本地內存時產生較大功耗。同時,加載用于MAC計算的加權數據也會產生較大功耗。東芝新設備可在DNN執行單元附近執行靜態隨機存取存儲器(SRAM),并將DNN處理分為多個子處理塊,因此可將臨時數據保存在SRAM內,從而減少了DRAM存取。此外,東芝還在加速器上增加了一個解壓縮單元。可通過解壓縮單元加載預先壓縮并存儲在DRAM中的加權數據。因此,降低了加載來自DRAM的加權數據時產生的功耗。
- 減少了SRAM存取。傳統深度學習需要在處理DNN的每一層之后訪問DRAM,因此功耗過高。該加速器在DNN的DNN執行單元中設計有流水線層結構,以便在一次SRAM存取期間執行一系列DNN計算。
新系統級芯片符合全球汽車應用功能安全標準ISO26262的要求。
東芝將繼續提高所開發的系統級芯片的功率效率和處理速度,且東芝下一代圖像識別處理器ViscontiTM5的樣品發貨將于今年九月啟動。
注
|
[1]
|
|
東芝在2015 IEEE國際固態電路會議上發表的一篇論文《面向圖像識別應用采用基于顏色的對象分類加速器的1.9TOPS與564GOPS/W異構多核系統級芯片》中提及的圖像識別系統級芯片
|