我們已經越來越習慣于家庭中使用智能設備,并希望它們變得更加智能,通過先進的音頻和視頻處理技術以及先進的傳感器來識別和解釋語音和運動。但是,通過創新的人工智能(AI)和機器學習算法實現的這些進步,增加了對設備和它們所基于的底層芯片的更高能效的需求。
在芯片設計領域,對功率的考慮并不是什么新鮮事。設計工程師一直在努力優化能耗目標,“低功耗”一直是長期的口頭禪—性能,功耗和面積(PPA)的三大支柱之一。
支持智能設備的現有功能已經是一項艱巨的任務,其中包括:
● 具有語音控制功能的揚聲器可利用來自訓練有素的語音命令的大量詞匯來進行高度準確的語音識別。
● 穿戴式活動跟蹤器,可根據來自陀螺儀,加速度計和磁力計等傳感器的輸入數據,識別諸如坐,站,走和跑等人類活動。
● 配有智能攝像頭的門鈴,可以執行面部識別并觸發警報,警報可以通過圖像或視頻發送到所有者的移動設備。
● 即使是無人駕駛汽車,也應用先進的計算機視覺技術來檢測車輛,行人和危險駕駛情況。
但是,當我們考慮諸如AI之類的應用如何推動對更大芯片的需求時,這為功率方程式帶來了新的動力。
所有這些智能都由AI的進步所驅動。但是,由于AI要求越來越高的處理性能,因此隨著更多的晶體管和更新穎的架構(例如3D堆棧),芯片將繼續變得更大。隨著它們更快地處理更多信息,芯片性能的關鍵限制之一將是溫度。在同一芯片上的如此多的晶體管導致高密度,從而導致結溫升高,芯片性能開始下降。
設計人員將不得不考慮熱失控,因為性能實際上會受到功率的限制。實際上,電子設計自動化(EDA)供應商正在繼續致力于提高溫度,這是芯片為成功運行所必須解決的關鍵目標之一,以及熟悉的PPA平衡行為。
盡管對電源和溫度的管理需求對于插入式設備至關重要,但對于電池供電的物聯網(IoT)設備而言,這甚至成為更大的挑戰。對于這些設備,由于其毫瓦的功率預算,在芯片消耗的能量方面沒有錯誤或協商的余地。最重要的是,隨著這些應用的芯片轉移到越來越小的制程節點(例如7nm,5nm或3nm)以及全能門架構,泄漏正在減少,但仍然是管理的關鍵問題。在低電壓操作下,設計人員將需要更加仔細地研究晶體管之間的變化以及時序。
所有這些都需要高能效的處理器以及出色的循環效率,以便IoT設備的處理器可以在預期的應用程序和用例中完成其工作。對于執行始終開啟功能的IoT邊緣設備(例如具有“總是聽”語音命令功能的智能揚聲器,智能手機或家庭娛樂系統),低功耗和管理尤為重要。對于執行“始終在觀看”的面部檢測或手勢識別的基于攝像頭的設備,情況也是如此。我們的健康和健身監測設備必須始終處于“感應狀態”。
這樣的設備通常應用智能技術來動態降低功耗。例如,始終監聽設備可以對麥克風信號進行采樣,并使用簡單的語音檢測技術來檢查是否有人在說話。然后,它僅在檢測到語音活動時,才應用計算量更大的機器學習推斷來識別語音命令。
處理器必須限制在每個不同狀態下的功耗-在這種情況下,是語音檢測和語音命令識別。結果,必須利用各種電源管理功能(包括有效的睡眠模式和掉電模式)來滿足能耗要求。
那么工程師如何應對這些挑戰?
傳統上,降低功耗的最重要的選擇武器一直是時鐘門控,多年來,它已經從簡單的時鐘門控到自門控再到順序時鐘門控發展了。盡管動態電壓縮放(DVS)提供了一種相當普遍的降低功率的技術,但許多設計現在開始轉向更高級的自適應電壓和頻率縮放(AVFS)方法。
對于中低計算要求(很大一部分消費物聯網設備)的機器學習推理,選擇合適的處理器對于實現所需的高效率至關重要。具體來說,擁有合適的處理器能力來進行神經網絡處理可能是滿足低兆赫茲要求(從而滿足低功耗)之間的區別。
功能更強大的神經網絡和算法的出現使機器學習支持的設備得以發展,這些設備無需進行顯式編程即可進行學習。但是,機器學習能夠實現更高的自動化和智能化的希望,特別是在消費類,邊緣和電池供電的設備中,意味著PPA中的功率P規則至高無上。