盗墓笔记,兽性总裁的爱奴,手机推荐排行榜

新聞資訊

圖像傳感器集成計(jì)算功能，賦能機(jī)器視覺技術(shù)

點(diǎn)擊量：
|
添加日期：2022年04月25日

據(jù)麥姆斯咨詢報(bào)道，視覺是人類與外界交流最重要的感知方式。過去十年里仿生機(jī)器視覺迅速發(fā)展，如今人工系統(tǒng)已經(jīng)具備從圖像和視頻“看見”有價(jià)值信息的能力，不過相比人眼視覺效率還有一定的差距。奧地利維也納理工大學(xué)Lukas Menne等研究人員最近在《自然》中發(fā)布了一種媲美于人腦的視覺系統(tǒng)設(shè)計(jì)，經(jīng)過訓(xùn)練后能實(shí)現(xiàn)對(duì)簡(jiǎn)單圖像的納秒級(jí)分類。

數(shù)碼相機(jī)所用的現(xiàn)代圖像傳感器基于半導(dǎo)體（固態(tài)）技術(shù)，并于二十世紀(jì)七十年代初問世。主要分為兩種類型：電荷耦合器件（charge-coupled devices）和主動(dòng)式像素傳感器（active-pixel sensors）。它們可以“忠實(shí)地”從環(huán)境中捕獲視覺信息，但會(huì)生成大量冗余數(shù)據(jù)。通常的方式是將大量光學(xué)信息轉(zhuǎn)換為數(shù)電格式，然后傳遞到計(jì)算單元進(jìn)行圖像處理。

在傳感器和處理單元之間大量數(shù)據(jù)移動(dòng)會(huì)引起延遲和高功耗等問題。隨著成像速度和像素?cái)?shù)量的增加，帶寬帶來的限制使得難以將所有內(nèi)容快速返回到中央計(jì)算機(jī)或基于云的計(jì)算機(jī)并進(jìn)行實(shí)時(shí)處理和決策，這對(duì)一些對(duì)延遲非常敏感的應(yīng)用如無人駕駛汽車、機(jī)器人或工業(yè)制造等尤為重要。

一種更好的解決方案是將一些計(jì)算任務(wù)轉(zhuǎn)移到計(jì)算機(jī)系統(tǒng)外部邊緣傳感設(shè)備，從而減少不必要的數(shù)據(jù)移動(dòng)。由于傳感器的輸出通常是模擬信號(hào)（連續(xù)變化），模擬處理勝于數(shù)字處理：眾所周知，模數(shù)轉(zhuǎn)換既耗時(shí)又耗能。

為了模擬大腦對(duì)信息的有效處理，生物神經(jīng)形態(tài)工程采用了一種計(jì)算架構(gòu)。該架構(gòu)采用高度互連的元素（神經(jīng)元，通過突觸連接），從而實(shí)現(xiàn)并行計(jì)算（見圖1a）。這些人工神經(jīng)網(wǎng)絡(luò)可以通過迭代學(xué)習(xí)周圍環(huán)境——例如，為其提供已知示例展示，對(duì)事物進(jìn)行分類（監(jiān)督學(xué)習(xí)）；或者，無需額外信息就能通過輸入數(shù)據(jù)識(shí)別對(duì)象的特征結(jié)構(gòu)（無監(jiān)督學(xué)習(xí)）。在學(xué)習(xí)期間，算法會(huì)反復(fù)進(jìn)行預(yù)測(cè)，并增強(qiáng)或削弱網(wǎng)絡(luò)中的每個(gè)突觸，直到達(dá)到最佳設(shè)置。

圖1：在視覺傳感器內(nèi)進(jìn)行計(jì)算，實(shí)現(xiàn)智能高效的預(yù)處理。（a）傳統(tǒng)人工智能（AI）視覺傳感器從光敏傳感器收集信號(hào)，利用模數(shù)轉(zhuǎn)換器（ADC）將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)，放大后輸入到外部人工神經(jīng)網(wǎng)絡(luò)（ANN）——連接可以進(jìn)行調(diào)整的互連計(jì)算單元（圖中用圓形表示）層，經(jīng)過訓(xùn)練后，此網(wǎng)絡(luò)可以執(zhí)行諸如圖像分類之類的任務(wù)。ANN輸入層接收的信號(hào)是編碼后的簡(jiǎn)單物理元素（圖中用點(diǎn)和線表示）；在后續(xù)層中，這些已優(yōu)化為中級(jí)特征（圖中用簡(jiǎn)單形狀表示）；在輸出層上形成精細(xì)圖像（圖中用3D形狀表示）。整體響應(yīng)可能是又慢又耗能。（b）Mennel等研究人員設(shè)計(jì)的系統(tǒng)中，芯片上的互連傳感器（圖中用正方形表示）不僅可以收集信號(hào)，還可以作為ANN來識(shí)別簡(jiǎn)單功能，從而減少了傳感器和外部電路的冗余數(shù)據(jù)移動(dòng)。

Mennel等研究人員直接在圖像傳感器加入了人工神經(jīng)網(wǎng)絡(luò)。他們?cè)谛酒蠘?gòu)建了光電二極管網(wǎng)絡(luò)，這些光電二極管是對(duì)光敏感的微型單元，每個(gè)單元中有幾層二硒化鎢（WSe2）原子層。通過調(diào)節(jié)施加在二極管上的電壓，半導(dǎo)體器件對(duì)光的響應(yīng)程度發(fā)生變化，從而實(shí)現(xiàn)對(duì)每個(gè)二極管靈敏度的分別調(diào)節(jié)。實(shí)際上，這將光電傳感器網(wǎng)絡(luò)變成了神經(jīng)網(wǎng)絡(luò)（見圖1b），能夠執(zhí)行簡(jiǎn)單的計(jì)算任務(wù)。改變光電二極管的光響應(yīng)能力則改變網(wǎng)絡(luò)的連接強(qiáng)度（突觸權(quán)重）。因此，該器件實(shí)現(xiàn)了光學(xué)傳感與神經(jīng)形態(tài)計(jì)算的結(jié)合。

作者將光電二極管排列成九個(gè)像素的正方形陣列，每個(gè)像素有三個(gè)二極管。當(dāng)圖像投影到芯片上時(shí)，會(huì)產(chǎn)生不同的二極管電流，再進(jìn)行組合和讀取。硬件陣列提供了一種模擬計(jì)算形式：每個(gè)光電二極管都會(huì)產(chǎn)生與入射光強(qiáng)度成比例的輸出電流，并且根據(jù)基爾霍夫定律（電路電流所遵循的基本規(guī)律）將沿行或列的電流值求和。

圖2：光電二極管排列成九像素正方形陣列

接著對(duì)陣列進(jìn)行執(zhí)行任務(wù)的訓(xùn)練。芯片陣列產(chǎn)生的電流與預(yù)測(cè)電流（對(duì)于給定任務(wù)，陣列正確響應(yīng)圖像應(yīng)產(chǎn)生的電流）的差異，并用于調(diào)整下一次訓(xùn)練周期的突觸權(quán)重。這個(gè)學(xué)習(xí)階段會(huì)占用時(shí)間和計(jì)算資源，但是一旦經(jīng)過訓(xùn)練，該芯片將迅速執(zhí)行其任務(wù)。

神經(jīng)網(wǎng)絡(luò)可以采用不同算法，作者在文中演示了兩種神經(jīng)形態(tài)功能。第一種是分類：3 x 3像素陣列可以將圖像分類為三個(gè)簡(jiǎn)化字母“n、v、z”對(duì)應(yīng)的三個(gè)類別之一，從而以納秒為單位識(shí)別該字母。這樣的簡(jiǎn)單陣列只是為了概念證明，如果按比例增加陣列的大小，則可以進(jìn)一步擴(kuò)展，識(shí)別更復(fù)雜的圖像。

圖3：27個(gè)光電探測(cè)器的光響應(yīng)值，其中訓(xùn)練數(shù)據(jù)σ = 0.3。（a，b）：其中（a）為初始時(shí)期（epoch）的響應(yīng)度值，（b）時(shí)期為30時(shí)的響應(yīng)度值，訓(xùn)練數(shù)據(jù)σ = 0.2和σ= 0.4的權(quán)重相似。c：在特定的投影字母和三種噪聲水平下，所有時(shí)期測(cè)得的電流。d：三種不同噪聲水平的初始和最終響應(yīng)度值的直方圖。

第二個(gè)功能是自動(dòng)編碼：即使在存在信號(hào)噪聲的情況下，傳感器計(jì)算陣列也可以通過學(xué)習(xí)圖像的關(guān)鍵特征來生成處理后圖像的簡(jiǎn)化表示。編碼版本僅包含最基本的信息，但可以解碼以重建與原始圖像最相似的圖像。

這項(xiàng)有前途的技術(shù)在投入實(shí)際應(yīng)用之前，還有許多工作要做。用于自動(dòng)駕駛車輛和機(jī)器人技術(shù)的神經(jīng)形態(tài)視覺系統(tǒng)需要捕獲視場(chǎng)角較大的3D動(dòng)態(tài)圖像和視頻。當(dāng)前使用的圖像捕獲技術(shù)通常將3D真實(shí)世界轉(zhuǎn)換為2D信息，這樣就丟失了運(yùn)動(dòng)信息和深度信息。現(xiàn)有的平面圖像傳感器陣列也限制了廣角相機(jī)的發(fā)展。

作者描述的器件很難在昏暗的光線下成像。需要重新設(shè)計(jì)以改善薄半導(dǎo)體的光吸收并增加探測(cè)光強(qiáng)范圍。此外，論文中提到的這種設(shè)計(jì)需要高電壓并消耗大量功耗。相比之下，生物神經(jīng)網(wǎng)絡(luò)中每項(xiàng)操作的能量消耗處于亞飛焦耳級(jí)（10?1?至10?13焦耳）。這有利于擴(kuò)展到紫外線和紅外光應(yīng)用，以捕獲可見光譜無法提供的信息。

所使用的薄半導(dǎo)體很難實(shí)現(xiàn)大面積地均勻生產(chǎn)，加工難度高，因此它們可以與硅電子器件集成在一起，例如用于讀出外部電路或反饋控制。使用這些傳感器的設(shè)備的速度和能效將不取決于圖像捕獲過程，而是取決于傳感器和外部電路之間的數(shù)據(jù)移動(dòng)。盡管傳感器計(jì)算單元在模擬域中收集和計(jì)算數(shù)據(jù)，減少了模數(shù)轉(zhuǎn)換，但外圍電路仍然遭受其它固有延遲的困擾。傳感器和外部電路需要共同開發(fā)，以減少整個(gè)系統(tǒng)的等待時(shí)間。

Mennel及其同事的“在傳感器中實(shí)現(xiàn)計(jì)算”系統(tǒng)會(huì)激發(fā)對(duì)人工智能（AI）硬件的進(jìn)一步研究。一些企業(yè)已經(jīng)開發(fā)了基于硅電子的AI視覺芯片，但是這些芯片的固有數(shù)字架構(gòu)無法解決延遲和功率效率問題。

更廣泛地講，作者的策略不僅限于視覺系統(tǒng)。它可以擴(kuò)展到用于聽覺、觸覺、熱感或嗅覺的其它物理參數(shù)輸入。此類智能系統(tǒng)的開發(fā)以及5G無線網(wǎng)絡(luò)的到來，會(huì)在將來允許進(jìn)行實(shí)時(shí)邊緣（低延遲）計(jì)算。

新聞資訊

公司新聞

行業(yè)新聞

圖像傳感器集成計(jì)算功能，賦能機(jī)器視覺技術(shù)

友情鏈接

新聞資訊

公司新聞

行業(yè)新聞

圖像傳感器集成計(jì)算功能，賦能機(jī)器視覺技術(shù)

圖像傳感器集成計(jì)算功能，賦能機(jī)器視覺技術(shù)