電子發燒友網報道(文/李彎彎)隨著技術發展,AI應用將會無處不在,AI芯片作為支撐算力的基石,具有至關重要的作用。然而在傳統的馮諾依曼架構下,AI芯片功耗大,算力利用率低。為了解決這些問題,業界積極探索新的架構形式。
在這樣的背景下,九天睿芯獨創的模擬感知前處理+數模混合存內計算的感存算一體架構,可以在成本極低的情況下,將芯片的功耗降到uW級別。基于此全新的架構,九天睿芯的研發團隊設計了多款芯片,并且已經實現量產應用。
功耗只有其他芯片產品的十分之一
九天睿芯片成立于2018年,專注神經擬態感存算一體芯片研發。公司創始人劉洪杰博士從事神經仿生工程領域的科研研發工作多年,圍繞類腦芯片和視覺處理芯片,已發表數篇國際一流會議/期刊論文,是事件及幀融合處理芯片發明人以及6T SRAM存內計算發明人。
團隊核心成員畢業于瑞士聯邦理工、新加坡南洋理工大學、清華大學、北京大學、電子科技大學等,并曾就職于華為、IMEC、高通、騰訊等名企/單位,在芯片設計開發、神經網絡及計算架構領域研發經驗超過十年,在頂級會議和期刊上發表文章。
該公司推出的第一代芯片ADA100,可應用于語音命令詞識別、人聲監測、噪聲環境識別,以及角速度傳感器的識別和處理等。該芯片已經于今年5月量產,現在已經應用于TWS耳機、手表、助聽器等可穿戴產品中,以及照明、開關、遙控器等IoT領域。
九天睿芯感存算一體芯片有一個很大的特點,就是具有超低的功耗。該公司銷售總監袁野在接受電子發燒友采訪的時候表示:“ADA100在KWS語音識別等應用上,功耗都可以保持在微安級別(70-150微安)。公司的芯片功耗,與同行產品相比只有其十分之一。同時在成本方面,同樣芯片的算力,也只有數字芯片的三分之一。”
為什么功耗可以做到如此低?據袁野介紹,可以分為兩部分來看:第一,九天睿芯的芯片采用的是感存算一體架構。在前端就有一個模擬的處理單元,可以對感知信號進行特征提取,再傳輸給ADC進行數據轉換。也就是說,轉換的不是所有感知到的信號,而只是特征信號,這樣轉換的數據量,就只有原始數據的十分之一,甚至是二十分之一。
而本身ADC進行數據轉換,在整個芯片里面的功耗占比就很高,當它的功耗大幅降低的話,整個芯片的功耗也就會有很大幅度的下降。
第二,九天睿芯的芯片,在后端計算部分采用的是基于SRAM的存內計算。存內計算,也就是在存儲內直接做計算,減少了數據搬運,功耗會比傳統的馮諾依曼架構降低很多。九天睿芯基于SRAM的存內計算的芯片,與傳統的數字NPU相比,功耗只有其五分之一。
這樣,從前端的數模轉換到后端的計算,功耗都很低,整個芯片的功耗也就非常低了。
在商用進程方面,目前九天睿芯已經與歌爾等六家企業合作,合封智能麥克風,即基于九天睿芯第一代芯片ADA100的裸Die,與上述幾家公司的MEMS,合封在一個基板上,做成智能麥克風,讓其可以實現語音識別功能。現在與這幾家合作的智能麥克風都已經合封完成,測試也已經通過,將會在今年11月份左右進行大批量生產。
另外ADA100單獨芯片的應用,也已經在華為、小米、OPPO等廠商推廣,目前都處于DEMO測試階段。在其他客戶的合作方面,ADA100已經接到100多萬pieces的訂單,預計將在今年11月份左右完成初期交付。公司計劃明年能達到千萬級出貨,在更多產品中實現應用。
九天睿芯感存算一體,超低功耗、低成本的特性,切實地在幫助客戶解決面臨的痛點問題。比如,在助聽器上的應用。現在的助聽器,主要有兩個模式:一個是需要去醫院適配,調好增益幅度,給老人帶上。但是大部分老人,當時的感受跟平時的感受可能不一樣,佩戴的時候其實并不舒服,可能增益開太大了,但是他又沒有辦法做調整。
另一個是比較新的一種助聽器,用的是藍牙主控跟手機連接,通過APP調節它的增益狀態,如果覺得聲音大,就調小一點。不過它也有一個痛點,就是很多老年人,操作智能手機并不熟練,需要年輕人幫他先調好。同樣的問題是,在調的時候用的舒服,并不代表他一直用著舒服,比如他現在在外面,環境吵,而它的增益還是開很大,就會對耳朵有損傷。
所以,現在所有新興的助聽器客戶都會提出,在內部增加一顆環境噪聲識別感知的芯片,幫助助聽器自適應的調節增益幅度。比如說,外面比較安靜的時候,增益就可以開大一點,讓用戶可以聽得更清楚。外面聲音很吵的話,就可以把降噪開大一些,屏蔽噪聲,把人聲放大。
袁野向電子發燒友介紹:“我們的芯片可以感知到外部環境的變化,之后推送一個指令給主控,主控再自適應地調節它的降噪和增益幅度,這樣就可以實現,老年人佩戴的智能化,體驗會更好。這算是助聽器真正意義上的智能化升級。”
九天睿芯在與客戶交流的時候發現,這些助聽器的廠商普遍認為,他們的助聽器產品迫切需要這個功能。而且更重要的是,對于助聽器產品來說,超低功耗是剛需,不然的話,電量堅持不了24小時也很麻煩。九天睿芯芯片超低功耗特性的作用在這里就很好的體現出來了。
一款可直接連接事件相機單獨存在的SoC
除了第一代ADA100,九天睿已經規劃設計了多款產品,包括第二代芯片ADA200,第三代芯片ADA300,以及一顆高性能ADC產品。其中ADA200已經流片成功,ADA300在規劃中。
ADA200同樣是采用數模混合+存內計算的架構模式,不過與ADA100不同的是,ADA200算力更大,可以達到4-10TOPS。九天睿芯市場總監Johney Lu向電子發燒友介紹:“到了這么高算力后,ADA200就可以接大量的視覺及其他傳感器,比如傳統的CIS、雷達,以及事件相機(DVS)。同時可以接多路(4路或者8路)的視覺信號。”
這顆芯片可以有好幾種用法:一是作為單獨的邊緣計算SoC,成為一個相機模組,或者一個單獨運作的產品;二是在AR/VR上做協處理器,完成一些功能,比如做slam,ISP的圖像增色、渲染;三是做不同傳感器接入時的處理和預處理,還可以接事件相機,目前在市面上,九天睿芯是唯一可以直接接事件相機的單獨存在的SoC。
基于此,也就可以面向三個市場:一是在汽車上,做碰撞預警,或鬼探頭等視覺的邊緣計算;二是在AR/VR上做協處理器;三是在IoT產品上作為獨立存在的SoC。
上面提到的事件相機(Event Camera),也稱神經形態像機,或動態視覺傳感器(DVS,Dynamic Vision Sensor),是一種能夠響應局部亮度變化的成像傳感器。事件相機不像常規相機那樣使用快門捕獲圖像。相反,事件相機中的每個像素都獨立且異步地運行,并在發生亮度變化時輸出這些變化,否則保持沉默。
據Johney Lu介紹,事件相機有幾個很典型的特點:一是它的動態范圍非常高,可以達到140dB;二是因為它只輸出有效信息,不輸出無效信息,它的數據量非常小;三是它的速度非常快,可以達到1/10000s,甚至更高。
因為這三個特點,行業普遍認為,事件相機可以應用于在汽車上做鬼探頭或者碰撞預警。自動駕駛是未來的必然趨勢,如今乘用車基本還處在L2自動駕駛階段,現在已經有很多廠商在做碰撞預警,不過相對來說,它還不是必須的功能。然而到L3/L4之后,基本就不需要駕駛員參與了,汽車需要自己去駕駛,這時候汽車都需要具備碰撞預警功能。在低光照、或者突發狀況下,汽車需要依靠各種傳感器、計算芯片,以及各種算法,自己進行處理。
然而問題是,對于L3/L4自動駕駛來說,還是有5%-15%的corner case,傳統視覺非常難以處理,事件相機卻沒有問題。相對來說,在低光照下,高動態范圍,或者突發事件的情況下,事件相機的效果會比傳統視覺好很多。
目前市面上已經有事件相機產品量產,比如索尼。而九天睿芯的ADA200是一款可以直接事件相機的單獨存在的SoC。Johney Lu表示:“我們的SoC可以和傳感器廠商的事件相機一起,幫助汽車在L3之后的自動駕駛階段,實現對這5%-15%的corner case的處理。”
這是在汽車上面的應用,目前九天睿芯已經與國內外幾家主流車企達成合作。另外在AR/VR上面的應用,ADA200可用來做視覺上的slam,接RGB或DVS做眼球追蹤。完成定位、手勢識別,還有多重不同傳感器的融合等功能。
現在一些主流的AR/VR公司對這方面都非常感興趣,包括Meta。現在的趨勢是,用主芯片加一顆協處理器,來解決AR/VR上所有傳感器的融合。很多時候,主芯片的迭代速度比較慢,沒有辦法引入最新的技術,而協處理器迭代比較快,正好可以解決這個問題。另外協處理器也分擔主芯片的功能,降低它的功耗和成本。
九天睿芯規劃中的ADA300,算力將會更大,可以達到24TOPS以上,可以作為一顆主芯片SoC,應用在非常多的場景中。并且ADA300可以和很多大廠合作,做成超大算力的產品。
Johney Lu表示,很多大廠非常認可,存內計算+數模混合這樣的架構,面效比、能效比都比較有優勢,因此九天睿芯會以存內計算的IP、以及design一部分的方式跟大廠合作。
除了ADA100、ADA200、ADA300三款產品,九天睿芯還有一顆激光雷達ADC,已經流片成功,會在明年實現量產。
小結
整體來看,九天睿芯創新架構的特性非常明顯,芯片產品功耗低、面積小、成本低,在可穿戴、AR/VR、自動駕駛上都有其獨特的優勢,因此獲得了不同領域客戶的認可。ADA100今年會逐漸在更多產品中應用,隨著明年ADA200、ADC的量產,基于九天睿芯創新架構的芯片產品,將會更多更好的服務于各個行業和客戶。
在這樣的背景下,九天睿芯獨創的模擬感知前處理+數模混合存內計算的感存算一體架構,可以在成本極低的情況下,將芯片的功耗降到uW級別。基于此全新的架構,九天睿芯的研發團隊設計了多款芯片,并且已經實現量產應用。
功耗只有其他芯片產品的十分之一
九天睿芯片成立于2018年,專注神經擬態感存算一體芯片研發。公司創始人劉洪杰博士從事神經仿生工程領域的科研研發工作多年,圍繞類腦芯片和視覺處理芯片,已發表數篇國際一流會議/期刊論文,是事件及幀融合處理芯片發明人以及6T SRAM存內計算發明人。
團隊核心成員畢業于瑞士聯邦理工、新加坡南洋理工大學、清華大學、北京大學、電子科技大學等,并曾就職于華為、IMEC、高通、騰訊等名企/單位,在芯片設計開發、神經網絡及計算架構領域研發經驗超過十年,在頂級會議和期刊上發表文章。
該公司推出的第一代芯片ADA100,可應用于語音命令詞識別、人聲監測、噪聲環境識別,以及角速度傳感器的識別和處理等。該芯片已經于今年5月量產,現在已經應用于TWS耳機、手表、助聽器等可穿戴產品中,以及照明、開關、遙控器等IoT領域。
九天睿芯感存算一體芯片有一個很大的特點,就是具有超低的功耗。該公司銷售總監袁野在接受電子發燒友采訪的時候表示:“ADA100在KWS語音識別等應用上,功耗都可以保持在微安級別(70-150微安)。公司的芯片功耗,與同行產品相比只有其十分之一。同時在成本方面,同樣芯片的算力,也只有數字芯片的三分之一。”
為什么功耗可以做到如此低?據袁野介紹,可以分為兩部分來看:第一,九天睿芯的芯片采用的是感存算一體架構。在前端就有一個模擬的處理單元,可以對感知信號進行特征提取,再傳輸給ADC進行數據轉換。也就是說,轉換的不是所有感知到的信號,而只是特征信號,這樣轉換的數據量,就只有原始數據的十分之一,甚至是二十分之一。
而本身ADC進行數據轉換,在整個芯片里面的功耗占比就很高,當它的功耗大幅降低的話,整個芯片的功耗也就會有很大幅度的下降。
第二,九天睿芯的芯片,在后端計算部分采用的是基于SRAM的存內計算。存內計算,也就是在存儲內直接做計算,減少了數據搬運,功耗會比傳統的馮諾依曼架構降低很多。九天睿芯基于SRAM的存內計算的芯片,與傳統的數字NPU相比,功耗只有其五分之一。
這樣,從前端的數模轉換到后端的計算,功耗都很低,整個芯片的功耗也就非常低了。
在商用進程方面,目前九天睿芯已經與歌爾等六家企業合作,合封智能麥克風,即基于九天睿芯第一代芯片ADA100的裸Die,與上述幾家公司的MEMS,合封在一個基板上,做成智能麥克風,讓其可以實現語音識別功能。現在與這幾家合作的智能麥克風都已經合封完成,測試也已經通過,將會在今年11月份左右進行大批量生產。
另外ADA100單獨芯片的應用,也已經在華為、小米、OPPO等廠商推廣,目前都處于DEMO測試階段。在其他客戶的合作方面,ADA100已經接到100多萬pieces的訂單,預計將在今年11月份左右完成初期交付。公司計劃明年能達到千萬級出貨,在更多產品中實現應用。
九天睿芯感存算一體,超低功耗、低成本的特性,切實地在幫助客戶解決面臨的痛點問題。比如,在助聽器上的應用。現在的助聽器,主要有兩個模式:一個是需要去醫院適配,調好增益幅度,給老人帶上。但是大部分老人,當時的感受跟平時的感受可能不一樣,佩戴的時候其實并不舒服,可能增益開太大了,但是他又沒有辦法做調整。
另一個是比較新的一種助聽器,用的是藍牙主控跟手機連接,通過APP調節它的增益狀態,如果覺得聲音大,就調小一點。不過它也有一個痛點,就是很多老年人,操作智能手機并不熟練,需要年輕人幫他先調好。同樣的問題是,在調的時候用的舒服,并不代表他一直用著舒服,比如他現在在外面,環境吵,而它的增益還是開很大,就會對耳朵有損傷。
所以,現在所有新興的助聽器客戶都會提出,在內部增加一顆環境噪聲識別感知的芯片,幫助助聽器自適應的調節增益幅度。比如說,外面比較安靜的時候,增益就可以開大一點,讓用戶可以聽得更清楚。外面聲音很吵的話,就可以把降噪開大一些,屏蔽噪聲,把人聲放大。
袁野向電子發燒友介紹:“我們的芯片可以感知到外部環境的變化,之后推送一個指令給主控,主控再自適應地調節它的降噪和增益幅度,這樣就可以實現,老年人佩戴的智能化,體驗會更好。這算是助聽器真正意義上的智能化升級。”
九天睿芯在與客戶交流的時候發現,這些助聽器的廠商普遍認為,他們的助聽器產品迫切需要這個功能。而且更重要的是,對于助聽器產品來說,超低功耗是剛需,不然的話,電量堅持不了24小時也很麻煩。九天睿芯芯片超低功耗特性的作用在這里就很好的體現出來了。
一款可直接連接事件相機單獨存在的SoC
除了第一代ADA100,九天睿已經規劃設計了多款產品,包括第二代芯片ADA200,第三代芯片ADA300,以及一顆高性能ADC產品。其中ADA200已經流片成功,ADA300在規劃中。
ADA200同樣是采用數模混合+存內計算的架構模式,不過與ADA100不同的是,ADA200算力更大,可以達到4-10TOPS。九天睿芯市場總監Johney Lu向電子發燒友介紹:“到了這么高算力后,ADA200就可以接大量的視覺及其他傳感器,比如傳統的CIS、雷達,以及事件相機(DVS)。同時可以接多路(4路或者8路)的視覺信號。”
這顆芯片可以有好幾種用法:一是作為單獨的邊緣計算SoC,成為一個相機模組,或者一個單獨運作的產品;二是在AR/VR上做協處理器,完成一些功能,比如做slam,ISP的圖像增色、渲染;三是做不同傳感器接入時的處理和預處理,還可以接事件相機,目前在市面上,九天睿芯是唯一可以直接接事件相機的單獨存在的SoC。
基于此,也就可以面向三個市場:一是在汽車上,做碰撞預警,或鬼探頭等視覺的邊緣計算;二是在AR/VR上做協處理器;三是在IoT產品上作為獨立存在的SoC。
上面提到的事件相機(Event Camera),也稱神經形態像機,或動態視覺傳感器(DVS,Dynamic Vision Sensor),是一種能夠響應局部亮度變化的成像傳感器。事件相機不像常規相機那樣使用快門捕獲圖像。相反,事件相機中的每個像素都獨立且異步地運行,并在發生亮度變化時輸出這些變化,否則保持沉默。
據Johney Lu介紹,事件相機有幾個很典型的特點:一是它的動態范圍非常高,可以達到140dB;二是因為它只輸出有效信息,不輸出無效信息,它的數據量非常小;三是它的速度非常快,可以達到1/10000s,甚至更高。
因為這三個特點,行業普遍認為,事件相機可以應用于在汽車上做鬼探頭或者碰撞預警。自動駕駛是未來的必然趨勢,如今乘用車基本還處在L2自動駕駛階段,現在已經有很多廠商在做碰撞預警,不過相對來說,它還不是必須的功能。然而到L3/L4之后,基本就不需要駕駛員參與了,汽車需要自己去駕駛,這時候汽車都需要具備碰撞預警功能。在低光照、或者突發狀況下,汽車需要依靠各種傳感器、計算芯片,以及各種算法,自己進行處理。
然而問題是,對于L3/L4自動駕駛來說,還是有5%-15%的corner case,傳統視覺非常難以處理,事件相機卻沒有問題。相對來說,在低光照下,高動態范圍,或者突發事件的情況下,事件相機的效果會比傳統視覺好很多。
目前市面上已經有事件相機產品量產,比如索尼。而九天睿芯的ADA200是一款可以直接事件相機的單獨存在的SoC。Johney Lu表示:“我們的SoC可以和傳感器廠商的事件相機一起,幫助汽車在L3之后的自動駕駛階段,實現對這5%-15%的corner case的處理。”
這是在汽車上面的應用,目前九天睿芯已經與國內外幾家主流車企達成合作。另外在AR/VR上面的應用,ADA200可用來做視覺上的slam,接RGB或DVS做眼球追蹤。完成定位、手勢識別,還有多重不同傳感器的融合等功能。
現在一些主流的AR/VR公司對這方面都非常感興趣,包括Meta。現在的趨勢是,用主芯片加一顆協處理器,來解決AR/VR上所有傳感器的融合。很多時候,主芯片的迭代速度比較慢,沒有辦法引入最新的技術,而協處理器迭代比較快,正好可以解決這個問題。另外協處理器也分擔主芯片的功能,降低它的功耗和成本。
九天睿芯規劃中的ADA300,算力將會更大,可以達到24TOPS以上,可以作為一顆主芯片SoC,應用在非常多的場景中。并且ADA300可以和很多大廠合作,做成超大算力的產品。
Johney Lu表示,很多大廠非常認可,存內計算+數模混合這樣的架構,面效比、能效比都比較有優勢,因此九天睿芯會以存內計算的IP、以及design一部分的方式跟大廠合作。
除了ADA100、ADA200、ADA300三款產品,九天睿芯還有一顆激光雷達ADC,已經流片成功,會在明年實現量產。
小結
整體來看,九天睿芯創新架構的特性非常明顯,芯片產品功耗低、面積小、成本低,在可穿戴、AR/VR、自動駕駛上都有其獨特的優勢,因此獲得了不同領域客戶的認可。ADA100今年會逐漸在更多產品中應用,隨著明年ADA200、ADC的量產,基于九天睿芯創新架構的芯片產品,將會更多更好的服務于各個行業和客戶。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
自動駕駛
+關注
關注
784文章
13920瀏覽量
166794 -
可穿戴
+關注
關注
4文章
762瀏覽量
85485 -
存算一體
+關注
關注
0文章
103瀏覽量
4315
發布評論請先 登錄
相關推薦
存算一體行業2024年回顧與2025年展望
2024年,大模型技術的迅猛發展成為人工智能領域的核心驅動力,其對硬件算力和存儲效率的極致需求,促使存算一體技術在全球范圍內迎來前所未有的關注與突破。隨著模型參數規模的持續膨脹和應用場
開源芯片系列講座第24期:基于SRAM存算的高效計算架構
鷺島論壇開源芯片系列講座第24期「基于SRAM存算的高效計算架構」明晚(27日)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目基于SRAM存
存算一體架構創新助力國產大算力AI芯片騰飛
在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《存算一體架構創新助力國產大
科技新突破:首款支持多模態存算一體AI芯片成功問世
存算一體介質,通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統架構下的AI芯片相比,該款芯片在算力、能效
發表于 09-26 13:51
?454次閱讀
SynSense時識科技攜手蘇黎世聯邦理工發布Speck超低功耗眼動追蹤應用新突破
近日,SynSense時識科技與蘇黎世聯邦理工學院聯合研究成果在2024 CVPR Workshop發布。該研究是—項基于“感算一體”動態視覺智能SoC Speck的超低功耗眼動追蹤技
FPGA在自動駕駛領域有哪些優勢?
對實時性要求極高,任何延遲都可能導致安全事故。FPGA的硬件特性使得其能夠實現極低的延遲,確保自動駕駛系統能夠實時響應環境變化并做出正確的決策。
高能效比:
盡管FPGA的功耗相對于一些專用處理器可能
發表于 07-29 17:11
FPGA在自動駕駛領域有哪些應用?
FPGA(Field-Programmable Gate Array,現場可編程門陣列)在自動駕駛領域具有廣泛的應用,其高性能、可配置性、低功耗和低延遲等特點為自動駕駛的實現提供了強有力的支持。以下
發表于 07-29 17:09
后摩智能推出邊端大模型AI芯片M30,展現出存算一體架構優勢
了基于M30芯片的智算模組(SoM)和力謀??AI加速卡。 ? 后摩智能存算一體架構芯片產品 ? 后摩智能是
知存科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘
晶體管的存內計算在深度學習應用中的效用。相較于傳統馮諾伊曼架構的傳統方案,PRIME可以實現功耗降低約20倍、速度提升約50倍,引起產業界廣泛關注。隨著人工智能等大數據應用的興起,存
發表于 05-16 16:38
探索存內計算—基于 SRAM 的存內計算與基于 MRAM 的存算一體的探究
本文深入探討了基于SRAM和MRAM的存算一體技術在計算領域的應用和發展。首先,介紹了基于SRAM的存內邏輯計算技術,包括其原理、優勢以及在神經網絡領域的應用。其次,詳細討論了基于MR
知存科技攜手北大共建存算一體化技術實驗室,推動AI創新
揭牌儀式結束后,王紹迪在北大集成電路學院舉辦的“未名·芯”論壇上做了主題演講,分享了他對于多模態大模型時代存內計算發展的見解。他強調了存算一體在人工智能領域的重要性及其未來發展趨勢。
未來已來,多傳感器融合感知是自動駕駛破局的關鍵
駕駛的關鍵的是具備人類的感知能力,多傳感器融合感知正是自動駕駛破局的關鍵。昱感微的雷視一體多傳感器融合方案就好像一雙比人眼更敏銳的眼睛,可以
發表于 04-11 10:26
自動駕駛已成現實?賽思時間同步服務器賦能北京市高級別自動駕駛示范區,為自動駕駛提供中國方案
化”高級別自動駕駛示范區。自動駕駛作為國際科技一直在嘗試鉆研突破的難題,“車路云一體化”就是我國最先提出的“中國方案”。3月1
評論