| RK | 企業(yè) | iB+iF |
|---|---|---|
| 1 | 海康威視 | 93.86 |
| 2 | 阿里巴巴 | 92.77 |
| 3 | 商湯科技 | 92.15 |
| 4 | 騰訊 | 91.56 |
| 5 | 科大訊飛 | 91.03 |
| 6 | 華為 | 90.37 |
| 7 | 曠視科技 | 90.12 |
| 8 | 百度智能云 | 89.91 |
| 9 | 虹軟科技 | 89.14 |
| 10 | 大華股份 | 88.58 |
| 11 | 字節(jié)跳動 | 87.28 |
| 12 | 中科創(chuàng)達(dá) | 86.35 |
| 13 | 瑞為技術(shù) | 85.55 |
| 14 | 合合信息 | 84.72 |
| 15 | 云從科技 | 84.22 |
| 16 | 小米 | 83.81 |
| 17 | 捷通華聲 | 83.67 |
| 18 | 漢王科技 | 83.57 |
| 19 | 瑞聲科技 | 83.33 |
| 20 | 歌爾股份 | 82.51 |
| 21 | 格靈深瞳 | 82.18 |
| 22 | 宇視科技 | 81.81 |
| 23 | 四維圖新 | 81.42 |
| 24 | 至簡動力 | 81.08 |
| 25 | 微模式 | 80.44 |
| 26 | 云知聲 | 80.14 |
| 27 | 佳都科技 | 79.23 |
| 28 | 拓爾思 | 79.22 |
| 29 | 奧比中光 | 78.78 |
| 30 | 熵基科技 | 78.12 |
| 31 | 網(wǎng)易易盾 | 77.66 |
| 32 | 聲智科技 | 77.19 |
| 33 | 依圖科技 | 76.16 |
| 34 | 極視角 | 75.33 |
| 35 | 朗鏡科技 | 75.02 |
| 36 | 神思電子 | 74.73 |
| 37 | 匯頂科技 | 74.05 |
| 38 | 梅卡曼德 | 72.97 |
| 39 | 普強(qiáng)信息 | 72.81 |
| 40 | 星網(wǎng)信通 | 71.88 |
| 41 | 聲揚(yáng)科技 | 71.19 |
| 42 | 芯明智能 | 71.09 |
| 43 | 川大智勝 | 69.79 |
| 44 | 像素?cái)?shù)據(jù) | 68.95 |
| 45 | 瑞萊智慧 | 68.75 |
| 46 | 眼神科技 | 68.27 |
| 47 | 圖譜科技 | 67.83 |
| 48 | 中科視拓 | 67.46 |
| 49 | 馳聲科技 | 67.14 |
| 50 | 聲瀚科技 | 66.56 |
| 2026.04 DBC/CIW/eNet16 | ||
如果將智能體比作一個正在理解世界的生命體,那么感知層就是這個智能體的感官系統(tǒng)——眼睛所見的色彩、耳朵所聞的聲響、皮膚所觸的溫度,一切外部世界的原始信息都必須經(jīng)由感知層轉(zhuǎn)化為機(jī)器可以理解的信號。
沒有感知,就沒有認(rèn)知與決策,更談不上行動與交互。
感知層的核心任務(wù)可以概括為將外界環(huán)境中的物理刺激轉(zhuǎn)化為可供計(jì)算處理的結(jié)構(gòu)化數(shù)據(jù)。以視覺感知為例,攝像頭捕捉到的不過是像素矩陣,每個像素記錄著特定位置的光強(qiáng)與顏色值,但感知層需要從這些原始數(shù)值中識別出邊緣、紋理、形狀,進(jìn)而判斷其中是否存在人臉、車輛或路標(biāo)。聽覺感知同樣如此,麥克風(fēng)采集到的聲波波形本身并不包含語義,感知層必須通過頻譜分析、時(shí)頻變換等手段,將波形轉(zhuǎn)換為音素、詞匯乃至情感傾向。其它如觸覺、嗅覺、味覺等模態(tài)的感知也遵循類似的邏輯:將連續(xù)、模擬、多變的物理信號離散化、數(shù)字化、語義化。
當(dāng)下,多模態(tài)感知的融合是人工智能感知層研究的重要方向。多模態(tài)融合的關(guān)鍵在于解決異構(gòu)數(shù)據(jù)間的對齊與同步問題,以及設(shè)計(jì)合理的融合策略,不同的融合策略各有優(yōu)劣,基于注意力機(jī)制的動態(tài)融合方法已經(jīng)展現(xiàn)出極大地潛力,它允許模型根據(jù)輸入內(nèi)容自適應(yīng)地決定每個模態(tài)的貢獻(xiàn)權(quán)重,這在一定程度上模仿了人類根據(jù)情境切換注意力焦點(diǎn)的能力。
從更宏觀的視角看,感知層不僅是信息的入口,也是意義建構(gòu)的起點(diǎn)。一個智能體感知到什么,很大程度上決定了它認(rèn)為世界是什么樣的,進(jìn)而影響它決定做什么。這種感知-認(rèn)知-行動的閉環(huán)在具身智能的研究中得到了充分體現(xiàn)。
具身智能強(qiáng)調(diào)智能體必須擁有身體,并通過對物理世界的主動感知與交互來發(fā)展智能,感知不再是被動的信號接收,而是主動的探索過程,智能體可以移動視角來消除遮擋、調(diào)整焦距來查看細(xì)節(jié)、靠近物體來激活觸覺。這種主動感知策略極大地降低了感知問題的復(fù)雜度,因?yàn)橹悄荏w能夠通過行為來創(chuàng)造更有利的觀測條件。
從哲學(xué)的角度審視,人工智能感知層的本質(zhì)問題觸及了更古老的認(rèn)知論爭論:我們對外部世界的認(rèn)識是否可靠?機(jī)器感知系統(tǒng)的表征是否真實(shí)反映了物理世界的狀態(tài)?一切感知是否都是被建構(gòu)的幻覺?這些問題在對抗性攻擊、深度偽造等現(xiàn)實(shí)威脅面前顯得尤為緊迫,如果感知層可以被精心構(gòu)造的輸入欺騙,那么建立在其上的整個智能系統(tǒng)都將面臨安全風(fēng)險(xiǎn)。這促使研究者探索更具可解釋性、更符合物理規(guī)律的感知模型,試圖將先驗(yàn)知識與數(shù)據(jù)驅(qū)動的方法相結(jié)合。
結(jié)語
未來,人工智能感知層將繼續(xù)朝著更高精度、更強(qiáng)魯棒、更低延遲、更少監(jiān)督的方向演進(jìn),感知層的評價(jià)體系也將變得更加多元化與任務(wù)導(dǎo)向,不再單純追求單一基準(zhǔn)上的準(zhǔn)確率,而是綜合考慮樣本效率、魯棒性、可解釋性、公平性等多重維度。感知層的每一次突破,都意味著機(jī)器與世界之間又多了一扇溝通的窗口,而這扇窗口的清晰度與可靠性,最終決定了人工智能能否真正理解它所棲居的世界。
(文/陳皮)
e-Mail:lab@enet16.com