過去一年,AI硬件的主戰(zhàn)場不再只是“把大模型塞進手機”,而是開始爭奪更底層的東西:人們到底要用什么形態(tài)去接觸AI。
在這一過程中,誕生了許許多多的AI硬件產(chǎn)品,從AI耳機、AI眼鏡、AI手機到AI錄音筆、錄音卡片等。
一邊是無屏的、可穿戴的“新物種”,一邊是繼續(xù)以屏幕為中樞、把AI寫進系統(tǒng)底座的傳統(tǒng)終端升級。
我們把前一條路線統(tǒng)稱為“筆”:它不是指具體外形,而是泛指輕便、隨身、低存在感,以音頻/環(huán)境感知為主輸入,通常不帶有屏幕的AI硬件。
“筆”最激進的樣本,早在2024年就有人做過。Humane在那一年推出AI Pin,它被定義為可夾在衣服上的“可穿戴電腦”,主打讓用戶擺脫智能手機。
不過,該產(chǎn)品因延遲高、投影不可視、應用生態(tài)匱乏等問題遭遇大量差評,最終僅獲得約1萬筆訂單;Humane隨后也被惠普收購。
相比之下,更務實的“筆”正在從窄場景切入。以Plaud、釘釘A1、飛書錄音豆為代表的AI錄音硬件,強調會議、采訪等明確場景,通過隨身采集語音,再由大模型完成轉寫與總結。
這一方向的想象力,如今在OpenAI身上被進一步放大。
OpenAI已確認與前蘋果設計負責人Jony Ive展開硬件層面的合作,項目瞄準一種不同于手機與PC的新型AI設備,強調更自然的交互與更低的存在感,目前已知形態(tài)也被形容為“像一支筆”。
與“筆”并行的,是仍以屏幕為中樞的另一條路線。微軟將Copilot+PC定義為新一代PC形態(tài),并明確提出NPU算力門檻;Meta和各大手機廠商則持續(xù)在眼鏡、手機等終端上強化AI與顯示、系統(tǒng)的深度融合。
如果把這些現(xiàn)象放在一起,會看到一條清晰的分岔:新銳AI公司更愿意押注“筆”——無屏、貼身、輸入優(yōu)先;傳統(tǒng)互聯(lián)網(wǎng)/硬件公司更愿意押注“屏”——在既有形態(tài)的產(chǎn)品上,延伸顯示、系統(tǒng)與生態(tài)能力。
顯然,面對AI硬件這一品類,行業(yè)內(nèi)已經(jīng)出現(xiàn)了對交互成本、技術成熟度與商業(yè)化路徑的不同押注。
A
2025年,在一次公開對談中,OpenAI CEO奧特曼形容當下的數(shù)字生活“就像走在時代廣場”。
他表示,信息、推送和屏幕不斷爭奪注意力,而他們正在探索的AI硬件,目標恰恰相反——“更平靜(more calm),更少打擾(less distracting)”。
事實上,這一理念并不新鮮,卻在近兩年被重新提起。與其把AI塞進手機或PC,不如退回到更基礎的一層:先感知和連接世界本身。我們把這類設備概括為“筆型AI”——輕、貼身、低存在感;在產(chǎn)品邏輯上,它們的感知優(yōu)先級高于操作。
從行業(yè)視角看,當下概念中的“筆型AI”,并不在于替代手機或PC成為新的硬件入口,而在于爭奪個人與組織的第一手輸入權:語音、環(huán)境、視角,在相對無感的前提下,讓AI能夠持續(xù)接收并處理信息。
不過,在這一理念驅使下,過去幾年中卻未能孕育出成功打開市場的產(chǎn)品。
時間回到2024年,Humane推出的AI Pin、Rabbit的R1,都試圖成為“脫離手機的AI終端”,用語音或環(huán)境感知完成即時響應,甚至跨應用執(zhí)行任務。但最終,這些產(chǎn)品都反響平平,未能打開市場。
體驗差是最直接的結果。科技評測人Marques Brownlee在評測AI Pin時直言:“這是我評測過最差的產(chǎn)品之一——不是因為想法,而是因為它現(xiàn)在根本不能用?!?/p>
另一層原因是,當時端側算力還無法支撐復雜推理,大多數(shù)無屏設備延遲與中斷頻繁?!度A爾街日報》科技專欄作家Joanna Stern在對比體驗多款無屏AI設備時寫道,Humane AI Pin與Rabbit R1“更像科學項目,而不是成品”。她還在視頻測試中記錄到,Rabbit做一次“實時翻譯”用了四分鐘。
業(yè)內(nèi)對端側算力的衡量標準之一是NPU(神經(jīng)處理單元)性能。IDC等機構認為需超過30TOPS才基本滿足大語言模型推理能力,但截至2024年初,只有少數(shù)SoC達到這一門檻,如高通驍龍8 Gen 3與蘋果A17 Pro等。
而在一些更“垂”的場景里,“筆型AI”的定位迅速收縮,以記錄優(yōu)先的一批AI產(chǎn)品陸續(xù)面世。在中國市場,這種變化體現(xiàn)得尤為明顯,例如釘釘推出的A1錄音卡片,以及飛書與安克合作的AI錄音豆。
在海外市場,也出現(xiàn)了類似取向的產(chǎn)品,如Plaud的Note Pro。這類設備更關注把碎片化的語音、會議內(nèi)容和環(huán)境音轉成可檢索、結構化的語料,而不是即時對話或執(zhí)行任務。
a16z投資的AI硬件公司Limitless(前Rewind)也走向了類似取向。其創(chuàng)始人Dan Siroker在接受采訪時曾表示,他們“不是在做第二臺設備,而是在做記錄對話的基礎設施”。
不過,當“筆”的外延繼續(xù)擴展,矛盾也隨之升級。近年來,一些團隊開始嘗試把攝像頭引入耳機或頭戴設備,希望獲得更自然的第一視角輸入。這既意味著電池與算力需要重新分配,也在社會層面引發(fā)了對隱私邊界的擔憂。
技術分析師Avi Greengart在討論AI可穿戴趨勢時指出,消費者對隱私的期待“并沒有消失,但確實在發(fā)生位移”。人們愿意為便利讓渡部分邊界,卻仍對“被持續(xù)記錄”保持警惕。
也正是在這種背景下,OpenAI與Jony Ive團隊的硬件項目被視為“筆”的最大變量。OpenAI全球事務負責人Chris Lehane曾對外確認,公司計劃在2026年下半年展示首款硬件設備,其關注重點并不在顯示,而在更自然、更克制的環(huán)境感知。
Ive曾主導iPhone 4,開啟并定義了上一個智能手機時代。但在其設計生涯中,另一個被反復提及的產(chǎn)品是更簡單、克制的iPod。也許在未來OpenAI的硬件上,我們還能看到iPod的影子。
拋開Ive的“執(zhí)念”,“筆型AI”更像AI時代的傳感器層。它不直接替人做決定,以感知為第一優(yōu)先級,進而再驅動用戶的交互。但在一些以交互為先的場景中,“屏”的重要性似乎又不可替代。
B
與“筆型AI”試圖降低存在感不同,有屏的硬件陣營——不管是傳統(tǒng)的PC/手機,還是新銳產(chǎn)品——都在過去兩年中積極擁抱AI。
這條路線的分水嶺,可以說出現(xiàn)在AI從“應用能力”轉向“系統(tǒng)能力”的時刻。
2024年5月,微軟發(fā)布Copilot+PC,號稱是一次AI在操作系統(tǒng)層面的重構。官方文檔中指出,新一代Windows設備需要配備算力達到40+TOPS的NPU,部分AI能力將以“系統(tǒng)原生”的方式運行,而非通過獨立應用調用。
這一設計,本質上是在把AI融入到硬件的系統(tǒng)層。微軟消費業(yè)務負責人Yusuf Mehdi在發(fā)布中直言,這是“重新定義Windows電腦”的一次調整。
類似的邏輯,也出現(xiàn)在手機端。無論是蘋果、三星,還是小米、vivo等國產(chǎn)廠商,近年來都把AI能力直接下沉到系統(tǒng)層。
這表明在AI時代,屏幕仍然是信息展示、交易確認和權限授權的中樞。AI加持下的智能手機,擁有了與超級App爭搶“第一入口”的資本。
以字節(jié)此前與中興聯(lián)合推出的豆包手機助手為例,其定位并不是獨立應用,而是深度嵌入系統(tǒng)交互流程,參與搜索、寫作、日程、通知等多個環(huán)節(jié),并通過系統(tǒng)級入口重新分配用戶與信息、服務之間的關系。
當AI進入系統(tǒng)層,首先就被互聯(lián)網(wǎng)時代的同行視為“洪水猛獸”。早在2024年,微軟推出Recall功能,嘗試通過周期性記錄屏幕內(nèi)容,幫助用戶事后檢索信息。這一功能在發(fā)布初期即引發(fā)巨大爭議。
通信應用Signal率先公開反對,指出Recall在設計上未給予應用足夠的控制權,系統(tǒng)級截圖機制可能捕捉加密通信界面。隨后,一批工具宣布默認屏蔽Recall。
一年后的豆包手機助手上,類似的場景再次上演。社交、電商、金融等領域的頭部企業(yè),其旗下App紛紛屏蔽豆包手機助手。
可靠性,成為智能手機推進AI進化節(jié)奏的重要影響因素。去年,蘋果宣布將原計劃推出的Siri AI功能推遲至2026年。拋開蘋果自研模型水平落后這一原因,蘋果官方曾回應稱,這些功能尚未達到預期的可靠性標準。
在隨后的采訪中,蘋果全球市場負責人Greg Joswiak曾表示,蘋果不希望用戶接觸到“表現(xiàn)不穩(wěn)定的系統(tǒng)級能力”。而根據(jù)最新消息,蘋果計劃讓新版Siri使用由Google Gemini驅動的基礎模型,以提升語義理解與對話能力。
新版Siri能否進一步推動手機AI的邊界,仍需等到正式發(fā)布的那一天。
把視角轉向AI眼鏡,屏型路線的特征被進一步放大。眼鏡成為手機等終端屏幕形態(tài)的延伸,把信息展示轉移到用戶視野中。
Meta與Ray-Ban合作的AI眼鏡率先打開了市場,首先在語音、翻譯和基礎視覺理解等功能上跑通日常使用頻率,隨后在二代產(chǎn)品中引入光波導技術。而在Meta之前,Rokid、雷鳥、阿里夸克等企業(yè)也先后推出了帶有光波導可視技術的AI眼鏡。
不過,相比上一輪以“無顯示”為主的AI眼鏡,可視AI眼鏡在工程層面臨的挑戰(zhàn)并未緩解,反而更加集中地暴露出來。
Meta首席技術官Andrew Bosworth在談到Orion原型時直言,顯示部件的良率“糟糕得難以想象”。換言之,想要成為新時代的AI終端,AI眼鏡仍有不少工程問題有待突破。
事實上,在當前技術路徑中,光波導幾乎是唯一能夠在保證視野通透的同時,將信息疊加到現(xiàn)實世界中的方案。不過,直到今天,光波導的規(guī)模化量產(chǎn)仍是一個尚未解決的工程難題。
另一方面,技術路線的高度同質化,也影響著一些廠商對AI眼鏡的態(tài)度。近期,業(yè)內(nèi)一些傳聞又指向了字節(jié)將在近期發(fā)布AI眼鏡。但據(jù)XR Vision工作室推測,這款產(chǎn)品或將不會發(fā)售,字節(jié)或將直接開啟下一代產(chǎn)品的研發(fā)。
XR Vision的這一推測,源自當前AI眼鏡賽道“硬件同質化、功能趨同”的普遍困境,正如行業(yè)內(nèi)對vivo暫停AI眼鏡項目的評論所言,當下大廠在該賽道普遍謹慎,核心原因正是“很難做出差異化”。
在技術迭代需要更多時間的一背景下,屏型AI更像一場耐力賽。不管是AI手機還是AI眼鏡,都需要操作系統(tǒng)、硬件門檻和生態(tài)的持續(xù)整合。
C
拆解使用邏輯后,你會發(fā)現(xiàn)“筆”和“屏”并不是同一條路。想象一個很日常的場景:開會時,你只想把人說的話完整記??;散會后,你需要把重點寫進紀要、把任務派出去。在AI交互層面,前者需要“感受和采集”,后者需要“操作和訂正”。
是否讓AI參與決策,成為這場AI硬件分化背后的重要原因之一。有些場景可以不涉及決策、先行感知,但一旦進入決策環(huán)節(jié),交互邏輯就完全不同。
為什么“決策”必須更謹慎?復雜系統(tǒng)研究者梅拉妮·米切爾曾在采訪中表示,生成式模型容易在不同情境下表現(xiàn)出脆弱性與自相矛盾,因此人類必須保持監(jiān)督與編輯的角色。
翻譯成更直觀的話就是:模型可以幫你推進流程,但人必須能夠監(jiān)控這個過程,并且隨時介入和把控。這正是有屏AI硬件不可替代的一面。
在學術界,有一個概念被稱為“自動化偏差”——人們傾向于相信系統(tǒng)給出的建議,哪怕自己隱約覺得不對。
早在2000年,美國的一項實驗研究《問責機制與自動化偏差》就指出:當參與者被要求對整體表現(xiàn)或決策準確性“承擔責任”時,自動化偏差的發(fā)生率會下降。在AI時代,這意味著一旦結果需要追責,人就更需要一個可確認、可校驗的界面,而這恰恰是“屏”最擅長承擔的部分。
因此,“筆”與“屏”的路線之爭,本質上是AI硬件所對應場景分化的結果:貼身設備“筆”更像“感知與記憶外設”,負責持續(xù)采集信息;屏幕終端更像“編輯與執(zhí)行中樞”,強調任務的持續(xù)交互與可追蹤性。
不過,考慮到技術層面的不斷進化,“筆”的價值也許會在更長周期中體現(xiàn)出來。
全天候的理解和感知,使“筆”形態(tài)能夠為AI提供長期語料與上下文。換言之,建立在持續(xù)感知之上的技術,未來的“筆”可能會比“屏”更懂用戶。“筆”更契合AI時代的長期記憶,“屏”則更像一個工作臺。
斯坦福人類中心AI研究所曾提出,將人類與AI的交互設計放在算法核心,是確保系統(tǒng)可用且可信的關鍵,強調“算法不只是輸出結果,更要考慮人類如何理解與使用這些結果”。
本質上,“筆”和“屏”只是代表了這一邏輯中的兩種優(yōu)先級選擇:是優(yōu)先“長期記憶”,還是優(yōu)先“即時反饋”。
新銳AI公司希望跳出傳統(tǒng)交互邏輯,通過新的產(chǎn)品形態(tài)塑造新場景與新需求。這也是為什么在AI Pin失敗之后,業(yè)內(nèi)仍愿意期待OpenAI無屏方案的成果。
而在ToB領域,越來越多公司已經(jīng)不再試圖用一臺設備“包辦一切”。Plaud、釘釘、飛書將AI硬件定位為語音入口,已經(jīng)在垂直場景中驗證了“持續(xù)感知”的可行性。
事實上,“筆”和“屏”從來都不矛盾,它們更像產(chǎn)品設計中“不可能三角”的兩端:無感與便攜、可視與信息處理,以及穩(wěn)定輸出所需的續(xù)航與算力支持。
換言之,AI硬件對未來的定義不止一個。“筆”和“屏”陣營的邊界,或許會隨著技術迭代逐漸模糊。但在當下,“筆”形態(tài)的超級入口尚未真正出現(xiàn),通用AI在短期內(nèi)仍離不開傳統(tǒng)手機等“屏”設備作為算力終端。
它們最終究竟是替代還是協(xié)作的關系,AI企業(yè)與傳統(tǒng)硬件企業(yè),或許會在未來兩年內(nèi)給出答案。
特別聲明:本文為合作媒體授權DoNews專欄轉載,文章版權歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉載請聯(lián)系原作者及原出處獲取授權。(有任何疑問都請聯(lián)系idonews@donews.com)