2026-03-26 15:49:58
人工智能領(lǐng)域術(shù)語“token”因使用頻率大增且缺乏統(tǒng)一中文定名,導(dǎo)致譯法混亂。全國科學(xué)技術(shù)名詞審定委員會(huì)推薦“詞元”作為標(biāo)準(zhǔn)譯名,解決了這一問題。本文將從token中文名的備選方案、“詞元”譯名的信達(dá)雅水準(zhǔn),以及由“詞元”延伸出的多元暢想三個(gè)維度,深入剖析這一科技術(shù)語定名背后的深意與價(jià)值。
在人工智能技術(shù)飛速滲透日常生活與產(chǎn)業(yè)發(fā)展的當(dāng)下,一個(gè)原本僅活躍于專業(yè)技術(shù)圈層的英文術(shù)語——token,憑借其在大語言模型、多模態(tài)生成、AI算力計(jì)費(fèi)等核心場景的關(guān)鍵作用,使用頻率呈爆炸式增長,迅速破圈成為社會(huì)大眾耳熟能詳?shù)臒嵩~。
從日常使用AI聊天、文案生成,到企業(yè)布局AI產(chǎn)業(yè)、測算技術(shù)成本,再到學(xué)術(shù)領(lǐng)域開展人工智能研究、交流技術(shù)成果,token無處不在,卻因長期缺乏統(tǒng)一規(guī)范的中文定名,出現(xiàn)了譯法混亂、概念混淆、溝通成本居高不下等問題,不僅困擾著行業(yè)從業(yè)者與科研人員,也讓普通民眾在接觸AI相關(guān)知識(shí)時(shí)頻頻產(chǎn)生認(rèn)知障礙。
針對(duì)這一社會(huì)關(guān)切,全國科學(xué)技術(shù)名詞審定委員會(huì)責(zé)成第四屆計(jì)算機(jī)科學(xué)技術(shù)名詞審定委員會(huì)快速啟動(dòng)科技新詞審定發(fā)布流程,經(jīng)過多輪專業(yè)研討、廣泛征集各界意見,最終優(yōu)先推薦“詞元”作為人工智能領(lǐng)域token的標(biāo)準(zhǔn)中文名并面向全社會(huì)發(fā)布試用。這一舉措不僅終結(jié)了token中文譯名的混亂局面,更成為我國人工智能領(lǐng)域術(shù)語規(guī)范化、本土化的重要里程碑。本文將從token中文名的備選方案、“詞元”譯名的信達(dá)雅水準(zhǔn),以及由“詞元”延伸出的多元暢想三個(gè)維度,深入剖析這一科技術(shù)語定名背后的深意與價(jià)值。
在“詞元”成為官方推薦定名之前,人工智能領(lǐng)域的token因跨學(xué)科、多場景的應(yīng)用屬性,衍生出了十余種中文備選譯法,這些譯法分布在學(xué)術(shù)研究、產(chǎn)業(yè)應(yīng)用、大眾科普等不同場景,各有側(cè)重卻也各有短板。
(一)令牌、記號(hào)、標(biāo)記
這是token最基礎(chǔ)的直譯譯法,源于token在計(jì)算機(jī)編譯原理、網(wǎng)絡(luò)安全、身份驗(yàn)證領(lǐng)域的傳統(tǒng)含義,指用于驗(yàn)證身份、傳遞權(quán)限的標(biāo)識(shí)符號(hào)。在早期AI系統(tǒng)的權(quán)限管理、接口調(diào)用場景中,這一譯法被少量使用,但在當(dāng)前大模型核心場景中,完全脫離了token作為“語言處理最小單元、AI計(jì)算基礎(chǔ)載體”的核心內(nèi)涵,極易與網(wǎng)絡(luò)安全領(lǐng)域的概念混淆,無法適配人工智能自然語言處理的專業(yè)屬性,屬于場景錯(cuò)配的譯法。
(二)代幣、通證
該譯法源自區(qū)塊鏈、加密貨幣領(lǐng)域,是token在Web3場景中的常用譯名,強(qiáng)調(diào)其價(jià)值載體、流通憑證的屬性。隨著AI產(chǎn)業(yè)商業(yè)化發(fā)展,token逐漸成為AI算力、模型調(diào)用的計(jì)費(fèi)單位,部分人沿用這一譯法,但它過度聚焦商業(yè)價(jià)值屬性,忽略了token在AI技術(shù)層面的語言學(xué)、計(jì)算學(xué)本質(zhì),且?guī)в袕?qiáng)烈的加密貨幣行業(yè)標(biāo)簽,與人工智能核心技術(shù)場景格格不入,極易誤導(dǎo)大眾對(duì)AI技術(shù)基礎(chǔ)概念的認(rèn)知。
(三)語元、詞符、字元
這類譯法偏向語言學(xué)與自然語言處理專業(yè)視角,“語元”側(cè)重語言層面的基礎(chǔ)單元,覆蓋面過寬,無法精準(zhǔn)對(duì)應(yīng)AI模型處理的文本最小單位;“詞符”僅強(qiáng)調(diào)符號(hào)屬性,缺失“基礎(chǔ)單元、不可再分”的核心技術(shù)內(nèi)涵;“字元”局限于單字層面,無法覆蓋AI詞元化處理中的子詞、短語、標(biāo)點(diǎn)、數(shù)字等多種形態(tài),適用范圍過于狹窄,難以適配大模型多樣化的詞元分割邏輯。
(四)智元、模元、數(shù)元
這是結(jié)合人工智能技術(shù)特性提出的創(chuàng)新譯法,“智元”突出AI的智能屬性,“模元”關(guān)聯(lián)大模型、多模態(tài)概念,“數(shù)元”側(cè)重?cái)?shù)據(jù)單元屬性。這類譯法試圖貼合AI技術(shù)的前沿性,但過于抽象且缺乏語言學(xué)根基,token的核心起源是自然語言處理,脫離“語言”這一本源的譯法,無法銜接計(jì)算語言學(xué)的學(xué)術(shù)傳統(tǒng),也難以讓行業(yè)快速接受,同時(shí)通用性不足,無法覆蓋文本、語音、圖像等多模態(tài)token的統(tǒng)一表述。
(五)分詞單元、詞例、形符
“分詞單元”屬于描述性譯法,過于冗長,不符合科技術(shù)語簡潔凝練的要求,不利于傳播與使用;“詞例”“形符”是傳統(tǒng)語料庫語言學(xué)中的專業(yè)譯法,僅能體現(xiàn)文本形式的實(shí)例屬性,無法涵蓋token在AI模型中作為計(jì)算單元、算力載體、生成單位的多重功能,適用場景局限于傳統(tǒng)語言學(xué)研究,無法適配人工智能產(chǎn)業(yè)化、工程化的發(fā)展需求。
梳理上述這些備選譯法,既能看清術(shù)語定名的復(fù)雜過程,也能理解“詞元”當(dāng)選的科學(xué)性與合理性。將token譯為“詞元”,并非簡單的文字對(duì)應(yīng),而是深度兼顧技術(shù)本質(zhì)、語言邏輯與文化內(nèi)涵。我國近代翻譯家嚴(yán)復(fù)提出的“信、達(dá)、雅”三字標(biāo)準(zhǔn),歷來是翻譯領(lǐng)域的黃金準(zhǔn)則,尤其對(duì)于科技術(shù)語而言,“信”是基礎(chǔ)、“達(dá)”是關(guān)鍵、“雅”是升華,三者兼具才能成為合格的專業(yè)術(shù)語。在眾多譯法中,“詞元”脫穎而出,完全達(dá)到了“信、達(dá)、雅”的理想境界,成為科技術(shù)語翻譯的典范。
(一)信:準(zhǔn)確忠實(shí),還原技術(shù)本質(zhì)
“信”即譯文準(zhǔn)確無誤,忠實(shí)于原文的核心含義與專業(yè)內(nèi)涵,不偏離、不增刪、不誤導(dǎo)。token在人工智能領(lǐng)域的核心定義是“大模型處理的最小語言/信息單元,是模型理解、生成、計(jì)算內(nèi)容的基礎(chǔ)載體”,“詞元”二字精準(zhǔn)對(duì)應(yīng)這一定義,無任何語義偏差。
“詞”忠實(shí)于token的語言學(xué)起源,明確其作為語言符號(hào)的屬性,避免了脫離本源的泛化翻譯;“元”忠實(shí)于其“最小基礎(chǔ)單元”的技術(shù)本質(zhì),清晰傳遞出不可再分、核心載體的核心特征,相比其他備選譯法的片面性、誤導(dǎo)性,“詞元”完整且準(zhǔn)確地還原了token在AI領(lǐng)域的專屬含義,既不照搬其他領(lǐng)域的舊譯,也不盲目創(chuàng)新,完全符合科技術(shù)語“精準(zhǔn)嚴(yán)謹(jǐn)”的核心要求,做到了對(duì)專業(yè)內(nèi)涵的絕對(duì)忠實(shí)。
(二)達(dá):通順曉暢,適配場景需求
“達(dá)”即譯文通順流暢,符合目標(biāo)語言的表達(dá)習(xí)慣,適配使用場景的溝通需求,便于理解與傳播?!霸~元”作為雙音節(jié)中文詞匯,完全契合現(xiàn)代漢語的表達(dá)邏輯,無論是口語交流還是書面寫作,都簡潔易懂、毫無晦澀感,既適合科研人員撰寫論文、產(chǎn)業(yè)人士交流業(yè)務(wù),也適合普通大眾理解AI相關(guān)知識(shí),打破了專業(yè)術(shù)語與大眾認(rèn)知之間的壁壘。
同時(shí),“詞元”的適配性極強(qiáng),能無縫融入AI領(lǐng)域的各類衍生表述,如“詞元化”(tokenization)、“詞元長度”“詞元計(jì)費(fèi)”“詞元數(shù)量”等,衍生術(shù)語自然流暢、語義清晰,無需額外解釋即可讓人理解含義,真正實(shí)現(xiàn)了專業(yè)場景與大眾場景的雙向通達(dá),解決了此前譯法混亂導(dǎo)致的溝通障礙,大幅降低了AI知識(shí)的傳播與學(xué)習(xí)成本。
(三)雅:雅致得體,兼具文化與專業(yè)質(zhì)感
“雅”即譯文用詞雅致、規(guī)范得體,兼具專業(yè)質(zhì)感與文化內(nèi)涵,不粗俗、不生硬、不敷衍??萍夹g(shù)語的“雅”并非追求辭藻華麗,而是做到專業(yè)嚴(yán)謹(jǐn)、簡潔莊重、契合學(xué)科氣質(zhì),“詞元”恰好具備這一特質(zhì)。
從中文文化內(nèi)涵來看,“元”字蘊(yùn)含著“本源、基礎(chǔ)、核心”的哲學(xué)意蘊(yùn),代表著事物的根本單元,用在AI術(shù)語中,既體現(xiàn)了技術(shù)的底層邏輯,又帶有中式文化的厚重感,避免了直譯的生硬與淺白;從專業(yè)質(zhì)感來看,“詞元”摒棄了“代幣”“令牌”等帶有行業(yè)偏見的詞匯,也區(qū)別于過于口語化、隨意化的譯法,以莊重規(guī)范的用詞,彰顯了人工智能作為前沿科技學(xué)科的專業(yè)性與嚴(yán)謹(jǐn)性,符合國家科技名詞審定的高標(biāo)準(zhǔn),成為兼具文化底蘊(yùn)與專業(yè)價(jià)值的優(yōu)質(zhì)術(shù)語。概言之,“詞元”譯名以“信”為根,牢牢把握token的技術(shù)核心;以“達(dá)”為徑,實(shí)現(xiàn)全場景的順暢溝通;以“雅”為魂,提升術(shù)語的專業(yè)與文化質(zhì)感,三者相輔相成,完美踐行了“信、達(dá)、雅”的翻譯準(zhǔn)則,是科技術(shù)語本土化、規(guī)范化的經(jīng)典案例。
“詞元”的定名,不僅是一個(gè)科技術(shù)語的規(guī)范,更像是打開了人工智能世界的一把鑰匙,以“詞元”為原點(diǎn),我們可以突破現(xiàn)有技術(shù)邊界,展開天馬行空、開闊多元的暢想,觸及語言、科技、產(chǎn)業(yè)、文化、社會(huì)乃至人類認(rèn)知的方方面面,感受AI時(shí)代的無限可能。
(一)詞元重構(gòu)人類語言的表達(dá)與傳承邊界
詞元作為語言的最小基礎(chǔ)單元,未來將徹底打破人類語言的壁壘與傳承困境。首先,跨語言無障礙溝通將成為現(xiàn)實(shí),詞元將成為全球語言的通用“翻譯原子”,不同語言的文字、語音都能被拆解為統(tǒng)一的詞元,再通過AI模型重組為目標(biāo)語言,不僅實(shí)現(xiàn)語義的精準(zhǔn)傳遞,更能保留語氣、情感、文化內(nèi)涵,讓跨國、跨民族交流如同母語溝通一般自然,徹底消除語言隔閡。
其次,瀕危語言的數(shù)字化永生將得以實(shí)現(xiàn),全球數(shù)千種瀕危語言可被全面拆解為詞元,建立專屬的詞元數(shù)據(jù)庫,完整保存其語法、詞匯、文化語境,通過AI模型還原瀕危語言的表達(dá)體系,讓瀕臨消失的語言文化以數(shù)字形式永久傳承,甚至能通過詞元重組,復(fù)活失傳的古代語言、方言,讓人類語言文明實(shí)現(xiàn)前所未有的完整延續(xù)。
再者,人類語言表達(dá)將迎來全新形態(tài),詞元將打破傳統(tǒng)文字、語音的限制,融合視覺、觸覺、情感等多維度信號(hào),形成“多模態(tài)詞元”。未來人類表達(dá)無需單純依靠文字,可通過詞元直接傳遞情緒、畫面、感受,比如表達(dá)“喜悅”時(shí),詞元可同時(shí)傳遞笑容、心跳、溫暖的畫面等多重信息,讓語言表達(dá)更立體、更細(xì)膩,重塑人類的溝通方式與情感傳遞邏輯。
(二)詞元成為AI科技進(jìn)化的核心基石與通用貨幣
在人工智能技術(shù)發(fā)展中,詞元將超越當(dāng)前的文本處理單元屬性,成為AI世界的通用基礎(chǔ)粒子。一方面,多模態(tài)AI將實(shí)現(xiàn)全場景詞元統(tǒng)一,圖像、語音、視頻、代碼、生物信號(hào)等所有信息都能被轉(zhuǎn)化為標(biāo)準(zhǔn)化詞元,無論是Sora視頻生成、AI語音交互,還是醫(yī)療影像分析、工業(yè)數(shù)據(jù)處理,都以詞元為核心計(jì)算單位,實(shí)現(xiàn)不同模態(tài)、不同領(lǐng)域AI模型的無縫銜接,打造真正的通用人工智能(AGI)。
另一方面,詞元將成為AI算力與智能的“通用貨幣”,如同現(xiàn)實(shí)世界的貨幣一般,成為AI產(chǎn)業(yè)的核心度量衡。模型的智能水平、算力的強(qiáng)弱、內(nèi)容的價(jià)值、技術(shù)的服務(wù)能力,都將以詞元的處理能力、生成數(shù)量、質(zhì)量為標(biāo)準(zhǔn)衡量;AI模型之間的交互、協(xié)作,也將通過詞元的交換、流轉(zhuǎn)實(shí)現(xiàn),形成去中心化的AI協(xié)作網(wǎng)絡(luò),讓人工智能從單一工具進(jìn)化為具備自主交互、協(xié)同進(jìn)化能力的智能體系。
更具顛覆性的是,詞元將推動(dòng)AI自主學(xué)習(xí)與創(chuàng)新的突破,AI模型可自主拆解、重組、優(yōu)化詞元,不再依賴人類的標(biāo)注與訓(xùn)練,通過詞元的自主迭代,自主學(xué)習(xí)知識(shí)、生成全新內(nèi)容、研發(fā)新技術(shù),甚至能創(chuàng)造出人類未曾有過的語言、概念與創(chuàng)意,讓AI從“人類助手”轉(zhuǎn)變?yōu)椤白灾鲃?chuàng)新主體”,推動(dòng)科技進(jìn)步進(jìn)入全新階段。
(三)詞元催生全新的經(jīng)濟(jì)形態(tài)與產(chǎn)業(yè)生態(tài)
詞元的標(biāo)準(zhǔn)化與通用化,將徹底重構(gòu)AI產(chǎn)業(yè)生態(tài),催生詞元經(jīng)濟(jì)這一全新經(jīng)濟(jì)形態(tài)。在消費(fèi)端,詞元將成為數(shù)字內(nèi)容消費(fèi)的核心單位,AI生成的文案、畫作、視頻、音樂,都將按詞元數(shù)量、質(zhì)量計(jì)費(fèi),用戶可按需購買、定制個(gè)性化內(nèi)容,數(shù)字內(nèi)容消費(fèi)將更加精準(zhǔn)、靈活;在產(chǎn)業(yè)端,企業(yè)的AI服務(wù)、算力租賃、技術(shù)研發(fā),都將以詞元為核心計(jì)價(jià)單位,形成透明化、標(biāo)準(zhǔn)化的AI產(chǎn)業(yè)定價(jià)體系,降低企業(yè)布局AI的成本,推動(dòng)AI在農(nóng)業(yè)、工業(yè)、醫(yī)療、教育等全行業(yè)的深度落地。
同時(shí),詞元將催生全新的職業(yè)與產(chǎn)業(yè)賽道,比如詞元工程師、詞元優(yōu)化師、詞元數(shù)據(jù)庫管理員、詞元經(jīng)濟(jì)分析師等,圍繞詞元的采集、標(biāo)注、優(yōu)化、交易、管理,形成完整的產(chǎn)業(yè)鏈條。甚至?xí)霈F(xiàn)詞元交易平臺(tái)、詞元版權(quán)保護(hù)中心、詞元質(zhì)量認(rèn)證機(jī)構(gòu)等全新業(yè)態(tài),讓AI產(chǎn)業(yè)的分工更加細(xì)化,推動(dòng)數(shù)字經(jīng)濟(jì)向更精細(xì)化、智能化的方向發(fā)展,成為未來數(shù)字經(jīng)濟(jì)的核心支柱。
(四)詞元推動(dòng)文明融合與社會(huì)形態(tài)革新
從文化與社會(huì)視角來看,詞元將成為人類文明交流融合的紐帶。不同國家、民族的文化內(nèi)容,都能被轉(zhuǎn)化為標(biāo)準(zhǔn)化的詞元,通過AI的傳播與重組,打破文化壁壘,讓東方文化、西方文化、小眾文化在詞元層面實(shí)現(xiàn)深度融合與創(chuàng)新,催生兼具多元文化特色的全新數(shù)字文明,推動(dòng)人類命運(yùn)共同體的文化構(gòu)建。
在社會(huì)生活層面,詞元將融入日常生活的方方面面,打造全新的智能社會(huì)形態(tài)。教育領(lǐng)域,老師可根據(jù)學(xué)生的詞元接受能力,定制個(gè)性化學(xué)習(xí)內(nèi)容,實(shí)現(xiàn)因材施教;醫(yī)療領(lǐng)域,患者的病情、癥狀、生理數(shù)據(jù)可轉(zhuǎn)化為詞元,AI通過詞元分析實(shí)現(xiàn)精準(zhǔn)診斷、個(gè)性化診療;政務(wù)領(lǐng)域,政務(wù)信息、民生需求可通過詞元快速處理,提升政務(wù)服務(wù)效率,讓社會(huì)治理更加智能化、精細(xì)化。
(五)詞元重塑人類對(duì)信息與世界的認(rèn)知方式
最具深遠(yuǎn)意義的是,詞元將重塑人類的認(rèn)知邏輯,改變?nèi)祟悓?duì)信息、知識(shí)與世界的理解方式。人類以往認(rèn)知世界,依賴文字、語言、圖像的整體感知,而詞元讓人類能夠以“最小基礎(chǔ)單元”的視角拆解信息、理解世界,讓抽象的知識(shí)、復(fù)雜的信息變得更加簡單、清晰,大幅提升人類的學(xué)習(xí)效率與認(rèn)知能力。
同時(shí),詞元將打通人類智能與人工智能的認(rèn)知壁壘,人類的思維、情感、知識(shí)可轉(zhuǎn)化為詞元,AI的智能邏輯、計(jì)算結(jié)果也能以詞元形式被人類理解,實(shí)現(xiàn)人機(jī)認(rèn)知的無縫對(duì)接。未來,人類可通過詞元直接與AI進(jìn)行思維層面的交流,借助AI的算力拓展自身的認(rèn)知邊界,甚至實(shí)現(xiàn)知識(shí)的直接傳承與思維的跨界碰撞,讓人類的智慧與AI的智能深度融合,推動(dòng)人類文明向更高維度進(jìn)化。
綜上,從token中文譯名的百家爭鳴,到“詞元”這一規(guī)范名稱的正式發(fā)布,看似只是一個(gè)科技術(shù)語的確定,實(shí)則是我國人工智能領(lǐng)域走向規(guī)范化、本土化、成熟化的重要標(biāo)志?!霸~元”的定名,既解決了當(dāng)下術(shù)語混亂的現(xiàn)實(shí)問題,又以精準(zhǔn)的內(nèi)涵、完美的信達(dá)雅水準(zhǔn),為AI技術(shù)的發(fā)展奠定了術(shù)語基礎(chǔ),更成為我們暢想人工智能未來的起點(diǎn)。
詞元雖小,卻承載著AI技術(shù)的核心邏輯,更蘊(yùn)含著語言、科技、產(chǎn)業(yè)、文化的無限可能。它不僅是人工智能處理信息的最小單元,更是人類開啟智能時(shí)代的一把鑰匙,讓我們看到了跨語言溝通、文明融合、產(chǎn)業(yè)革新、認(rèn)知升級(jí)的美好藍(lán)圖。隨著“詞元”在全社會(huì)的推廣試用,我國人工智能領(lǐng)域的發(fā)展將更加規(guī)范有序,而圍繞詞元展開的技術(shù)創(chuàng)新與實(shí)踐探索,也將持續(xù)推動(dòng)AI技術(shù)不斷突破,讓人工智能更好地服務(wù)于人類社會(huì)發(fā)展,書寫智能時(shí)代的全新篇章。
作者簡介:

徐飛 博士,資深教授,現(xiàn)任福耀科技大學(xué)常務(wù)副校長,歷任上海交通大學(xué)副校長、西南交通大學(xué)校長、上海財(cái)經(jīng)大學(xué)常務(wù)副校長。出版著作近30部,發(fā)表論文210余篇。
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP