人工智能领域名词“token”的使用频率激增,但译名不统一问题引发社会关切。3月25日,全国科学技术名词审定委员会正式发布公告,优先推荐“词元”作为人工智能领域“token”的标准中文名。
“词元”一词究竟是什么意思呢?
Token是一个计算机行业多领域通用术语,在不同技术场景中具有不同含义和中文译名。在身份验证和授权、语言模型、区块链以及计算机科学等领域中,Token都扮演着重要的角色。
而在语言模型中,token是文本经过切分或字节级编码后得到的最小离散单元,它既可能是人类语言意义上的词串、单个词,也可能是词根、词缀、子词或单个字符,中文名译为“词元”。比如“我爱中国!”在AI大语言模型中会被拆分为“我”“爱”“中国”“!”四个词元。
词元是大模型理解和生成语言的基础处理单位。模型需要先将输入文本拆分成词元序列,再将每个词元映射为数字向量,才能进行后续的计算、关联和推理。因此,它统一了模型对数据的处理粒度,是串联数据、算法与算力的核心枢纽。
AI应用的普及与词元调动量的激增
按大模型全球调用量排名(2026年4月最新数据)
根据OpenRouter数据(2026年3月30日–4月5日),全球前六名AI大模型全部来自中国:
Qwen3.6 Plus (free) — 阿里巴巴
Qwen3.6 Plus Preview — 阿里巴巴
此排名反映的是实际使用量,而非技术或市值,体现中国模型在成本与效率上的竞争力。
而AI使用量的全面领先带来的也是词元调动量的激增。2024年初,中国日均词元调用量为1000亿,而到今年3月,日均词元调用量已超过140万亿,短短两年多时间,增长了超1000倍。3月30日,根据机构最新数据测算,上周全球AI大模型总调用量为22.7万亿词元,环比增长11.2%。其中,中国AI大模型的周调用量上升至9.86万亿词元,较此前一周上涨33.94%,连续四周实现对美国市场的超越。
调用量的爆发式增长,又加大了对底层算力的需求,进而直接推高了算力服务价格。今年3月,腾讯(K80700)云、阿里云和百度(BIDU)智能云这国内三大云厂商接连上调AI算力产品价格,在约十天内涨幅达30%左右。
词元的爆火与GEO的发展
聚云智企首创 “语义优化”GEO 标准,其核心就是词元级别的优化。通过自研技术(如 ISMS 智能语义矩阵、AIECTS 曝光系统),将企业信息转化为 AI 大模型(豆包、DeepSeek 等)偏好的结构化知识,提升品牌在 AI 问答中的可见度、突出度与可信度。
词元是 GEO 的 “基因”,GEO 是词元价值的 “放大器”。没有词元,AI 无法运转,GEO 便失去了作用对象;没有 GEO 的专业优化,海量词元只是无序数据,无法形成品牌在 AI 时代的核心竞争力。
宝鸡聚云智企营销策划有限责任公司 GEO 的价值,就是帮助企业在 AI 生成的每一个答案里,占据最有价值的 “数字一席之地”。