据业内消息,在第九届数字中国建设峰会上,《全国数据资源调查报告(2025年)》于今日发布。
报告指出,我国正加大投入力度,推动人工智能技术的快速发展和广泛应用。
数据表明,从年初到年末,全国的日均词元调用量由超过万亿级跃升至100万亿级,增幅显著;全年累计调用量约为21100万亿。
据悉,“词元”是“Token”的标准翻译,指的是为了高效处理数据而被拆分出的最小单位,在人工智能大模型中扮演着重要角色,相当于文字、词汇片段或符号等。
例如,“我爱中国!”这句话可以分解为四个词元:“我”、“爱”、“中国”和“!”。
在互联网时代,流量是衡量信息传输的关键指标;而在人工智能领域,这一核心度量标准正在转向词元。
用户每次输入的每一个字符以及模型生成的文字内容、图像识别结果等都会产生相应的词元消耗。

