登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
大模型 Token 究竟是啥:图解大模型Token
大模型 Token 究竟是啥:图解大模型Token
[ 复制链接 ]
茹静曼
2025-6-3 10:46:39
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
前几天,一个朋友问我:“
大模型
中的
Token
究竟是什么?”
这确实是一个很有代表性的问题。许多人听说过 Token 这个概念,但未必真正理解它的作用和意义。思考之后,我决定写篇文章,详细解释这个话题。
我说:像
DeepSeek
和
ChatGPT
这样的超大语言模型,都有一个“刀法精湛”的小弟——
分词器(
Tokenizer
)
。
当
大模型
接
收到一段文字
。
会让
分词器
把它
切成很多个小块
。
这切出来的每一个小块就叫做一个
Token
。
比如这段话(
我喜欢唱、跳、Rap和篮球
),在大模型里可能会被切成这个样子。
像
单个汉字
,可能是一个
Token
。
两个汉字
构成的
词语
,也可能是一个
Token
。
三个字
构成的
常见短语
,也可能是一个
Token
。
一个标点符号
,也可能是一个
Token
。
一个单词
,或者是
几个字母
组成的一个
词缀
,也可能是一个
Token
。
大模型在输出文字的时候,也是一个 Token 一个 Token 的往外蹦,所以看起来可能有点像在打字一样。
朋友听完以后,好像更疑惑了:
于是,我决定换一个方式,给他通俗解释一下。
大模型的Token究竟是啥,以及为什么会是这样。
首先,请大家快速读一下这几个字:
是不是有点没有认出来,或者是需要愣两秒才可以认出来?
但是如果这些字出现在
词语
或者
成语
里,你
瞬间
就可以念出来。
那之所以会这样,是因为我们的
大脑在日常生活中
,
喜欢
把这些有含义的
词语
或者
短语
,优先作为
一个整体
来对待。
不到万不得已,不会去一个字一个字的抠。
这就导致我们对这些
词语还挺熟悉
,
单看
这些字(旯妁圳侈邯)的时候,反而会觉得
有点陌生
。
而大脑
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
大模型
Token
竟是
图解
相关帖子
python调用大模型api来进行对话
在前端项目中安全调用大模型 API 的实践,我是怎么做的?
【有手就行】LoRA:用你自己的数据来微调大模型,让大模型真正懂你
解密Prompt系列66. 视觉Token爆炸→DeepSeek-OCR光学压缩
纯前端调用大模型真的安全吗?我踩过的坑比示例代码多得多
UniEdit:首个大型开放域大模型知识编辑基准
大模型榜单周报(2025/12/08—2025/12/12)
一个完全由大模型AI Coding开发而成的程序员工具网站
仅通过一句提示词,就可以让大模型变得更有创造力
变天了!字节vs阿里大模型正面硬刚,双人视频一键生成?实测结果太意外...
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
python调用大模型api来进行对话
0
144
艾晓梅
2025-12-04
业界
在前端项目中安全调用大模型 API 的实践,我是怎么做的?
1
429
趣侮
2025-12-08
业界
【有手就行】LoRA:用你自己的数据来微调大模型,让大模型真正懂你
0
951
晖顶蝇
2025-12-14
业界
解密Prompt系列66. 视觉Token爆炸→DeepSeek-OCR光学压缩
0
426
筒霓暄
2025-12-15
安全
纯前端调用大模型真的安全吗?我踩过的坑比示例代码多得多
0
957
静轾
2025-12-16
业界
UniEdit:首个大型开放域大模型知识编辑基准
0
993
焦和玉
2025-12-16
业界
大模型榜单周报(2025/12/08—2025/12/12)
0
196
赐度虻
2025-12-16
业界
一个完全由大模型AI Coding开发而成的程序员工具网站
0
474
龙梨丝
2025-12-17
安全
仅通过一句提示词,就可以让大模型变得更有创造力
0
307
讣丢
2025-12-17
安全
变天了!字节vs阿里大模型正面硬刚,双人视频一键生成?实测结果太意外...
0
373
毕余馥
2025-12-18
回复
(8)
宇文之
2025-10-13 08:20:43
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
庾芷秋
2025-10-19 12:38:03
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
分享、互助 让互联网精神温暖你我
但婆
2025-10-20 04:32:32
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
懂技术并乐意极积无私分享的人越来越少。珍惜
吕颐然
2025-10-30 12:33:53
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
分享、互助 让互联网精神温暖你我
硫辨姥
2025-11-14 03:30:04
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
这个好,看起来很实用
玲液
2025-12-7 05:25:18
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
禄磊
2025-12-9 13:40:30
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢,下载保存了
讥慰捷
2025-12-11 14:30:05
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
鼓励转贴优秀软件安全工具和文档!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
茹静曼
2025-12-11 14:30:05
关注
0
粉丝关注
17
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994891
kk14977
6845357
4
xiangqian
638210
5
韶又彤
9997
6
宋子
9982
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
601
OceanBase 在滴滴大规模运维经验以及新功能
967
[CSS+]HTML Learn Data Day 2
92
掌握相关性分析:读懂数据间的“悄悄话”
135
嵌入式UI框架-抗锯齿画圆弧算法
935
嵌入式UI框架的渐变原理、渐变算法
217
日本股票 API 对接实战指南(实时行情与 IP
558
解决Docker磁盘空间告急:认识并清理“悬空
393
别再只会算直线距离了!用“马氏距离”揪出
524
企业进行信息化后,一定会提高效率吗?真相
514
n8n整合ffmpeg
492
从random随机数看验证码重复数字
523
OceanBase 向量索引优化指南
232
Vue2中能否实现输入中文自动转化为拼音, 且
753
从项目成果到职业晋升:项目经理年终总结的
452
JS逆向-混淆加密-识别&还原-Eval&JSFuck&JS
936
2025年上海防水补漏谁家强?长三角标杆企业
615
正式接入DeepSeek-V3.2,国产AI“双剑合壁
398
守嘉陪诊师培训报名热潮引关注 独家实习机
912
顺序表实现线性结构
74
吴恩达深度学习课程四:计算机视觉 第二周