模型方面的疑问

记忆能力

先说哈模型本身是不具备任何记忆能力的，你所能看到的记忆能力均是cdx、cc这种AI应用做的功能，如果你也想实现，先去学习一下AI基础、langchain、langgraph等基础框架

token（词元）

token（词元）： Token 是 AI 模型处理文本时的最小基本单位，它可以是一个完整的单词、单词的一部分（如 un、ing）、一个标点符号，甚至是一个空格，比如 "I love AI!" 可能被切成："I"、" love"（含空格）、" AI"、"!" —— 这四个就是 token，也称为词元

1M是指100万词元 1B是指10亿

模型定价原理

也有些人对模型的输入、输出、缓存等很懵下面咱们拿咱们站得满血100% "克劳得" 举例（仅供学习）

输入（input）： 5 🔪 * 1.5倍率 = 7.5 🔪/1M

输入：是你发送给模型的东西，比如，"帮我写一首鸟在天上飞的诗"

教学：不严谨但是简单易懂的方法，不算上他底层模型运算token，只看他的字面的样子，就算这一个字一个token，那么输入相当于12个token，那么 12 / 1M * 7.5 就是输入价

输出（output）： 25 🔪*1.5倍率=37.5 🔪/1M

输出：模型根据你的输入算出来的结果。比如："鸟鸟鸟，鸟向向天歌"

教学：不严谨但是简单易懂的方法，不算上他底层模型运算token，只看他的字面的样子，就算这一个字一个token，那么输出相当于9个token，那么 9 / 1M * 37.5 就是输出价

缓存（cache）： 0.5🔪*1.5倍率 = 0.75 🔪/1M

缓存：一种临时存储技术，把某组输入对应的输出保存下来，当再次遇到完全相同（或语义等价）的输入时，直接返回缓存里的结果，不再实际调用模型，比如我又说："帮我写一手鸟在天上飞得诗"，模型读取到你说同样的输入了，会迅速的回你："鸟鸟鸟，鸟向向天歌"

教学：当输入重复了，这里是重点，你的请求不会直接去请求模型，会先到克劳得厂商做的缓存层这里，看你是否命中，如果命中了，那么据按照0.5/1M来收取缓存命中费用，如果没有那么就转发模型模型计算返回结果并存入缓存。

创建缓存（Cache Write）： 6.25 🔪 * 1.5倍率 = 9.375 🔪/1M

创建缓存：就是把一组输入-输出对存到缓存里的动作，用键值存储，输入序列化后作为 key，输出作为 value，不是所有场景都适合创建缓存——如果问题总是不同（如"帮我写一封给张三的邮件"）然后又去说"帮我生成个火电厂数字孪生首页"，缓存命中率很低，反而浪费存储。

教学：在把输出返回给你之前（或之后异步），缓存层自动执行"创建缓存"：把（输入 → 输出）存进去，key 通常是请求内容的哈希或完整文本，后续再有相同请求，就直接命中这个缓存，关于创建缓存这里，拿cdx举例，他没有创建缓存，不是因为没有，而是因为他给你免费在缓存层做了，而其他模型收费也是情理之中

特殊情况： 为什么逆向无缓存呢？简单的来说就是，逆向只能绕过了厂商那块的缓存层，才能请求到模型，你看到的所有逆向渠道带缓存的都是请求头上做了一些方法，实现了假缓存，让不理解技术的客户信以为真，中转常见套路。

模型方面的疑问 ​

记忆能力 ​

token（词元） ​

模型定价原理 ​

模型方面的疑问

记忆能力

token（词元）

模型定价原理