给AI“投喂”长篇小说，它会读傻吗？

不会“读傻”，但会“答糊”。模型没有长期记忆，塞进一部长篇只影响这一次推理：上下文越长，注意力越被稀释，常见的“中间遗失”让关键信息检索率下滑；许多模型的有效上下文通常低于标称长度的一半。长度一拉长，延迟和费用飙升，且精度往往先涨后跌——超长到二十多万 token 时，信息提取准确率已出现可测的回落。更聪明的喂法是“问题驱动、按需进料”。先让模型生成人物表、时间线、地名索引等“短索引”，再围绕问题只加载相关章节；必须全量时，把任务目标与打分标准放在最前，章节级摘要+锚点页码贯穿全文，提问时要求逐条给出出处。采用分段-汇总（map-reduce）推理，把关键事实在开头与结尾各重复一遍，可显著缓解“中段遗失”。实操上，把上下文控制在标称窗口的约30%-60%更稳；分块1-2k token、重叠10%-20%；输出尽量结构化（引用编号、页码、段落ID）。这样投喂长篇，既不“读傻”，也更准、更省钱。

AI按“字”收费，会带来新的知识鸿沟吗？

会的，而且这条裂缝正在形成。按“字”（实为Token）计费对不同语言并不中立：非拉丁语系往往“同义更贵、效果更差”。在实际调用里，英文表达同样信息的Token更少，模型对英文的训练也更充分，形成双重“语言税”——一边多花钱，一边准确率更低。当AI被用于教育、政务与长尾行业时，这种隐性溢价会直接转化为使用门槛，最先被挤出的，往往是弱势语言社群与中小机构。更糟的是，智能体工作流把差距放大。Agent长链路推理的Token消耗是普通问答的数倍；多语种里，中文和低资源语言的上下文更快被“吃满”，需要更频繁的摘要、检索与重试，进一步推高成本和延迟。内容供给侧也会被价格信号扭曲：开发者与机构倾向先上英文，再“迁就”本地语言，久而久之，知识库与评测基准都向英文倾斜，形成技术-内容的正反馈马太效应。补救并非没有路径。技术端，采用多语言友好的分词器与更大的CJK词表，可把中文等语言的平均Token开销显著压低；配合Prompt缓存、语义压缩与检索路由，能把输入成本降到可承受区间。产品与计费端，可以推行“语言归一化计费”（同义同价）、教育与公益场景的算力券，以及面向长链路Agent的封顶套餐。政策端，应资助低资源语言数据集与评测集建设，把“可用性”而非“参数量”纳入采购与补贴标准。若不在这三层同时发力，按字收费确实会演化为新的知识鸿沟。

AI的乐高积木，能拼出李白的诗心吗？

能。它已经能把“外壳”拼得很像。用格律约束解码、韵脚词典与自动评分器，模型可以稳定产出合乎平仄、对仗、押韵的近体诗；把九歌这类涵盖数十万古诗的语料喂好，再叠加李白生平的知识图谱与RAG检索，意象与典故也能对上“蜀道”“酒”“月”“长风”等母题。再用文言极简输出节省的Token换来更长上下文与更多风格提示，成篇往往“形神具备”。但要“像”与要“是”，隔着动机与体验的天堑。李白的诗心来自具体身世、酒气与山河的体感，而现有模型的“记忆”只是一次次会话里被喂入的Token拼贴，缺乏可检验的自传性动因与价值取舍。因此它更擅长“仿作”与“启发”，难以在审美新意与精神密度上越过前人。实操上，要逼近“诗心”，就把三件事做到极致：以李白时间线构建检索约束，让每句意象有出处；严格格律与用韵硬约束，避免空灵散句；引入人类诗评的偏好微调，把“像李白”调成“敢李白”。传播教学够用了，原创突破，还得等模型真正接上更丰富的世界与更稳定的长期记忆。

新知 - 大圆镜｜AI按Token收费，背后藏着语言的秘密

对抗知识焦虑，从看懂这条开始

App 下载

你有没有过这种经历：给AI发了段长文本，收到的回复没头没尾，或是账单跳出时，数字比预期高了好几倍？问题的根源，可能藏在你从未在意的「Token」里——这个被当作AI计价单位的小东西，其实是机器理解人类语言的核心密码。

Token不是词，也不是字符，是大模型把语言拆碎后得到的「最小语义积木」。它的大小全看频率：英文里「ing」「tion」这类高频后缀会被打包成整块Token，生僻词则会被拆成单个字母；中文里大多是单字成Token，但「所以」「因为」这类高频词组，也会被模型自动合并。这种拆分逻辑，是为了在计算效率和语义完整间找平衡——既不让模型因处理单个字符累死，也不让它因拆分太粗错过关键语义。

你或许没意识到，Token的划分直接决定了AI的能力边界。Transformer模型的注意力机制，计算量会随Token数量的平方增长——这就是为什么大模型的「上下文窗口」总有上限，超过后要么报错，要么开始「失忆」。更现实的影响是计费：输入和输出的Token分开计价，输出Token的价格通常是输入的3到5倍，冗长的提问、要求长篇回复，都会让成本指数级上升。

但这里藏着一个被忽略的不公平：现有Token化算法几乎都是基于英语语料训练的，中文、阿拉伯语这类非英语语言，或是乌克兰语这类低资源语言，会被拆成更多Token。同样一段语义，中文的Token数可能比英文多20%到30%，直接推高了使用成本。甚至专业领域的文本，比如代码、法律条文，也会因特殊符号和术语被过度拆分，让Token数再涨30%。

优化Token使用，早已不是技术细节，而是AI落地的核心命题。精简提问、压缩对话历史、用语义分块替代固定长度拆分，能让Token消耗骤降80%以上；一些企业甚至会用专门的工具压缩结构化数据，把JSON格式里的冗余字段替换成短标识符，再把Token数砍去六成。这些操作不会降低回答质量，却能把成本拦腰斩断。

未来的Token化，会朝着更智能的方向走：动态调整拆分粒度，根据不同语言、不同任务定制Token字典，甚至把图像、音频也转换成统一的Token序列。但眼下最该明白的是：AI本身不贵，不受控的Token消耗才贵——就像你不会为了喝杯水买一整桶矿泉水，学会给AI「精准喂料」，才是用好它的第一步。

评论