上下文窗口

来自jwjp-Just Wiki Join Portal
Admin留言 | 贡献2026年3月25日 (三) 10:13的版本 (创建页面,内容为“{{分类:人工智能术语}}​ {{分类:大语言模型术语}}​ {{信息框|标题=上下文窗口|内容=​ * 英文对应:Context Window​ * 核心定义:大语言模型可处理的最大词元数量上限​ * 核心关联:以词元为计量单位,决定模型的上下文理解能力​ * 关键作用:限制输入+输出的总词元数,影响对话连贯性​ }}​ 一、定义​ '''上下文窗口'''是指大语言模型在…”)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

Category:人工智能术语Category:大语言模型术语Template:信息框​ 一、定义​ 上下文窗口是指大语言模型在一次对话或文本处理中,能够同时接收、理解并处理的最大词元数量上限。它是衡量大语言模型上下文理解能力的核心指标,单位为词元,包含用户输入的词元数与模型输出的词元数之和。​ 二、核心作用​ 限制处理规模:模型无法无限处理文本,上下文窗口的大小决定了单次可处理的文本长度(以词元计数);​ 保障上下文连贯:模型通过上下文窗口内的词元序列,理解文本的逻辑关系、上下文关联,确保生成内容的连贯性;​ 影响计费与算力:上下文窗口越大,模型处理的词元数量越多,消耗的算力越高,API调用成本也越高;​ 适配不同场景:短上下文窗口适合简单问答,长上下文窗口适合长文档处理、多轮对话、代码调试等场景。​ 三、与词元的关联​ 上下文窗口与词元是密不可分的关系,核心关联如下:​ 计量单位:上下文窗口的大小以词元为单位(如8k词元、32k词元、128k词元);​ 容量限制:单次交互中,输入词元数+输出词元数,不能超过上下文窗口的最大词元限制;​ 窗口溢出:当输入文本的词元数超过上下文窗口上限时,模型会截断部分文本(通常截断开头或结尾),影响理解准确性;​ 优化方向:当前大语言模型的发展趋势之一,是扩大上下文窗口容量,支持更多词元的处理,提升长文本理解能力。​ 四、常见示例​ 小型上下文窗口:8k词元(适合日常短对话、简单问答);​ 中型上下文窗口:32k-64k词元(适合长文档摘要、多轮对话);​ 大型上下文窗口:128k词元及以上(适合长文档翻译、代码调试、书籍解读)。​ 五、相关词条​