上下文窗口

Category:人工智能术语 Category:大语言模型术语 Template:信息框一、定义 上下文窗口是指大语言模型在一次对话或文本处理中，能够同时接收、理解并处理的最大词元数量上限。它是衡量大语言模型上下文理解能力的核心指标，单位为词元，包含用户输入的词元数与模型输出的词元数之和。二、核心作用 限制处理规模：模型无法无限处理文本，上下文窗口的大小决定了单次可处理的文本长度（以词元计数）； 保障上下文连贯：模型通过上下文窗口内的词元序列，理解文本的逻辑关系、上下文关联，确保生成内容的连贯性； 影响计费与算力：上下文窗口越大，模型处理的词元数量越多，消耗的算力越高，API调用成本也越高； 适配不同场景：短上下文窗口适合简单问答，长上下文窗口适合长文档处理、多轮对话、代码调试等场景。三、与词元的关联上下文窗口与词元是密不可分的关系，核心关联如下：计量单位：上下文窗口的大小以词元为单位（如8k词元、32k词元、128k词元）；容量限制：单次交互中，输入词元数+输出词元数，不能超过上下文窗口的最大词元限制；窗口溢出：当输入文本的词元数超过上下文窗口上限时，模型会截断部分文本（通常截断开头或结尾），影响理解准确性；优化方向：当前大语言模型的发展趋势之一，是扩大上下文窗口容量，支持更多词元的处理，提升长文本理解能力。四、常见示例小型上下文窗口：8k词元（适合日常短对话、简单问答）；中型上下文窗口：32k-64k词元（适合长文档摘要、多轮对话）；大型上下文窗口：128k词元及以上（适合长文档翻译、代码调试、书籍解读）。五、相关词条

上下文窗口

导航菜单

搜索