GPT系列演进：GPT-1到GPT-4的核心变化

Question

请梳理GPT-1到GPT-4的发展脉络。每代模型相比前代有哪些关键创新（架构/数据/训练/规模）？GPT-4相比GPT-3有质的飞跃，原因是什么？。AI 面试题。OpenAI 面试题

编译有声 · Accepted Answer

GPT-1（2018，117M）：证明无监督预训练+有监督微调可行。GPT-2（2019，1.5B）：更大数据（WebText），展示零样本学习，强调语言模型是多任务学习器。GPT-3（2020，175B）：超大规模+in-context learning（零样本/少样本/提示学习），无需微调即可完成多种任务。GPT-4（2023）：没有公开参数量，但核心变化包括：1）多模态能力（接受图像输入）；2）在更多高质量数据上训练，引入RLHF（基于人类反馈的强化学习）；3）推理能力大幅提升（逻辑/数学/编程）；4）更长的上下文窗口（8K→32K→128K）。GPT-4的质变不仅来自规模扩大，还在于多模态对齐、更好的对齐训练（safety/helpfulness）和更大的训练计算投入。

GPT系列演进：GPT-1到GPT-4的核心变化

回答

编译有声