HuggingFace transformers库核心组件架构
请概述HuggingFace transformers库的架构设计。Pipeline、AutoModel、AutoTokenizer、AutoConfig之间的关系是什么?from_pretrained()和save_pretrained()背后的机制是什么?
回答
编译有声
transformers采用三件套架构:
- AutoConfig:加载配置(层数/维度等)
- AutoTokenizer:加载分词器
- AutoModel:加载预训练权重
Pipeline高级封装:自动完成tokenize-predict-postprocess。
from_pretrained机制:先检查缓存(~/.cache/huggingface/hub/),未命中则从Hub下载。 模型类体系:BertModel(基础)→BertForSequenceClassification(加分类头)