附录

术语表:名词速查

只收录深度学习 / 大模型里的专用名词(如 model_dim、causal mask、MoE),每个一句话讲清并链到详解章节。 普通数学词(向量、矩阵、张量)、太泛的词(模型、训练、token)不在此列。 正文里蓝色虚线的词可点击查看释义。

网络基础

训练三件套

训练技巧与评估

网络结构

注意力与 Transformer

模型结构参数(读代码常见)

大模型

回到 全书目录,或从任意章节的左侧栏继续阅读。