#第一阶段 model.py是我们用pytorch手写的transformer,它包含了全套的transformer组件,以及训练的部分。运行它会启动训练过程,并打印出文本。 input.txt是一个小型的莎士比亚数据集,也是我们用来训练的数据集。 #第二阶段 fine_tune.py是使用hugging face库进行全量/LoRA ...