whatlaunched

Transformer架构

Transformer是一种基于自注意力机制的神经网络架构, 彻底改变了序列建模和自然语言处理领域,成为现代大语言模型的基础架构。