GPT from Scratch BPE -> Transformer -> Benchmark 非常好教程 https://github.com/karp... 深度学习, 说说 · 2024-04-05
Gumbel Softmax 非引流,实在觉得这两篇Gumbel Softmax讲的不错,也就没有自己写的必要了(并不是因为懒 https://zhuanlan.z... 说说 · 2024-03-27