Packing in Transformer Training
年前分享一篇关于Sequence Packing的论文:2107.02027 笔者认为Packing是Transformer架构训练时...
深度学习 · 2025-01-25
年前分享一篇关于Sequence Packing的论文:2107.02027 笔者认为Packing是Transformer架构训练时...
深度学习 · 2025-01-25
问题来自今日力扣 偶然发现使用std::function定义dfs函数比原生函数或auto定义慢很多,使用斐波那契简单计算一下时间,代...
其他 · 2024-08-16
关于CIDEr的介绍可以看这里,个人感觉讲的比较清楚 唯一有个问题是计算TF的时候,提供的公式是term_freq/sum(all t...
深度学习 · 2024-08-03
Python中创建对象时,会涉及__init__和__new__两个函数,个人感觉前者较为常见。 创建对象时发生了什么 创建一个类对象...
其他 · 2024-07-24
JJJYmmm Blog
鄂ICP备2023004395号