为什么均匀分布初始化 标准差需要乘上Sqrt(3)
Pytorch中的kaiming_uniform中标准差stdv乘了一个因子$\sqrt{3}$ def kaiming_unifor...
深度学习 · 2024-04-16
Pytorch中的kaiming_uniform中标准差stdv乘了一个因子$\sqrt{3}$ def kaiming_unifor...
深度学习 · 2024-04-16
最近看到一个写的挺好的多任务框架(https://github.com/SwinTransformer/AiT,参考了detectro...
深度学习 · 2023-11-15
这两天在看PyTorch DistributedDataParallel(DDP)相关文章,发现有个系列写的还不错。 https:/...
深度学习 · 2023-10-21
JJJYmmm Blog
鄂ICP备2023004395号