搜索关键字
搜索
首页
关于
2024年1月
6.824 Lab1
作者:
JJJYmmm
时间:
2024-01-27
分类:
说说
评论
6.824 Lab1 done!
6.824 debug
作者:
JJJYmmm
时间:
2024-01-23
分类:
说说
评论
写bug之前 得先学会debug(悲)
Debugging by Pretty Printing
最新文章
正向/反向KL散度
PG/PPO/DPO/GRPO/MDPO 公式推导
RLHF-PPO/DPO中的一些细节
Packing in Transformer Training
元旦快乐!
c++中的dfs funciton定义
Image Caption | CIDEr
Python创建对象之new/super/init都干了什么
Typecho评论 Email提醒
无事水——RLHF PPO ppo_epochs
最近回复
JJJYmmm
: 哈哈哈毕竟都是han lab做的
aaa
: 一直都感觉这两篇的作坊很一样,当然讲故事的角度不一样
JJJYmmm
: 我也好久没碰了😢
gkd
: 能不能教我写外挂
JJJYmmm
: 是的
jingxz
: 有一个疑问,PPO中,当$\lambda=0$的时候,这个时候$...
JJJYmmm
: ✌
Miracle
: 可以,追更成功
JJJYmmm
: 好!可能下周写(等我搞搞明白
JJJYmmm
: 最后一个s_T不需要做action了,所以没有a_T🙌🏾🤪
分类
深度学习
源码阅读
目标检测
知识图谱
算法
逆向
机器学习
其他
说说
网安
计算机视觉
归档
March 2025
February 2025
January 2025
August 2024
July 2024
June 2024
May 2024
April 2024
March 2024
January 2024
December 2023
November 2023
October 2023
September 2023
August 2023
July 2023
June 2023
May 2023
April 2023
March 2023
May 2022
其它
登录
文章 RSS
评论 RSS
Typecho