会员
众包
新闻
博问
闪存
云市场
所有博客
当前博客
a56爆大奖在线娱乐的博客
a56爆大奖在线娱乐的园子
账号设置
简洁模式
...
退出登录
注册
登录
initial_h
???https://github.com/initial-h
博客园
首页
新随笔
管理
Vision-Language Models are Zero-Shot Reward Models for Reinforcement Learning
发表时间:2024(ICLR2024) 文章要点: 文章提出用预训练的视觉语言模型作为zero-shot的reward model(VLM-RMs)。好处在于可以通过自然语言来给定一个具体的任务,通过VLM-RMs让强化学习基于reward学习这个任务(using pretrained vision
posted @
2024-06-11 11:15
initial_h
阅读(
14
) 评论(
0
)
编辑
收藏
举报
指间灵动,快码加编
刷新页面
返回顶部
公告