wenfeng feng's picture

3

wenfeng feng

wenfengfwf

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 12 hours ago

DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning

authored a paper 8 months ago

VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models

upvoted a paper 8 months ago

VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models

View all activity

Organizations

None yet

Papers 5

arxiv:2509.19803

arxiv:2508.21104

arxiv:2503.03434

arxiv:2501.10053

models 0

None public yet

datasets 0

None public yet