Christian Munley's picture

Christian Munley

cmunley

nvidia

·

AI & ML interests

None yet

Organizations

upvoted 2 collections 4 months ago

NeMo Gym

Collection of RL verifiable data for NeMo Gym • 32 items • Updated 12 days ago • 62

Nemotron-Post-Training-v3

Collection of datasets used in the post-training phase of Nemotron Nano, Super, and Ultra v3. • 50 items • Updated 12 days ago • 163

upvoted a paper 6 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 233