OpenRubrics

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

haoyuw authored a paper 14 days ago

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Dazzlinglights updated a model 17 days ago

OpenRubrics/RubricARROW-8B-Rubric

Dazzlinglights new activity 17 days ago

OpenRubrics/RubricARROW-Judge-SFT:Add link to paper and task category metadata

View all activity

Papers

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Alternating Reinforcement Learning for Rubric-Based Reward Modeling in Non-Verifiable LLM Post-Training

View all Papers

haoyuw

authored a paper 14 days ago

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Paper • 2605.29156 • Published 20 days ago • 14

Dazzlinglights

updated a model 17 days ago

OpenRubrics/RubricARROW-8B-Rubric

Text Generation • 308k • Updated 17 days ago • 170 • 1

Dazzlinglights

in OpenRubrics/RubricARROW-Judge-SFT 17 days ago

Add link to paper and task category metadata

#2 opened 17 days ago by

nielsr

Dazzlinglights

in OpenRubrics/RubricARROW-8B-Judge 17 days ago

Add metadata and link to paper

#1 opened 17 days ago by

nielsr

Dazzlinglights

in OpenRubrics/RubricARROW-8B-Rubric 17 days ago

Add metadata and link to paper

#1 opened 17 days ago by

nielsr

lliutianc

updated 2 models 17 days ago

OpenRubrics/RubricARROW-8B-Rubric

Text Generation • 308k • Updated 17 days ago • 170 • 1

OpenRubrics/RubricARROW-8B-Judge

Text Generation • 308k • Updated 17 days ago • 174

lliutianc

authored 2 papers 17 days ago

PEANuT: Parameter-Efficient Adaptation with Weight-aware Neural Tweakers

Paper • 2410.01870 • Published Nov 24, 2025

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Paper • 2605.29156 • Published 20 days ago • 14

lliutianc

submitted a paper to Daily Papers 17 days ago

RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains

Paper • 2605.29156 • Published 20 days ago • 14

Dazzlinglights

updated a dataset 19 days ago

OpenRubrics/RubricARROW-Judge-SFT

Viewer • Updated 17 days ago • 119k • 174 • 4

Dazzlinglights

published a dataset 19 days ago

OpenRubrics/RubricARROW-Judge-SFT

Viewer • Updated 17 days ago • 119k • 174 • 4

Dazzlinglights

updated a collection 19 days ago

RubricARROW

Collection

2 items • Updated 19 days ago • 1

Dazzlinglights

updated a model 19 days ago

OpenRubrics/RubricARROW-8B-Judge

Text Generation • 308k • Updated 17 days ago • 174

Dazzlinglights

published 2 models 19 days ago

OpenRubrics/RubricARROW-8B-Judge

Text Generation • 308k • Updated 17 days ago • 174

OpenRubrics/RubricARROW-8B-Rubric

Text Generation • 308k • Updated 17 days ago • 170 • 1

lliutianc

updated 3 models 2 months ago

AI & ML interests

Recent Activity

Papers

Team members 4

OpenRubrics's activity

Add link to paper and task category metadata

Add metadata and link to paper

Add metadata and link to paper