Ömer Veysel Çağatan's picture

3 2 3

Ömer Veysel Çağatan

asparius

·

https://asparius.github.io/

asparius

AI & ML interests

Deep RL, NLP

Recent Activity

upvoted a paper 3 days ago

Diagnosing the Reliability of LLM-as-a-Judge via Item Response Theory

upvoted a paper 3 days ago

Clipping-Free Policy Optimization for Large Language Models

updated a model 28 days ago

asparius/Qwen2.5-7B-SPO-1ep-iter16-prompt

View all activity

Organizations

upvoted 2 papers 3 days ago

Diagnosing the Reliability of LLM-as-a-Judge via Item Response Theory

Paper • 2602.00521 • Published 6 days ago • 1

Clipping-Free Policy Optimization for Large Language Models

Paper • 2601.22801 • Published 7 days ago • 2

updated 2 models 28 days ago

asparius/Qwen2.5-7B-SPO-1ep-iter16-prompt

Text Generation • 8B • Updated 28 days ago • 9

asparius/Qwen2.5-7B-GRPO-1ep-iter16-prompt

Text Generation • 8B • Updated 28 days ago • 11

published a model 28 days ago

asparius/Qwen2.5-7B-GRPO-1ep-iter16-prompt

Text Generation • 8B • Updated 28 days ago • 11

updated 7 models 29 days ago

asparius/Qwen2.5-7B-SPO-1ep-iter8-prompt

Text Generation • 8B • Updated 29 days ago • 10

asparius/Qwen2.5-7B-GRPO-1ep-iter8-prompt

Text Generation • 8B • Updated 29 days ago • 13

asparius/Qwen2.5-7B-SPO-1ep-iter4-prompt

Text Generation • 8B • Updated 29 days ago • 17

asparius/Qwen2.5-7B-GRPO-1ep-iter4-prompt

Text Generation • 8B • Updated 29 days ago • 12

asparius/Qwen2.5-7B-SPO-1ep-iter2-prompt

Text Generation • 8B • Updated 29 days ago • 17

asparius/Qwen2.5-7B-GRPO-1ep-iter2-prompt

Text Generation • 8B • Updated 29 days ago • 15

asparius/Qwen2.5-7B-Instruct-GRPO-1ep-iter16

Text Generation • 8B • Updated 29 days ago • 17

published 2 models 29 days ago

asparius/Qwen2.5-7B-Instruct-GRPO-1ep-iter16

Text Generation • 8B • Updated 29 days ago • 17

asparius/Qwen2.5-7B-GRPO-1ep-iter8-prompt

Text Generation • 8B • Updated 29 days ago • 13

updated a model 29 days ago

asparius/Qwen2.5-1.5B-SPO-1ep-iter16-prompt

Text Generation • 2B • Updated 29 days ago • 11

published 2 models 29 days ago

asparius/Qwen2.5-1.5B-SPO-1ep-iter16-prompt

Text Generation • 2B • Updated 29 days ago • 11

asparius/Qwen2.5-7B-GRPO-1ep-iter4-prompt

Text Generation • 8B • Updated 29 days ago • 12

updated a model 29 days ago

asparius/Qwen2.5-1.5B-SPO-1ep-iter8-prompt

Text Generation • 2B • Updated 29 days ago • 14

published a model 29 days ago

asparius/Qwen2.5-1.5B-SPO-1ep-iter8-prompt

Text Generation • 2B • Updated 29 days ago • 14

updated a model 29 days ago

asparius/Qwen2.5-7B-Instruct-GRPO-1ep-iter8

Text Generation • 8B • Updated 29 days ago • 14