OpenDataArena

community

https://opendataarena.github.io

AI & ML interests

Data-centric AI, LLM, MLLM

Recent Activity

QizhiPei authored a paper 4 days ago

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

QizhiPei authored a paper 4 days ago

Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

QizhiPei authored a paper 4 days ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

View all activity

Papers

Tracing the Roots: A Multi-Agent Framework for Uncovering Data Lineage in Post-Training LLMs

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

View all Papers

OpenDataArena 's models 11

OpenDataArena/ODA-Fin-RL-8B

Reinforcement Learning • 8B • Updated Mar 10 • 45 • 1

OpenDataArena/ODA-Fin-SFT-8B

Question Answering • 308k • Updated Mar 10 • 25 • 1

OpenDataArena/MMFineReason-4B

Visual Question Answering • Updated Jan 30 • 25 • 14

OpenDataArena/MMFineReason-2B

Visual Question Answering • 2B • Updated Jan 30 • 8 • 8

OpenDataArena/MMFineReason-8B

Visual Question Answering • 9B • Updated Jan 30 • 106 • 10

OpenDataArena/Qwen3-8B-ODA-Math-460k

Text Generation • 308k • Updated Jan 21 • 9 • 2

OpenDataArena/Qwen2.5-7B-ODA-Math-460k

Text Generation • 8B • Updated Jan 21 • 2

OpenDataArena/Qwen3-8B-ODA-Mixture-100k

Text Generation • 308k • Updated Jan 21 • 5 • 1

OpenDataArena/Qwen3-8B-ODA-Mixture-500k

Text Generation • 308k • Updated Jan 21 • 635

OpenDataArena/Qwen2.5-7B-ODA-Mixture-100k

Text Generation • 333k • Updated Jan 21 • 1

OpenDataArena/Qwen2.5-7B-ODA-Mixture-500k

Text Generation • 333k • Updated Jan 21 • 7 • 2