39 36 30

Shizhe Diao

shizhediao2

https://shizhediao.github.io/

AI & ML interests

LLM pre-training and reasoning

Recent Activity

upvoted a paper 12 days ago

PhyCritic: Multimodal Critic Models for Physical AI

upvoted a paper 13 days ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

upvoted a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

upvoted a paper 12 days ago

PhyCritic: Multimodal Critic Models for Physical AI

Paper • 2602.11124 • Published 13 days ago • 51

upvoted a paper 13 days ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published 25 days ago • 101

upvoted a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 228

liked a model about 2 months ago

nvidia/Nemotron-Flash-1B

Text Generation • 1.0B • Updated Jan 9 • 3.77k • 27

updated a dataset 2 months ago

nvidia/ToolScale

Viewer • Updated Dec 17, 2025 • 4.06k • 407 • 188

New activity in nvidia/ToolScale 2 months ago

Add metadata and refactor to ToolScale Dataset Card

#3 opened 3 months ago by

nielsr

posted an update 3 months ago

Post

164

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration (2511.21689)

reacted to di-zhang-fdu's post with 🔥 3 months ago

Post

1946

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration (2511.21689)

upvoted 2 papers 3 months ago

Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

Paper • 2511.18890 • Published Nov 24, 2025 • 35

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Paper • 2511.21689 • Published Nov 26, 2025 • 124

New activity in nvidia/Nemotron-Orchestrator-8B 3 months ago

Adding `transformers` as the library name

#18 opened 3 months ago by

ariG23498

liked a dataset 3 months ago

nvidia/ToolScale

Viewer • Updated Dec 17, 2025 • 4.06k • 407 • 188

published a dataset 3 months ago

nvidia/ToolScale

Viewer • Updated Dec 17, 2025 • 4.06k • 407 • 188

liked a model 3 months ago

nvidia/Nemotron-Orchestrator-8B

Text Generation • Updated Dec 2, 2025 • 14.7k • 556

published a model 3 months ago

nvidia/Nemotron-Orchestrator-8B

Text Generation • Updated Dec 2, 2025 • 14.7k • 556

updated a model 3 months ago

nvidia/Nemotron-Orchestrator-8B

Text Generation • Updated Dec 2, 2025 • 14.7k • 556

New activity in nvidia/Nemotron-Orchestrator-8B 3 months ago

Upload merges.txt with huggingface_hub

#1 opened 3 months ago by

bestluck123

Upload config.json with huggingface_hub

#2 opened 3 months ago by

bestluck123

Upload model-00006-of-00007.safetensors with huggingface_hub

#3 opened 3 months ago by

bestluck123

Upload model-00003-of-00007.safetensors with huggingface_hub

#4 opened 3 months ago by

bestluck123

Shizhe Diao

AI & ML interests

Recent Activity

Organizations

shizhediao2's activity

Add metadata and refactor to ToolScale Dataset Card

Adding `transformers` as the library name

Upload merges.txt with huggingface_hub

Upload config.json with huggingface_hub

Upload model-00006-of-00007.safetensors with huggingface_hub

Upload model-00003-of-00007.safetensors with huggingface_hub