LION-datasets - a Columbia-NLP Collection

Columbia-NLP 's Collections

LION-datasets

updated Jul 10, 2024

Datasets used to train the LION pipeline. Paper: https://arxiv.org/abs/2407.06542; Code: https://github.com/Columbia-NLP-Lab/LionAlignment

Columbia-NLP/DPO-Nectar

Viewer • Updated Jul 10, 2024 • 183k • 25
Columbia-NLP/DPO-distilabel-capybara-dpo-7k-binarized

Viewer • Updated Jul 10, 2024 • 7.56k • 43
Columbia-NLP/DPO-distilabel-intel-orca-dpo-pairs_cleaned

Viewer • Updated Jul 10, 2024 • 12.8k • 14
Columbia-NLP/DPO-UltraFeedback_binarized

Viewer • Updated Jul 10, 2024 • 62.7k • 46
Columbia-NLP/DPO-py-dpo-v0.1

Viewer • Updated Jul 10, 2024 • 9.47k • 27
Columbia-NLP/DPO-tldr-summarisation-preferences

Viewer • Updated Jul 10, 2024 • 177k • 153 • 1
Columbia-NLP/DPO-HelpSteer

Viewer • Updated Jul 10, 2024 • 9.17k • 37
Columbia-NLP/DPO-PKU-SafeRLHF

Viewer • Updated Jul 10, 2024 • 136k • 24 • 2
Columbia-NLP/DPO-hh-rlhf

Viewer • Updated Jul 10, 2024 • 169k • 96