National Taiwan University

university

Verified

https://www.ntu.edu.tw

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

kehanlu submitted a paper about 2 months ago

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

zenyn submitted a paper about 2 months ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

dlion168 submitted a paper 4 months ago

On the Fallacy of Global Token Perplexity in Spoken Language Model Evaluation

View all activity

Papers

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

View all Papers

47z

submitted a paper to Daily Papers about 1 month ago

MoVE: Translating Laughter and Tears via Mixture of Vocalization Experts in Speech-to-Speech Translation

Paper • 2604.17435 • Published Apr 19 • 3

47z

authored 2 papers about 1 month ago

TAU: A Benchmark for Cultural Sound Understanding Beyond Semantics

Paper • 2509.26329 • Published Sep 30, 2025 • 3

MoVE: Translating Laughter and Tears via Mixture of Vocalization Experts in Speech-to-Speech Translation

Paper • 2604.17435 • Published Apr 19 • 3

submitted a paper to Daily Papers about 2 months ago

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

Paper • 2603.19195 • Published Mar 19 • 4

submitted a paper to Daily Papers about 2 months ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

Paper • 2603.14636 • Published Mar 15 • 4

authored 2 papers 10 months ago

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3, 2025 • 19

STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models

Paper • 2507.15375 • Published Jul 21, 2025 • 30

authored a paper 11 months ago

A Self-Refining Framework for Enhancing ASR Using TTS-Synthesized Data

Paper • 2506.11130 • Published Jun 10, 2025 • 5

authored a paper 12 months ago

Audio-Aware Large Language Models as Judges for Speaking Styles

Paper • 2506.05984 • Published Jun 6, 2025 • 15

authored a paper 12 months ago

Towards Holistic Evaluation of Large Audio-Language Models: A Comprehensive Survey

Paper • 2505.15957 • Published May 21, 2025 • 3

authored 5 papers about 1 year ago

Can Large Language Models Be an Alternative to Human Evaluations?

Paper • 2305.01937 • Published May 3, 2023 • 3

A Closer Look into Automatic Evaluation Using Large Language Models

Paper • 2310.05657 • Published Oct 9, 2023

Pretrained Language Model Embryology: The Birth of ALBERT

Paper • 2010.02480 • Published Oct 6, 2020

REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR

Paper • 2402.03988 • Published Feb 6, 2024

Advancing Large Language Models to Capture Varied Speaking Styles and Respond Properly in Spoken Conversations

Paper • 2402.12786 • Published Feb 20, 2024

authored a paper over 1 year ago

Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging

Paper • 2412.19512 • Published Dec 27, 2024 • 9

authored a paper almost 2 years ago

DogeRM: Equipping Reward Models with Domain Knowledge through Model Merging

Paper • 2407.01470 • Published Jul 1, 2024 • 7