Publications

5 results at INTERSPEECH 2025

SKIP-SALSA: Skip Synchronous Fusion of ASR LLM Decoders
- - Ashish Mittal
  - Darshan Prabhu
  - et al.
- 2025
- INTERSPEECH 2025
Conference paper
Voice Activity-based Text Segmentation for ASR Text Denormalization
- - Sashi Novitasari
  - Takashi Fukuda
  - et al.
- 2025
- INTERSPEECH 2025
Conference paper
Improving End-to-end Mixed-case ASR with Knowledge Distillation and Integration of Voice Activity Cues
- - Sashi Novitasari
  - Takashi Fukuda
  - et al.
- 2025
- INTERSPEECH 2025
Conference paper
Spoken question answering for visual queries
- - Nimrod Shabtay
  - Zvi Kons
  - et al.
- 2025
- INTERSPEECH 2025
Conference paper
Exploring the Limits of Conformer CTC-Encoder for Speech Emotion Recognition using Large Language Models
- - Edmilson Da Silva Morais
  - Hagai Aronowitz
  - et al.
- 2025
- INTERSPEECH 2025
Conference paper