Publications

31 results at ACL 2025

Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation
- - Shivalika Singh
  - Angelika Romanou
  - et al.
- 2025
- ACL 2025
Conference paper
A Perspective on LLM Data Generation with Few-shot Examples: from Intent to Kubernetes Manifest
- - Antonino Angi
  - Liubov Nedoshivina
  - et al.
- 2025
- ACL 2025
Conference paper
BI-Bench : A Comprehensive Benchmark Dataset and Unsupervised Evaluation for BI Systems
- - Ankush Gupta
  - Aniya Aggarwal
  - et al.
- 2025
- ACL 2025
Conference paper
REAL-MM-RAG: A Real-World Multi-Modal Retrieval Benchmark
- - Navve Wasserman
  - Roi Pony
  - et al.
- 2025
- ACL 2025
Conference paper
Conceptual Diagnostics for Knowledge Graphs and Large Language Models
- - Rosario Uceda-Sosa
  - Maria Chang
  - et al.
- 2025
- ACL 2025
Conference paper
DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation
- - Eliya Habba
  - Ofir Arviv
  - et al.
- 2025
- ACL 2025
Conference paper
Query-driven Document-level Scientific Evidence Extraction from Biomedical Studies
- - Massimiliano Pronesti
  - Joao Bettencourt-Silva
  - et al.
- 2025
- ACL 2025
Conference paper
Combining Domain and Alignment Vectors Provides Better Knowledge-Safety Trade-offs in LLMs
- - Megh Thakkar
  - Quentin Fournier
  - et al.
- 2025
- ACL 2025
Conference paper
Multi-Sense Embeddings for Language Models and Knowledge Distillation
- - Qitong Wang
  - Mohammed Zaki
  - et al.
- 2025
- ACL 2025
Conference paper
MTRAG: A Multi-Turn Conversational Benchmark for Evaluating Retrieval-Augmented Generation Systems
- - Yannis Katsis
  - Sara Rosenthal
  - et al.
- 2025
- ACL 2025
Conference paper