Publications

960 results for Trustworthy AI

Optimal Transport for Efficient, Unsupervised Anomaly Detection on Industrial Data
- - Abigail Langbridge
  - Fearghal O'Donncha
  - et al.
- 2024
- Big Data 2024
Conference paper
Future Workload and Cloud Resource Usage: Insights from an Interpretable Forecasting Model
- - Amadou Ba
- 2024
- Big Data 2024
Short paper
Multivariate Stochastic Dominance via Optimal Transport and Applications to Models Benchmarking
- - Gabriel Rioux
  - Apoorva Nitsure
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Privacy without Noisy Gradients: Slicing Mechanism for Generative Model Training
- - Kristjan Greenewald
  - Yuancheng Yu
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Safe LoRA: the Silver Lining of Reducing Safety Risks when Fine-tuning Large Language Models
- - Chia-yi Hsu
  - Yu-Lin Tsai
  - et al.
- 2024
- NeurIPS 2024
Conference paper
GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models
- - Zhaitang Li
  - Pin-Yu Chen
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Distributional Preference Alignment of LLMs via Optimal Transport
- - Igor Melnyk
  - Youssef Mroueh
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes
- - Xiaomeng Xu
  - Pin-Yu Chen
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Graph-based Uncertainty Metrics for Long-form Language Model Generations
- - Mingjian Jiang
  - Yangjun Yangjun
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models
- - Shengyun Peng
  - Pin-Yu Chen
  - et al.
- 2024
- NeurIPS 2024
Conference paper