Publications

960 results for Trustworthy AI

Small Models Exhibit Limited Answer Consistency in Repetition Trials of the Multiple-Choice MMLU-Redux and MedQA Benchmarks
- - Claudio Santos Pinhanez
  - Paulo Rodrigo Cavalin
  - et al.
- 2026
- AAAI 2026
Conference paper
Parameterized Abstract Interpretation for Transformer Verification
- - Pei Huang
  - Dennis Wei
  - et al.
- 2026
- AAAI 2026
Conference paper
GP-MOLFORMER-SIM: Test Time Molecular Optimization through Contextual Similarity Guidance
- - Jiri Navratil
  - Jerret Ross
  - et al.
- 2026
- AAAI 2026
Conference paper
The Shepherd Test: How Will Super Intelligent Agents Balance Care and Control in Asymmetric Relationships?
- - Djallel Bouneffouf
  - Matthew Riemer
  - et al.
- 2026
- AAAI 2026
Conference paper
Reducing the Scope of Language Models
- - David Yunis
  - siyu huo
  - et al.
- 2026
- AAAI 2026
Conference paper
CLEAR: Error Analysis via LLM-as-a-Judge Made Easy
- - Asaf Yehudai
  - Lilach Edelstein
  - et al.
- 2026
- AAAI 2026
Demo paper
A Multi-Agent Framework for Enterprise Tool Creation
- - Purna Chandra Sekhar Vakudavathu
  - Kushal Mukherjee
  - et al.
- 2026
- AAAI 2026
Workshop paper
Black-Box Uncertainty Quantification for Large Language Models via Ensemble-of-Ensembles
- - Wang Ma
  - Debarun Bhattacharjya
  - et al.
- 2026
- AAAI 2026
Workshop paper
Formalizing Observability in Agentic AI Systems
- - Daniele Lotito
  - Massimiliano Pronesti
- 2026
- AAAI 2026
Workshop paper
Who Sees the Risk? Stakeholder Conflicts and Explanatory Policies in LLM-based Risk Assessment
- - Srishti Yadav
  - Jasmina Gajcin
  - et al.
- 2026
- AAAI 2026
Workshop paper