Auditing Delphi

Auditing Delphi, and similar large language models (LLMs), focuses on evaluating their performance and biases, particularly concerning controversial topics and moral reasoning. Current research investigates how these models handle complex prompts, analyzing their responses across diverse political viewpoints and social contexts using techniques like reinforcement learning and curriculum learning to improve prompt-following and question generation. This work is crucial for understanding and mitigating potential biases in LLMs, ultimately aiming to improve their reliability and ethical implications in various applications.

Papers

December 7, 2023

iDesigner: A High-Resolution and Complex-Prompt Following Text-to-Image Diffusion Model for Interior Design
Ruyi Gan, Xiaojun Wu, Junyu Lu, Yuanhe Tian, Dixiang Zhang, Ziwei Wu, Renliang Sun, Chang Liu, Jiaxing Zhang, Pingjian Zhang, Yan Song
Image Generation Text to Image Diffusion Model Text to Image Model High Resolution Indoor Environment CLIP Model Auditing Delphi

October 27, 2023

DELPHI: Data for Evaluating LLMs' Performance in Handling Controversial Issues
David Q. Sun, Artem Abzaliev, Hadas Kotek, Zidi Xiu, Christopher Klein, Jason D. Williams
Large Language Model Raw Data System Performance QA Datasets Conversational System Public Discourse Controversial Topic Auditing Delphi

June 22, 2023

Apolitical Intelligence? Auditing Delphi's responses on controversial political issues in the US
Jonathan H. Rystrøm
Generative Language Model Non Negative Textual Response United State Agnostic Approach Political Sentiment Controversial Topic Auditing Delphi

December 20, 2022

ClarifyDelphi: Reinforced Clarification Questions with Defeasibility Rewards for Social and Moral Situations
Valentina Pyatkin, Jena D. Hwang, Vivek Srikumar, Ximing Lu, Liwei Jiang, Yejin Choi, Chandra Bhagavatula
Moral Judgment Moral Dilemma Defeasible Reasoning Clarification Question Ethical Principle Moral Development Auditing Delphi

May 25, 2022

Does Moral Code Have a Moral Code? Probing Delphi's Moral Philosophy
Kathleen C. Fraser, Svetlana Kiritchenko, Esma Balkir
Human Value Moral Philosophy Ethical Principle Human Moral Auditing Delphi

Auditing Delphi

Papers

iDesigner: A High-Resolution and Complex-Prompt Following Text-to-Image Diffusion Model for Interior Design

DELPHI: Data for Evaluating LLMs' Performance in Handling Controversial Issues

Apolitical Intelligence? Auditing Delphi's responses on controversial political issues in the US

ClarifyDelphi: Reinforced Clarification Questions with Defeasibility Rewards for Social and Moral Situations

Does Moral Code Have a Moral Code? Probing Delphi's Moral Philosophy