Black Box Language Model

Black-box language models (LLMs) are large language models whose internal workings are opaque to users, posing challenges for understanding their behavior and improving their performance. Current research focuses on developing methods to adapt, analyze, and explain these models without direct access to their internal parameters, employing techniques like prompt engineering, watermarking, and adversarial attacks to probe their capabilities and limitations. This research is crucial for mitigating risks associated with using powerful yet inscrutable AI systems and for advancing the development of more trustworthy and reliable language technologies.

Papers

May 14, 2023

Watermarking Text Generated by Black-Box Language Models
Xi Yang, Kejiang Chen, Weiming Zhang, Chang Liu, Yuang Qi, Jie Zhang, Han Fang, Nenghai Yu
Watermarking Method Black Box Language Model Text Watermarking Synonym Substitution Attack Watermarking Framework

February 21, 2023

$k$NN-Adapter: Efficient Domain Adaptation for Black-Box Language Models
Yangsibo Huang, Daogao Liu, Zexuan Zhong, Weijia Shi, Yin Tat Lee
Large Language Model Language Model Domain Adaptation Large Scale Language Model Retrieval Augmented Language Model Black Box Language Model Efficient Domain Adaptation

February 8, 2023

CodeLMSec Benchmark: Systematically Evaluating and Finding Security Vulnerabilities in Black-Box Code Language Models
Hossein Hajipour, Keno Hassler, Thorsten Holz, Lea Schönherr, Mario Fritz
Code Generation Code Language Model Code Generation Model Vulnerable Code Black Box Language Model Web Attack

December 30, 2022

Black-box language model explanation by context length probing
Ondřej Cífka, Antoine Liutkus
Large Language Model Large Pre Trained Language Model Context Length Causal Language Black Box Language Model

December 20, 2022

BMX: Boosting Natural Language Generation Metrics with Explainability
Christoph Leiter, Hoa Nguyen, Steffen Eger
High Explainability Natural Language Generation Black Box Language Model Feature Importance Explanation

December 19, 2022

PromptBoosting: Black-Box Text Classification with Ten Forward Passes
Bairu Hou, Joe O'Connor, Jacob Andreas, Shiyu Chang, Yang Zhang
Language Model Shot Learning Black Box Black Box Language Model Weak Learner Forward Pas Large Lm

April 25, 2022

Estimating the Personality of White-Box Language Models
Saketh Reddy Karra, Son The Nguyen, Theja Tulabandhula
Language Model Large Scale Language Model Personality Trait Distinct AInality Trait Black Box Language Model Open Ended Text Generation

March 31, 2022

Interpretation of Black Box NLP Models: A Survey
Shivani Choudhary, Niladri Chatterjee, Subir Kumar Saha
Timely Survey Machine Learning Model Black Box Model Abstract Interpretation Black Box Language Model