Compositional Ability

Compositional ability in artificial intelligence focuses on building systems that can solve complex tasks by combining simpler, learned skills, mirroring human cognitive processes. Current research emphasizes developing models that effectively decompose complex inputs (text, images, audio, etc.) into manageable sub-tasks, often leveraging large language models (LLMs) and diffusion models to generate and compose outputs. This area is crucial for advancing AI capabilities in areas like image and video generation, autonomous navigation, and multimodal reasoning, ultimately leading to more robust and versatile AI systems.

Papers

February 15, 2024

LoraRetriever: Input-Aware LoRA Retrieval and Composition for Mixed Tasks in the Wild
Ziyu Zhao, Leilei Gan, Guoyin Wang, Wangchunshu Zhou, Hongxia Yang, Kun Kuang, Fei Wu
Large Language Model Wild Challenge Open Domain Compositional Ability Mixed Task Batch Inference

January 4, 2024

LLM Augmented LLMs: Expanding Capabilities through Composition
Rachit Bansal, Bidisha Samanta, Siddharth Dalmia, Nitish Gupta, Shikhar Vashishth, Sriram Ganapathy, Abhishek Bapna, Prateek Jain, Partha Talukdar
Language Model Code Generation Low Resource Language Capability Evolution Compositional Ability Foundational Model Code Model LLM Based Augmentation

December 19, 2023

Scene-Conditional 3D Object Stylization and Composition
Jinghao Zhou, Tomas Jakab, Philip Torr, Christian Rupprecht
3D Generative 3D Asset Compositional Ability Identity Stylization 3D Scene Stylization Differentiable Ray

December 10, 2023

Separate-and-Enhance: Compositional Finetuning for Text2Image Diffusion Models
Zhipeng Bao, Yijun Li, Krishna Kumar Singh, Yu-Xiong Wang, Martial Hebert
Text to Image Diffusion Model Compositional Ability Image Text Alignment T2I Diffusion Model Diffusion Based Text to Image Object Generation Compound Figure Separation

November 29, 2023

Composition of Nondeterministic and Stochastic Services for LTLf Task Specifications
Giuseppe De Giacomo, Marco Favorito, Luciana Silo
Temporal Logic Compositional Ability Task Specification Stochastic Scheduling LTLf Specification LTLf Synthesis Service Composition

November 27, 2023

Compositional Chain-of-Thought Prompting for Large Multimodal Models
Chancharik Mitra, Brandon Huang, Trevor Darrell, Roei Herzig
Large Multimodal Model Scene Graph Compositional Ability Compositional Visual Reasoning Scene Graph Annotation

October 13, 2023

Compositional Abilities Emerge Multiplicatively: Exploring Diffusion Models on a Synthetic Task
Maya Okawa, Ekdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka
Diffusion Model Generative Model Conditional Diffusion Model Compositional Generalization Compositional Ability Synthetic Task

October 3, 2023

Ravestate: Distributed Composition of a Causal-Specificity-Guided Interaction Policy
Joseph Birkner, Andreas Dolp, Negin Karimi, Nikita Basargin, Alona Kharchenko, Rafael Hostettler
Compositional Ability Robot Policy Symbol Detection Slot Based

September 26, 2023

InternLM-XComposer: A Vision-Language Large Model for Advanced Text-image Comprehension and Composition
Pan Zhang, Xiaoyi Dong, Bin Wang, Yuhang Cao, Chao Xu, Linke Ouyang, Zhiyuan Zhao, Haodong Duan, Songyang Zhang, Shuangrui Ding, Wenwei Zhang, Hang Yan, Xinyue Zhang, Wei Li, Jingwen Li, Kai Chen, Conghui He, Xingcheng Zhang, Yu Qiao, Dahua Lin, Jiaqi Wang
Large Vision Language Model Compositional Ability Text Comprehension Text Image Composition

September 8, 2023

Compositional Learning of Visually-Grounded Concepts Using Reinforcement
Zijun Lin, Haidi Azaman, M Ganesh Kumar, Cheston Tan
Deep Reinforcement Learning Positive Reinforcement Visual Concept Compositional Ability Compositional Language Compositional Learning

September 6, 2023

Presenting the SWTC: A Symbolic Corpus of Themes from John Williams' Star Wars Episodes I-IX
Claire Arthur, Frank Lehman, John McNamara
Large Corpus Compositional Ability Thematic Analysis Musical Form

September 2, 2023

Compositional Diffusion-Based Continuous Constraint Solvers
Zhutian Yang, Jiayuan Mao, Yilun Du, Jiajun Wu, Joshua B. Tenenbaum, Tomás Lozano-Pérez, Leslie Pack Kaelbling
Compositional Ability Composite Diffusion Hybrid Constraint

August 14, 2023

Compositional nonlinear audio signal processing with Volterra series
Jake Araujo-Simon
Audio Processing Compositional Ability Nonlinear Transformation Topological Signal

July 16, 2023

Tangent Transformers for Composition, Privacy and Removal
Tian Yu Liu, Aditya Golatkar, Stefano Soatto
Fine Tuning Privacy Policy Compositional Ability Active Removal

June 28, 2023

ICSVR: Investigating Compositional and Syntactic Understanding in Video Retrieval Models
Avinash Madasu, Vasudev Lal
Video Understanding Compositional Ability Video Retrieval Video Retrieval Datasets Video Retrieval Model Syntactic Evaluation

June 5, 2023

Composition and Deformance: Measuring Imageability with a Text-to-Image Model
Si Wu, David A. Smith
Text to Image Model Image Caption Compositional Ability Text to Image Generation Model Deformable Nature

May 24, 2023

PaCE: Unified Multi-modal Dialogue Pre-training with Progressive and Compositional Experts
Yunshui Li, Binyuan Hui, ZhiChao Yin, Min Yang, Fei Huang, Yongbin Li
Unified Alignment Compositional Ability Multimodal Dialogue Left Leaning Pace Adaptive Multi Modal Dialogue Multi Modal Pre Training

May 18, 2023

Autonomous sputter synthesis of thin film nitrides with composition controlled by Bayesian optimization of optical plasma emission
Davi M. Febba, Kevin R. Talley, Kendal Johnson, Stephen Schaefer, Sage R. Bauers, John S. Mangum, Rebecca W. Smaha, Andriy Zakutayev
Bayesian Optimization Material Discovery Compositional Ability Plasma Dynamic Thin Film

March 21, 2023

CC3D: Layout-Conditioned Generation of Compositional 3D Scenes
Sherwin Bahmani, Jeong Joon Park, Despoina Paschalidou, Xingguang Yan, Gordon Wetzstein, Leonidas Guibas, Andrea Tagliasacchi
3D Scene Conditional Generative Compositional Ability Synthetic 3D Complex 3D Scene

December 8, 2022

Towards Understanding Fairness and its Composition in Ensemble Machine Learning
Usman Gohar, Sumon Biswas, Hridesh Rajan
Ensemble Model Fairness Metric Compositional Ability Fair Algorithm Ensemble Machine Learning