Domain Specific

Domain-specific adaptation of large language models (LLMs) focuses on enhancing their performance and reliability within specialized fields by overcoming limitations stemming from data scarcity and domain-specific terminology. Current research emphasizes developing effective methods for data curation, including synthetic data generation and techniques like knowledge distillation to transfer knowledge from domain-specific to general-purpose models, alongside novel architectures like graph-oriented databases for improved performance and maintenance. This work is crucial for broadening the applicability of LLMs to diverse sectors, improving efficiency in areas like finance, healthcare, and scientific research, and addressing concerns about bias and hallucination in sensitive domains.

Papers

May 20, 2024

STYLE: Improving Domain Transferability of Asking Clarification Questions in Large Language Model Powered Conversational Agents
Yue Chen, Chen Huang, Yang Deng, Wenqiang Lei, Dingnan Jin, Jia Liu, Tat-Seng Chua
Domain Specific Style Consistency LLM Reasoning Conversational Search Clarification Question Domain Transferability

May 17, 2024

From Generalist to Specialist: Improving Large Language Models for Medical Physics Using ARCoT
Jace Grandinetti, Rafe McBeth
Domain Specific Domain Knowledge Domain Performance Generalist Learner Expertise Level

May 14, 2024

Cross-Domain Feature Augmentation for Domain Generalization
Yingnan Liu, Yingtian Zou, Rui Qiao, Fusheng Liu, Mong Li Lee, Wynne Hsu
Data Augmentation Domain Generalization Domain Specific Cross Domain Feature Augmentation

May 13, 2024

Control Token with Dense Passage Retrieval
Juhwan Lee, Jisu Kim
Large Language Model Domain Specific Information Retrieval K TOKEN Dense Passage Retrieval Information Dense

May 8, 2024

Searching for Programmatic Policies in Semantic Spaces
Rubens O. Moraes, Levi H. S. Lelis
Domain Specific Semantic Space Language Space Programmatic Policy

May 6, 2024

Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training
Zexuan Zhong, Mengzhou Xia, Danqi Chen, Mike Lewis
Language Model Domain Specific Mixture of Expert Autoregressive Language Model

May 2, 2024

UniGen: Universal Domain Generalization for Sentiment Classification via Zero-shot Dataset Generation
Juhwan Choi, Yeonghwa Kim, Seunguk Yu, JungMin Yun, YoungBin Kim
Zero Shot Pre Trained Language Model Sentiment Analysis Domain Specific Task Specific Prompt Based Few Shot

April 30, 2024

April 29, 2024

April 28, 2024

April 27, 2024

April 23, 2024

Towards Universal Dense Blocking for Entity Resolution
Tianshu Wang, Hongyu Lin, Xianpei Han, Xiaoyang Chen, Boxi Cao, Le Sun
Domain Specific Entity Resolution

April 2, 2024

FLawN-T5: An Empirical Examination of Effective Instruction-Tuning Data Mixtures for Legal Reasoning
Joel Niklaus, Lucia Zheng, Arya D. McCarthy, Christopher Hahn, Brian M. Rosen, Peter Henderson, Daniel E. Ho, Garrett Honke, Percy Liang, Christopher Manning
Language Model Empirical Study Instruction Tuning Domain Specific Legal Reasoning Instruction Datasets T5 Model Legal Article

March 26, 2024

March 24, 2024

Cyber-Security Knowledge Graph Generation by Hierarchical Nonnegative Matrix Factorization
Ryan Barron, Maksim E. Eren, Manish Bhattarai, Selma Wanna, Nicholas Solovyev, Kim Rasmussen, Boian S. Alexandrov, Charles Nicholas, Cynthia Matuszek
Knowledge Graph Domain Specific Top Level Ontology Matrix Factorization Interpretable Knowledge

Domain Specific

Papers

STYLE: Improving Domain Transferability of Asking Clarification Questions in Large Language Model Powered Conversational Agents

From Generalist to Specialist: Improving Large Language Models for Medical Physics Using ARCoT

Cross-Domain Feature Augmentation for Domain Generalization

Control Token with Dense Passage Retrieval

Searching for Programmatic Policies in Semantic Spaces

Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training

UniGen: Universal Domain Generalization for Sentiment Classification via Zero-shot Dataset Generation

Safe Training with Sensitive In-domain Data: Leveraging Data Fragmentation To Mitigate Linkage Attacks

GRAMMAR: Grounded and Modular Methodology for Assessment of Closed-Domain Retrieval-Augmented Language Model

Simplifying Multimodality: Unimodal Approach to Multimodal Challenges in Radiology with General-Domain Large Language Model

A Framework to Model ML Engineering Processes

TextGram: Towards a better domain-adaptive pretraining

CRE-LLM: A Domain-Specific Chinese Relation Extraction Framework with Fine-tuned Large Language Model

Testing and Understanding Erroneous Planning in LLM Agents through Synthesized User Inputs

Middle Architecture Criteria

Towards Universal Dense Blocking for Entity Resolution

FLawN-T5: An Empirical Examination of Effective Instruction-Tuning Data Mixtures for Legal Reasoning

Large Language Models as Financial Data Annotators: A Study on Effectiveness and Efficiency

Juru: Legal Brazilian Large Language Model from Reputable Sources

Cyber-Security Knowledge Graph Generation by Hierarchical Nonnegative Matrix Factorization