Domain Specific

Domain-specific adaptation of large language models (LLMs) focuses on enhancing their performance and reliability within specialized fields by overcoming limitations stemming from data scarcity and domain-specific terminology. Current research emphasizes developing effective methods for data curation, including synthetic data generation and techniques like knowledge distillation to transfer knowledge from domain-specific to general-purpose models, alongside novel architectures like graph-oriented databases for improved performance and maintenance. This work is crucial for broadening the applicability of LLMs to diverse sectors, improving efficiency in areas like finance, healthcare, and scientific research, and addressing concerns about bias and hallucination in sensitive domains.

Papers

July 20, 2024

Unveiling the Decision-Making Process in Reinforcement Learning with Genetic Programming
Manuel Eberhardinger, Florian Rupp, Johannes Maucher, Setareh Maghsudi
Reinforcement Learning Machine Learning Domain Specific Genetic Programming Decision Making Process Unpredictable Action

July 19, 2024

Domain-Specific Pretraining of Language Models: A Comparative Study in the Medical Field
Tobias Kerner
Language Model Comparative Study Domain Specific General Purpose Language Model Mixed Domain

July 17, 2024

Domain-specific or Uncertainty-aware models: Does it really make a difference for biomedical text classification?
Aman Sinha, Timothee Mickus, Marianne Clausel, Mathieu Constant, Xavier Coubez
Language Model Text Classification Domain Specific NLP Community Qualitative Difference Uncertainty Awareness Uncertainty Aware Model Domain Specific Foundation Model Domain Specificity

July 15, 2024

$\texttt{MixGR}$: Enhancing Retriever Generalization for Scientific Domain through Complementary Granularity
Fengyu Cai, Xinran Zhao, Tong Chen, Sihao Chen, Hongming Zhang, Iryna Gurevych, Heinz Koeppl
Domain Specific Information Retrieval Multi Granularity Dense Retriever Scientific Domain Retrieval Datasets

July 14, 2024

Comparing Complex Concepts with Transformers: Matching Patent Claims Against Natural Language Text
Matthias Blume, Ghobad Heidari, Christoph Hewel
Natural Language Processing Transformer Megatron Decepticons Domain Specific Natural Language Text Patent Text Intellectual Property

July 9, 2024

July 8, 2024

Large Language Models for Judicial Entity Extraction: A Comparative Study
Atin Sakkeer Hussain, Anu Thomas
Comparative Study Domain Specific Named Entity Recognition Legal Element Extraction Dataset

July 7, 2024

Training Task Experts through Retrieval Based Distillation
Jiaxin Ge, Xueying Jia, Vijay Viswanathan, Hongyin Luo, Graham Neubig
Large Language Model Domain Specific Task Specific Task Expert

July 3, 2024

June 30, 2024

Chest-Diffusion: A Light-Weight Text-to-Image Model for Report-to-CXR Generation
Peng Huang, Xue Gao, Lihong Huang, Jing Jiao, Xiaokang Li, Yuanyuan Wang, Yi Guo
Diffusion Model Text to Image Generation Domain Specific Text to Image Model Stable Diffusion Transformer Based Diffusion Model CXR Report

June 29, 2024

SHADE: Semantic Hypernym Annotator for Domain-specific Entities -- DnD Domain Use Case
Akila Peiris, Nisansa de Silva
Domain Specific Annotation Tool Data Annotation Annotation Effort

June 26, 2024

June 25, 2024

How Good Is It? Evaluating the Efficacy of Common versus Domain-Specific Prompts on Foundational Large Language Models
Oluyemi Enoch Amujo, Shanchieh Jay Yang
Large Language Model Domain Specific Downstream Task Multi Domain Learning Domain Specific Prompt

Domain Specific

Papers

Unveiling the Decision-Making Process in Reinforcement Learning with Genetic Programming

Domain-Specific Pretraining of Language Models: A Comparative Study in the Medical Field

Domain-specific or Uncertainty-aware models: Does it really make a difference for biomedical text classification?

$\texttt{MixGR}$: Enhancing Retriever Generalization for Scientific Domain through Complementary Granularity

Comparing Complex Concepts with Transformers: Matching Patent Claims Against Natural Language Text

AnyTaskTune: Advanced Domain-Specific Solutions through Task-Fine-Tuning

PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods

VRDSynth: Synthesizing Programs for Multilingual Visually Rich Document Information Extraction

Large Language Models for Judicial Entity Extraction: A Comparative Study

Training Task Experts through Retrieval Based Distillation

Domain-Aware Fine-Tuning of Foundation Models

Precision at Scale: Domain-Specific Datasets On-Demand

PII-Compass: Guiding LLM training data extraction prompts towards the target PII via grounding

ConCodeEval: Evaluating Large Language Models for Code Constraints in Domain-Specific Languages

A Comparative Study of DSL Code Generation: Fine-Tuning vs. Optimized Retrieval Augmentation

Chest-Diffusion: A Light-Weight Text-to-Image Model for Report-to-CXR Generation

SHADE: Semantic Hypernym Annotator for Domain-specific Entities -- DnD Domain Use Case

Human-AI Collaborative Taxonomy Construction: A Case Study in Profession-Specific Writing Assistants

Facial Image Feature Analysis and its Specialization for Fr\'echet Distance and Neighborhoods

How Good Is It? Evaluating the Efficacy of Common versus Domain-Specific Prompts on Foundational Large Language Models