Multiple Imputation

Multiple imputation addresses the pervasive problem of missing data in datasets by creating multiple plausible imputed datasets, each reflecting the uncertainty inherent in the missing values. Current research focuses on improving imputation accuracy and efficiency, particularly for high-dimensional data, exploring advanced methods like neural networks and incorporating auxiliary information such as natural language processing outputs. These advancements aim to reduce bias and improve the reliability of downstream analyses, impacting diverse fields from healthcare to econometrics by enabling more robust and accurate inferences from incomplete data.

Papers

July 29, 2024

Imputation for prediction: beware of diminishing returns
Marine Le Morvan, Gaël Varoquaux
Human Prediction Customer Service Imputation Algorithm Imputation Method Knowledge Enhanced Conditional Imputation Imputation Accuracy Multiple Imputation

May 17, 2024

High-dimensional multiple imputation (HDMI) for partially observed confounders including natural language processing-derived auxiliary covariates
Janick Weberpals, Pamela A. Shaw, Kueiyu Joshua Lin, Richard Wyss, Joseph M Plasek, Li Zhou, Kerry Ngan, Thomas DeRamus, Sudha R. Raman, Bradley G. Hammill, Hana Lee, Sengwee Toh, John G. Connolly, Kimberly J. Dandreo, Fang Tian, Wei Liu, Jie Li, José J. Hernández-Muñoz, Sebastian Schneeweiss, Rishi J. Desai
Natural Language Imputation Algorithm Text Based Confounders Auxiliary Covariates Multiple Imputation

March 13, 2024

On the Performance of Imputation Techniques for Missing Values on Healthcare Datasets
Luke Oluwaseye Joel, Wesley Doorsamy, Babu Sena Paul
System Performance Imputation Algorithm Imputation Method Policy Value Knowledge Enhanced Conditional Imputation Healthcare Datasets Multiple Imputation

November 13, 2023

Missing Value Imputation for Multi-attribute Sensor Data Streams via Message Propagation (Extended Version)
Xiao Li, Huan Li, Hua Lu, Christian S. Jensen, Varun Pandey, Volker Markl
Data Stream Extended Version Imputation Method Missing Value Imputation Multiple Imputation Message Propagation

August 15, 2023

Semi-Supervised Learning with Multiple Imputations on Non-Random Missing Labels
Jason Lu, Michael Ma, Huaze Xu, Zixi Xu
Semi Supervised Learning Propensity Score Missing Label Deep Imputation Multiple Imputation

May 2, 2023

MISNN: Multiple Imputation via Semi-parametric Neural Networks
Zhiqi Bu, Zongyu Dai, Yiliang Zhang, Qi Long
Imputation Accuracy Imputation Model Neural Parametric Model Adaptive Lasso Multiple Imputation

September 30, 2022

Leveraging variational autoencoders for multiple data imputation
Breeshey Roskams-Hieter, Jude Wells, Sara Wade
Variational Autoencoders Imputation Algorithm Multiple Imputation

February 28, 2022

Missing Value Estimation using Clustering and Deep Learning within Multiple Imputation Framework
Manar D Samad, Sakib Abrar, Norou Diawara
Deep Learning Imputation Algorithm Missing Value Imputation Accuracy Imputation Model Multiple Imputation