Cross Table

Cross-table analysis focuses on leveraging information across multiple, heterogeneous tabular datasets to improve machine learning model performance and efficiency. Current research emphasizes developing pretrained models, often employing Transformer architectures, that learn generalizable representations from diverse tables, addressing challenges like inconsistent schemas and data types through techniques such as federated learning and self-supervised learning (e.g., masked cell recovery). These advancements aim to enhance the accuracy and speed of downstream tasks like cardinality estimation and tabular prediction, impacting various fields by enabling more efficient data analysis and improved model generalizability.

Papers

June 7, 2024

CTSyn: A Foundational Model for Cross Tabular Data Generation
Xiaofeng Lin, Chenheng Xu, Matthew Yang, Guang Cheng
End to End Tabular Data Foundational Model Sound Synthesizer Generative Foundation Model Heterogeneous Tabular Data Cross Table

June 3, 2024

PRICE: A Pretrained Model for Cross-Database Cardinality Estimation
Tianjing Zeng, Junwei Lan, Jiahong Ma, Wenqing Wei, Rong Zhu, Pengfei Li, Bolin Ding, Defu Lian, Zhewei Wei, Jingren Zhou
Curious Price Pretrained Model Cardinality Estimation Cross Table CardEst Method

June 1, 2024

Cross-Table Pretraining towards a Universal Function Space for Heterogeneous Tabular Data
Jintai Chen, Zhen Lin, Qiyuan Chen, Jimeng Sun
Cross Dataset Function Space Tabular Learning Heterogeneous Tabular Data Tabular Prediction Task Cross Table

September 29, 2023

Scaling Experiments in Self-Supervised Cross-Table Representation Learning
Maximilian Schambach, Dominique Paul, Johannes S. Otterbach
Large Scale Tabular Representation Learning Cross Table

July 10, 2023

Towards Cross-Table Masked Pretraining for Web Data Mining
Chao Ye, Guoshan Lu, Haobo Wang, Liyao Li, Sai Wu, Gang Chen, Junbo Zhao
Tabular Data Masked Modeling Web Mining Cross Table

May 10, 2023

XTab: Cross-table Pretraining for Tabular Transformers
Bingzhao Zhu, Xingjian Shi, Nick Erickson, Mu Li, George Karypis, Mahsa Shoaran
Tabular Learning Tabular Transformer Tabular Prediction Task Cross Table