Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data [2410.05078]