On Efficient Transformer-Based Image Pre-training for Low-Level Vision [2112.10175]