Progressive Multi-Scale Self-Supervised Learning for Speech Recognition [2212.03480]