Provable Length Generalization in Sequence Prediction via Spectral Filtering [2411.01035]