Training Audio Captioning Models without Audio [2309.07372]