Dynamic Cross Attention for Audio-Visual Person Verification [2403.04661]