Recursive Joint Cross-Modal Attention for Multimodal Fusion in Dimensional Emotion Recognition [2403.13659]