Robust Domain Generalization for Multi-modal Object Recognition [2408.05831]