JVID: Joint Video-Image Diffusion for Visual-Quality and Temporal-Consistency in Video Generation [2409.14149]