Opara: Exploiting Operator Parallelism for Expediting DNN Inference on GPUs [2312.10351]