Crowd Sourced Data

Crowd-sourced data leverages contributions from numerous individuals to generate large datasets for various applications, primarily aiming to overcome limitations of traditional data collection methods in terms of cost, scale, and accessibility. Current research focuses on improving data quality through techniques like iterative annotation strategies, quality control measures at multiple stages of data acquisition, and sophisticated algorithms for outlier detection and bias correction, often employing machine learning models such as neural networks (including deep mixture density networks and BERT variants) and Markov chains. This approach significantly impacts diverse fields, enabling advancements in areas like language model benchmarking, 3D reconstruction, environmental modeling, and real-time crisis response by providing large-scale, diverse datasets previously unattainable through conventional means.

Papers

May 3, 2022

Modeling and Correcting Bias in Sequential Evaluation
Jingyan Wang, Ashwin Pananjady
Online Algorithm Crowd Sourced Data Sequential Computation

January 25, 2022

A deep mixture density network for outlier-corrected interpolation of crowd-sourced weather data
Charlie Kirkwood, Theo Economou, Henry Odbert, Nicolas Pugeault
Spatio Temporal Observational Data Climate Model Weather Data Mixture Density Network Crowd Sourced Data

January 20, 2022

EdgeMap: CrowdSourcing High Definition Map in Automotive Edge Computing
Qiang Liu, Yuru Zhang, Haoxin Wang
Connected Vehicle Vehicle Data Crowd Sourced Data Edge Map Vehicle Edge Computing

January 17, 2022

PerPaDa: A Persian Paraphrase Dataset based on Implicit Crowdsourcing Data Collection
Salar Mohtaj, Fatemeh Tavakkoli, Habibollah Asghari
Effective Paraphrasing Plagiarism Detection Paraphrase Detection Crowd Sourced Data Paraphrase Dataset

December 3, 2021

Practitioner-Centric Approach for Early Incident Detection Using Crowdsourced Data for Emergency Services
Yasas Senarath, Ayan Mukhopadhyay, Sayyed Mohsen Vazirizade, Hemant Purohit, Saideep Nannapaneni, Abhishek Dubey
Crowd Sourced Data Incident Report Incident Detection

Crowd Sourced Data

Papers

Modeling and Correcting Bias in Sequential Evaluation

A deep mixture density network for outlier-corrected interpolation of crowd-sourced weather data

EdgeMap: CrowdSourcing High Definition Map in Automotive Edge Computing

PerPaDa: A Persian Paraphrase Dataset based on Implicit Crowdsourcing Data Collection

Practitioner-Centric Approach for Early Incident Detection Using Crowdsourced Data for Emergency Services