Toxicity Classification

Toxicity classification aims to automatically identify harmful or offensive language in text and speech, focusing on improving accuracy and fairness across diverse languages and demographics. Current research emphasizes developing robust models, often leveraging large language models and cross-modal learning techniques (combining text and speech data), while also addressing biases and limitations in existing datasets through innovative data creation methods and improved evaluation benchmarks. This field is crucial for mitigating online harms and fostering safer digital environments, impacting content moderation, social media platforms, and the development of responsible AI systems.

Papers

November 26, 2024

Leveraging Large Language Models and Topic Modeling for Toxicity Classification
Haniyeh Ehsani Oskouie, Christina Chance, Claire Huang, Margaret Capetz, Elizabeth Eyeson, Majid Sarrafzadeh
Classification Code Topic Modeling Non Toxic Toxic Text Content Moderator Toxicity Classification

October 18, 2024

Soft-Label Integration for Robust Toxicity Classification
Zelei Cheng, Xian Wu, Jiahao Yu, Shuo Han, Xin-Qiang Cai, Xinyu Xing
Soft Label Toxicity Detection Crowdsourced Annotation Toxicity Classification

June 27, 2024

IndoToxic2024: A Demographically-Enriched Dataset of Hate Speech and Toxicity Types for Indonesian Language
Lucky Susanto, Musa Izzanardi Wijanarko, Prasetia Anugrah Pratama, Traci Hong, Ika Idris, Alham Fikri Aji, Derry Wijaya
Hate Speech Indonesian Language Toxicity Detection Datasets Toxicity Classification

June 21, 2024

ToVo: Toxicity Taxonomy via Voting
Tinh Son Luong, Thanh-Thien Le, Thang Viet Doan, Linh Ngo Van, Thien Huu Nguyen, Diep Thi-Ngoc Nguyen
Data Set Dataset Creation Toxic Language Detection Toxic Speech Detection Toxicity Detection Model Toxicity Classification

June 14, 2024

Enhancing Multilingual Voice Toxicity Detection with Speech-Text Alignment
Joseph Liu, Mahesh Kumar Nandwana, Janne Pylkkönen, Hannes Heikinheimo, Morgan McGuire
Text Representation Toxicity Detection Semantic Embeddings Speech Text Alignment Toxicity Classification

April 27, 2024

Toxicity Classification in Ukrainian
Daryna Dementieva, Valeriia Khylenko, Nikolay Babakov, Georg Groh
Cross Lingual Transfer Toxicity Detection Russian Language Cross Lingual Knowledge Toxicity Classification

August 10, 2023

You Only Prompt Once: On the Capabilities of Prompt Learning on Large Language Models to Tackle Toxic Content
Xinlei He, Savvas Zannettou, Yun Shen, Yang Zhang
Prompt Learning Style PROMPT Capability Evolution Toxicity Detection Toxic Comment Toxicity Classification

January 5, 2023

Critical Perspectives: A Benchmark Revealing Pitfalls in PerspectiveAPI
Lorena Piedras, Lucas Rosenblatt, Julia Wilkins
Critical Review Toxicity Detection Toxic Language Semantic Adversarial Prompt Based Few Shot Perspective View Toxicity Classification