bias-detection

Here are 101 public repositories matching this topic...

Trusted-AI / AIF360

A comprehensive set of fairness metrics for datasets and machine learning models, explanations for these metrics, and algorithms to mitigate bias in datasets and models.

Updated Nov 13, 2025
Python

cvs-health / langfair

Star

LangFair is a Python library for conducting use-case level LLM bias and fairness assessments

python ai artificial-intelligence bias fairness ai-safety fairness-testing bias-detection fairness-ai fairness-ml responsible-ai ethical-ai large-language-models llm llm-evaluation llm-evaluation-framework llm-evaluation-metrics

Updated Dec 3, 2025
Python

WEFE: The Word Embeddings Fairness Evaluation Framework. WEFE is a framework that standardizes the bias measurement and mitigation in Word Embeddings models. Please feel welcome to open an issue in case you have any questions or a pull request if you want to contribute to the project!

nlp library word-embeddings python3 nlp-library bias-reduction bias-detection fairness-ai fairness-ml word-embedding-evaluation word-embedding-fairness

Updated Nov 24, 2025
Python

hongping-zh / circular-bias-detection

Star

a comprehensive statistical framework for detecting circular reasoning bias in AI algorithm evaluation

data-science machine-learning model-evaluation bias-detection ai-ethics llm

Updated Nov 20, 2025
Python

Babelscape / ALERT

Star

Official repository for the paper "ALERT: A Comprehensive Benchmark for Assessing Large Language Models’ Safety through Red Teaming"

nlp benchmark ai artificial-intelligence nlp-machine-learning red-teaming bias-detection safety-monitoring transformers-models llm llm-evaluation llm-safety llm-safety-benchmark

Updated Sep 20, 2024
Python

YujiaBao / ls

Star

Learning to Split for Automatic Bias Detection

machine-learning label-noise bias-detection data-split

Updated May 1, 2023
Python

lorentzenchr / model-diagnostics

Star

Tools for diagnostics and assessment of (machine learning) models

python machine-learning performance-metrics calibration bias-detection

Updated Nov 11, 2025
Python

umanlp / RedditBias

Star

Code & Data for the paper "RedditBias: A Real-World Resource for Bias Evaluation and Debiasing of Conversational Language Models"

natural-language-processing transformers conversational-ai bias-detection debiasing-neural-networks

Updated May 31, 2021
Python

name-ethnicity-classifier / name-ethnicity-classifier

Star

This repository contains a console-interface name-ethnicity classifier

machine-learning social-sciences ethnicity-classifier bias-detection conv-lstm nationality-predicter

Updated Apr 15, 2025
Python

SonyResearch / apparent_skincolor

Star

"Beyond Skin Tone: A Multidimensional Measure of Apparent Skin Color" (ICCV 2023)

fairness skin-tone skin-color bias-detection skin-hue

Updated Oct 18, 2023
Python

peremartra / optipfair

Star

Structured pruning and bias visualization for Large Language Models. Tools for LLM optimization and fairness analysis.

python transformers fairness model-pruning bias-detection structured-pruning bias-mitigation activation-analysis large-language-models llm

Updated Dec 7, 2025
Python

zhihengli-UR / DebiAN

Star

Official code of "Discover and Mitigate Unknown Biases with Debiasing Alternate Networks" (ECCV 2022)

computer-vision bias-detection responsible-ai bias-mitigation trustworthy-ai

Updated Feb 15, 2023
Python

zhihengli-UR / discover_unknown_biases

Star

Official code of "Discover the Unknown Biased Attribute of an Image Classifier" (ICCV 2021)

disentanglement bias-detection stylegan responsible-ai ai-fairness trustworthy-ai

Updated Oct 11, 2021
Python

maxdreyer / Reveal2Revise

Star

Reveal to Revise: An Explainable AI Life Cycle for Iterative Bias Correction of Deep Models. Paper presented at MICCAI 2023 conference.

debugging correction bias bias-correction xai bias-detection r2r model-correction

Updated Jan 17, 2024
Python

SergioV3005 / llm-belief-bias

Star

Belief-Bias evaluation of local LLMs

bias-detection llms-reasoning llms-benchmarking

Updated Jul 3, 2025
Python

AmirhosseinHonardoust / Cognitivelens-AI-Human-Comparison

Star

CognitiveLens is a Streamlit-powered analytics tool for exploring alignment between human and AI decisions. It visualizes fairness, calibration, and interpretability through metrics like Cohen’s κ, AUC, and Brier score. Designed for ethical AI, bias auditing, and decision transparency in machine learning systems.