Spaces:

RHmaster
/

ai-talent-finder-backend

Running

ai-talent-finder-backend / ai_module /feedback /bias_detector.py

ilyass yani

Deploiement backend dans HF Spaces

9df97a2 10 days ago

12.5 kB

	"""Phase 3: Bias Detection System - Monitor fairness in recruiter decisions."""

	from dataclasses import dataclass
	from typing import Dict, List, Optional
	from datetime import datetime, timedelta
	import re


	@dataclass
	class BiasAlert:
	"""Alert for potential bias detected."""
	alert_type: str # "acceptance_rate_disparity", "score_gap", "pattern_anomaly"
	severity: str # "low" \| "medium" \| "high"
	message: str
	affected_group: str # e.g., "junior_developers", "candidates_from_east_africa"
	detected_at: datetime
	recommendation: str


	class BiasDetector:
	"""
	Monitor hiring patterns for potential bias:
	- Acceptance rate disparities by inferred demographics
	- Score distribution anomalies
	- Pattern-based red flags
	"""

	def __init__(self, db=None):
	"""Initialize detector."""
	self.db = db
	self.alerts: List[BiasAlert] = []

	def analyze_recruiter_decisions(
	self,
	feedback_records: List[Dict],
	min_samples: int = 30,
	) -> Dict:
	"""
	Analyze recruiter decisions for bias indicators.

	Args:
	feedback_records: List of recruiter feedback dictionaries
	min_samples: Minimum samples per group for analysis

	Returns:
	Report with detected biases and recommendations
	"""
	if not feedback_records or len(feedback_records) < min_samples:
	return {"status": "insufficient_data", "sample_count": len(feedback_records)}

	report = {
	"analysis_date": datetime.utcnow().isoformat(),
	"total_records": len(feedback_records),
	"alerts": [],
	"disparities": {},
	"recommendations": [],
	}

	# Check acceptance rate disparities
	disparities = self._check_acceptance_disparities(feedback_records)
	if disparities:
	report["disparities"] = disparities
	report["alerts"].extend([d["alert"] for d in disparities.values()])

	# Check score distribution anomalies
	score_check = self._check_score_anomalies(feedback_records)
	if score_check:
	report["alerts"].extend(score_check)

	# Check for pattern anomalies
	patterns = self._check_pattern_anomalies(feedback_records)
	if patterns:
	report["alerts"].extend(patterns)

	# Generate recommendations
	if report["alerts"]:
	report["recommendations"] = self._generate_recommendations(report["alerts"])

	return report

	def _check_acceptance_disparities(self, records: List[Dict]) -> Dict:
	"""Check for acceptance rate disparities (the main bias concern)."""
	disparities = {}

	# Group by inferred characteristics from candidate names/emails
	groups = self._group_by_demographics(records)

	if len(groups) < 2:
	return {}

	# Calculate acceptance rates per group
	rates = {}
	for group_name, candidates in groups.items():
	if len(candidates) < 10: # Skip groups with too few samples
	continue

	accepted = sum(1 for c in candidates if c.get("recruiter_decision") == "accepted")
	rate = accepted / len(candidates)
	rates[group_name] = {
	"rate": rate,
	"count": len(candidates),
	"accepted": accepted,
	}

	# Find disparities (highest and lowest acceptance rates)
	if len(rates) >= 2:
	sorted_rates = sorted(rates.items(), key=lambda x: x[1]["rate"])
	lowest = sorted_rates[0]
	highest = sorted_rates[-1]

	disparity_ratio = (
	highest[1]["rate"] / lowest[1]["rate"]
	if lowest[1]["rate"] > 0
	else float("inf")
	)

	# Flag if disparity > 1.25 (25% difference)
	if disparity_ratio > 1.25:
	alert_msg = (
	f"Acceptance rate disparity detected: {highest[0]} "
	f"{highest[1]['rate']:.1%} vs {lowest[0]} {lowest[1]['rate']:.1%}"
	)
	disparities[f"{lowest[0]}_vs_{highest[0]}"] = {
	"alert": BiasAlert(
	alert_type="acceptance_rate_disparity",
	severity="high" if disparity_ratio > 1.5 else "medium",
	message=alert_msg,
	affected_group=lowest[0],
	detected_at=datetime.utcnow(),
	recommendation=(
	f"Review scoring/decisions for {lowest[0]}. "
	f"Conduct blind review process."
	),
	),
	"disparity_ratio": disparity_ratio,
	"rates": rates,
	}

	return disparities

	def _check_score_anomalies(self, records: List[Dict]) -> List[BiasAlert]:
	"""Check if score distributions are anomalous."""
	alerts = []

	# Check if same scores are given despite different candidate profiles
	score_consistency = {}
	for record in records:
	score = round(record.get("model_predicted_score", 0))
	if score not in score_consistency:
	score_consistency[score] = []
	score_consistency[score].append(record)

	# Find score buckets with >80% same decision when scores vary
	for score, recs in score_consistency.items():
	if len(recs) < 5:
	continue

	decisions = [r.get("recruiter_decision") for r in recs]
	accepted_ratio = sum(1 for d in decisions if d == "accepted") / len(decisions)

	if accepted_ratio > 0.85 or accepted_ratio < 0.15:
	alerts.append(
	BiasAlert(
	alert_type="score_gap",
	severity="low",
	message=(
	f"Unusual decision ratio at score {score}: "
	f"{accepted_ratio:.0%} acceptance"
	),
	affected_group=f"candidates_at_score_{score}",
	detected_at=datetime.utcnow(),
	recommendation="Review scoring function calibration.",
	)
	)

	return alerts

	def _check_pattern_anomalies(self, records: List[Dict]) -> List[BiasAlert]:
	"""Detect suspicious patterns in decisions."""
	alerts = []

	# Pattern 1: Certain recruiters consistently reject certain demographics
	recruiter_patterns = self._analyze_recruiter_patterns(records)
	for recruiter_id, pattern in recruiter_patterns.items():
	if pattern.get("has_bias_flag"):
	alerts.append(
	BiasAlert(
	alert_type="pattern_anomaly",
	severity="medium",
	message=f"Recruiter {recruiter_id} shows unusual decision pattern",
	affected_group=f"recruiter_{recruiter_id}",
	detected_at=datetime.utcnow(),
	recommendation=(
	"Audit this recruiter's decisions; "
	"consider blind review or structured interviews."
	),
	)
	)

	return alerts

	def _group_by_demographics(self, records: List[Dict]) -> Dict[str, List]:
	"""Infer demographics from candidate names/emails for bias analysis."""
	groups = {
	"senior": [],
	"junior": [],
	"east_africa": [],
	"west_africa": [],
	"south_asia": [],
	"anglo": [],
	}

	for record in records:
	candidate_name = record.get("candidate_name", "").lower()
	email = record.get("email", "").lower()

	# Infer experience level (heuristic: title/name mentions)
	if any(x in candidate_name for x in ["senior", "lead", "principal"]):
	groups["senior"].append(record)
	else:
	groups["junior"].append(record)

	# Infer geographic/cultural background (name-based, not 100% accurate)
	if self._is_east_african_name(candidate_name):
	groups["east_africa"].append(record)
	elif self._is_west_african_name(candidate_name):
	groups["west_africa"].append(record)
	elif self._is_south_asian_name(candidate_name):
	groups["south_asia"].append(record)
	else:
	groups["anglo"].append(record)

	# Keep only groups with data
	return {k: v for k, v in groups.items() if v}

	def _is_east_african_name(self, name: str) -> bool:
	"""Heuristic: detect East African names."""
	patterns = ["njeri", "kipkemboi", "mutua", "koech", "kinyua", "muyeni"]
	return any(p in name for p in patterns)

	def _is_west_african_name(self, name: str) -> bool:
	"""Heuristic: detect West African names."""
	patterns = ["okonkwo", "adeyemi", "otchere", "mensah", "diallo", "faye"]
	return any(p in name for p in patterns)

	def _is_south_asian_name(self, name: str) -> bool:
	"""Heuristic: detect South Asian names."""
	patterns = ["sharma", "patel", "singh", "gupta", "banerjee", "krishnan"]
	return any(p in name for p in patterns)

	def _analyze_recruiter_patterns(self, records: List[Dict]) -> Dict:
	"""Analyze each recruiter's decision patterns."""
	patterns = {}

	for record in records:
	recruiter_id = record.get("recruiter_id", "unknown")
	if recruiter_id not in patterns:
	patterns[recruiter_id] = {
	"total_decisions": 0,
	"acceptance_rate": 0.0,
	"has_bias_flag": False,
	}

	patterns[recruiter_id]["total_decisions"] += 1
	if record.get("recruiter_decision") == "accepted":
	patterns[recruiter_id]["acceptance_rate"] += 1

	# Normalize rates and flag outliers
	for recruiter_id, data in patterns.items():
	if data["total_decisions"] >= 5:
	rate = data["acceptance_rate"] / data["total_decisions"]
	# Flag if acceptance rate < 10% or > 90% (unusually extreme)
	if rate < 0.1 or rate > 0.9:
	data["has_bias_flag"] = True
	data["acceptance_rate"] = rate

	return patterns

	def _generate_recommendations(self, alerts: List[BiasAlert]) -> List[str]:
	"""Generate actionable recommendations based on detected biases."""
	recommendations = [
	"✓ Implement blind resume review (remove names/photos)",
	"✓ Use structured interviews with standardized questions",
	"✓ Train recruiters on unconscious bias",
	"✓ Regular bias audits (monthly minimum)",
	"✓ Document decision rationale for all hires",
	]

	# Add severity-based recommendations
	high_severity = [a for a in alerts if a.severity == "high"]
	if high_severity:
	recommendations.insert(
	0, "⚠️ HIGH PRIORITY: Halt hiring review for affected groups"
	)

	return recommendations

	def get_alerts_summary(self) -> Dict:
	"""Get summary of all detected alerts."""
	if not self.alerts:
	return {"status": "no_alerts", "bias_risk": "low"}

	severity_counts = {}
	for alert in self.alerts:
	severity_counts[alert.severity] = severity_counts.get(alert.severity, 0) + 1

	risk_level = "high" if severity_counts.get("high", 0) > 0 else (
	"medium" if severity_counts.get("medium", 0) > 0 else "low"
	)

	return {
	"status": "alerts_detected",
	"bias_risk": risk_level,
	"alert_counts": severity_counts,
	"alerts": [
	{
	"type": a.alert_type,
	"severity": a.severity,
	"message": a.message,
	"group": a.affected_group,
	}
	for a in self.alerts[:10]
	],
	}