こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

ML ガバナンス: 本番環境におけるコンプライアンス、監査証跡、責任ある AI

チャーン予測モデルの精度は 92% に達し、FastAPI の提供は安定しており、 Kubernetes クラスターは自動的にスケーリングされます。その後、法務部門から次のようなメールが届きます。信用モデルは、EU の AI 法の高リスクのカテゴリーに分類されます。そうではないことを証明しなければなりません性別や年齢で差別します。過去 6 か月間の意思決定ログはどこにありますか?誰が承認したのか実稼働環境での展開はどうなるのですか?」

これらの質問に対する答えがすぐに見つからない場合、ML プロジェクトは危険にさらされます。の 人工知能に関する EU 規制 (AI法)、部分的に発効高リスクシステムの最終期限は2026年8月2日に設定されており、2025年8月に設定されています。 ML ガバナンスをオプションのベストプラクティスから、最大 6% の罰金を伴う法的義務に転換しました。世界の年間売上高。 MLOps 市場、2026 年に 43 億 8,000 万ドル相当、CAGR 39.8% で成長また、企業はコンプライアンスを維持するためにガバナンスインフラストラクチャを備える必要があるためです。

このペーパーでは、次の分析から、包括的なオープンソース ML ガバナンスフレームワークを構築します。 AI 法の要件、モデルカードの自動生成、MLflow による監査証跡、 Fairlearn による公平性の検出、SHAP による説明可能性まで。すべて動作する Python コードを使用限られた予算でもすぐに適用できます。

何を学ぶか

高リスク ML システムに関する EU AI 法の実際的な要件 (期限 2026 年 8 月)
標準化されたドキュメントを含む自動モデルカードを生成
MLflow と構造化ログを使用して包括的な監査証跡を実装します。
Fairlearn でバイアスを測定および軽減する (人口統計上の均等性、均等化されたオッズ)
SHAP による説明可能性: グローバルな特徴の重要性とローカルな説明
モデルガバナンスレジストリ: 承認の追跡による段階移行
AI モデルを分類するためのリスク評価フレームワーク
年間予算が 5,000 ユーロ未満の中小企業向けの責任ある AI チェックリスト

EU AI 法: ML モデルの変更点

AI 法では、AI システムを 4 つのリスクレベルに分類し、義務が増加しています。以前ガバナンスフレームワークを実装するには、モデルがそのフレームワークのどこに適合するかを理解する必要があります分類学。分類は、使用されているテクノロジーには依存しません (XGBoost は本質的に変圧器よりも多かれ少なかれ危険です）が、使用目的と応用ドメイン.

AI法の4つのリスクカテゴリー

許容できないリスク (禁止): ソーシャルスコアリングシステム、潜在意識操作、脆弱性の悪用。導入は不可能です。
高リスク (厳しい要件): 信用、雇用、教育、重要なインフラ、医療機器、移行。コンプライアンス期限: 2026 年 8 月 2 日。
限定的リスク (透明性の義務): チャットボット、ディープフェイク、レコメンデーションシステム。 AIと対話するユーザーに通知する義務。
最小リスク (任意): スパムフィルター、AI ゲーム、標準的な推奨事項。特定の規制義務はありません。

システム向け リスクが高い、AI法は多くの技術的義務を課しており、 ML チームが MLOps パイプラインに実装する必要がある組織的な手順。主な要件としては、 2026 年 8 月から施行され、懸念事項:

リスク管理体制: 特定、分析、軽減するための継続的なプロセスモデルのライフサイクル全体にわたるリスク。
データガバナンス: トレーニング、検証、テストのデータセットは文書化する必要があります。代表者であり、偏見がなく、定められた目的に適切であること。
技術文書: を実証するのに十分な技術文書監督当局への遵守。アーキテクチャ、トレーニング手順、メトリクスを含むパフォーマンスと既知の制限事項。
自動記録保持: システムはイベントを自動的に記録する必要があります運用中に関連性があり、監査用に変更不可能なログが記録されます。
透明性とユーザー情報: ユーザーは自分が誰なのかを知る必要がある AI システムと対話し、その機能と制限に関する理解可能な情報を受け取ります。
人間の監視: 人間による監視や介入を可能にする技術的メカニズムそして自動化された決定を上書きします。
精度、堅牢性、サイバーセキュリティ: 文書化されたパフォーマンス指標、分布の変化と敵対的な入力に対する堅牢性テスト。

AI法による制裁：理論上のものではない

AI 法に違反した場合の罰則は以下のとおりです。 3,000 万ユーロまたは 6% 世界の年間売上高 許容できないリスクにさらされたシステムに関連する違反。それまで 2,000万ユーロまたは4% その他の義務のため。それまで 1,000万ユーロまたは2% 当局への誤った情報について。高リスクシステムの最初の重要な期限と、 2026 年 8 月 2 日: この記事の日付から 6 か月未満。あなたのモデルの場合信用、雇用、または重要なインフラストラクチャで事業を行っている場合、コンプライアンス計画は今日から開始する必要があります。

モデルカード: 標準化されたモデルドキュメント

Le モデルカード、2019 年に Google によって導入され、現在は業界標準として採用されています。 ML モデル (目的、さまざまなサブグループのパフォーマンス) を説明する構造化ドキュメントです。人口統計、既知の制限、意図された使用法と推奨される使用法。 AI 法は暗黙のうちにそれらを義務付けています。「技術文書」セクション。手動で生成するとエラーが発生しやすくなります。次のコードは自動化します。トレーニングメタデータと評価結果から作成します。

# model_card_generator.py
# Generatore automatico di Model Card conforme AI Act
# Compatibile con MLflow per tracciamento artefatti

import json
import datetime
from dataclasses import dataclass, field, asdict
from typing import Optional
import mlflow
import pandas as pd
import numpy as np
from sklearn.metrics import (
    accuracy_score, precision_score, recall_score,
    f1_score, roc_auc_score, confusion_matrix
)

@dataclass
class ModelCardMetrics:
    """Metriche di performance del modello."""
    accuracy: float
    precision: float
    recall: float
    f1: float
    auc_roc: Optional[float] = None
    sample_size: int = 0
    evaluation_date: str = ""

@dataclass
class SubgroupMetrics:
    """Metriche per sottogruppo demografico (richieste EU AI Act)."""
    group_name: str
    group_value: str
    accuracy: float
    precision: float
    recall: float
    false_positive_rate: float
    sample_size: int

@dataclass
class ModelCard:
    """Model Card standardizzata conforme alle linee guida EU AI Act."""
    # Identificazione modello
    model_name: str
    model_version: str
    model_type: str
    creation_date: str
    last_updated: str

    # Descrizione
    intended_use: str
    out_of_scope_uses: str
    primary_intended_users: str

    # Dati di training
    training_data_description: str
    training_data_size: int
    feature_names: list
    target_variable: str
    sensitive_features: list

    # Performance complessiva
    overall_metrics: ModelCardMetrics = field(default_factory=ModelCardMetrics)

    # Performance per sottogruppi (fairness)
    subgroup_metrics: list = field(default_factory=list)

    # Limitazioni note
    limitations: list = field(default_factory=list)

    # Avvertenze etiche
    ethical_considerations: str = ""

    # Compliance
    risk_category: str = ""   # "high-risk", "limited-risk", "minimal-risk"
    regulatory_scope: list = field(default_factory=list)

    # Approvazioni e contatti
    model_owner: str = ""
    approved_by: str = ""
    approval_date: str = ""
    contact: str = ""

    def to_json(self) -> str:
        return json.dumps(asdict(self), indent=2, ensure_ascii=False)

    def to_markdown(self) -> str:
        """Genera Model Card in formato Markdown per documentazione."""
        md = f"""# Model Card: {self.model_name} v{self.model_version}

**Tipo:** {self.model_type}
**Data creazione:** {self.creation_date}
**Ultimo aggiornamento:** {self.last_updated}
**Owner:** {self.model_owner}
**Approvato da:** {self.approved_by} ({self.approval_date})
**Categoria di rischio AI Act:** {self.risk_category}

## Uso Previsto
{self.intended_use}

## Uso NON Previsto
{self.out_of_scope_uses}

## Utenti Primari
{self.primary_intended_users}

## Dati di Training
- Descrizione: {self.training_data_description}
- Dimensione: {self.training_data_size:,} campioni
- Features: {', '.join(self.feature_names)}
- Target: {self.target_variable}
- Features sensibili (per fairness): {', '.join(self.sensitive_features)}

## Performance Complessiva
| Metrica | Valore |
|---------|--------|
| Accuracy | {self.overall_metrics.accuracy:.4f} |
| Precision | {self.overall_metrics.precision:.4f} |
| Recall | {self.overall_metrics.recall:.4f} |
| F1 Score | {self.overall_metrics.f1:.4f} |
| AUC-ROC | {self.overall_metrics.auc_roc:.4f} |
| Campioni valutazione | {self.overall_metrics.sample_size:,} |

## Performance per Sottogruppi (Fairness Analysis)
"""
        for sg in self.subgroup_metrics:
            md += f"""
### {sg['group_name']} = {sg['group_value']} (n={sg['sample_size']})
- Accuracy: {sg['accuracy']:.4f}
- Precision: {sg['precision']:.4f}
- Recall: {sg['recall']:.4f}
- False Positive Rate: {sg['false_positive_rate']:.4f}
"""

        md += f"""
## Limitazioni Note
"""
        for lim in self.limitations:
            md += f"- {lim}\n"

        md += f"""
## Considerazioni Etiche
{self.ethical_considerations}

## Contatto
{self.contact}
"""
        return md


def generate_model_card(
    model_name: str,
    model_version: str,
    model,
    X_test: pd.DataFrame,
    y_test: pd.Series,
    sensitive_cols: list,
    intended_use: str,
    config: dict
) -> ModelCard:
    """
    Genera una Model Card completa a partire dal modello e dai dati di test.

    Args:
        model: Modello scikit-learn addestrato
        X_test: Feature set di test
        y_test: Label di test
        sensitive_cols: Colonne sensibili per analisi fairness
        intended_use: Descrizione dell'uso previsto
        config: Configurazione aggiuntiva (owner, contact, etc.)
    """
    y_pred = model.predict(X_test)
    y_proba = model.predict_proba(X_test)[:, 1] if hasattr(model, 'predict_proba') else None

    # Metriche globali
    overall = ModelCardMetrics(
        accuracy=accuracy_score(y_test, y_pred),
        precision=precision_score(y_test, y_pred, zero_division=0),
        recall=recall_score(y_test, y_pred, zero_division=0),
        f1=f1_score(y_test, y_pred, zero_division=0),
        auc_roc=roc_auc_score(y_test, y_proba) if y_proba is not None else None,
        sample_size=len(y_test),
        evaluation_date=datetime.datetime.utcnow().isoformat()
    )

    # Metriche per sottogruppi (RICHIESTO EU AI Act per High-Risk)
    subgroup_list = []
    for col in sensitive_cols:
        if col not in X_test.columns:
            continue
        for val in X_test[col].unique():
            mask = X_test[col] == val
            if mask.sum() < 30:  # Skip gruppi troppo piccoli
                continue

            y_sub_true = y_test[mask]
            y_sub_pred = y_pred[mask]
            cm = confusion_matrix(y_sub_true, y_sub_pred, labels=[0, 1])

            tn, fp, fn, tp = cm.ravel() if cm.size == 4 else (0, 0, 0, cm[0][0])
            fpr = fp / (fp + tn) if (fp + tn) > 0 else 0.0

            subgroup_list.append({
                "group_name": col,
                "group_value": str(val),
                "accuracy": accuracy_score(y_sub_true, y_sub_pred),
                "precision": precision_score(y_sub_true, y_sub_pred, zero_division=0),
                "recall": recall_score(y_sub_true, y_sub_pred, zero_division=0),
                "false_positive_rate": fpr,
                "sample_size": int(mask.sum())
            })

    card = ModelCard(
        model_name=model_name,
        model_version=model_version,
        model_type=type(model).__name__,
        creation_date=config.get("creation_date", datetime.date.today().isoformat()),
        last_updated=datetime.date.today().isoformat(),
        intended_use=intended_use,
        out_of_scope_uses=config.get("out_of_scope_uses", "Non specificato"),
        primary_intended_users=config.get("primary_users", "Team Data Science"),
        training_data_description=config.get("data_description", ""),
        training_data_size=config.get("training_size", 0),
        feature_names=list(X_test.columns),
        target_variable=config.get("target", "label"),
        sensitive_features=sensitive_cols,
        overall_metrics=overall,
        subgroup_metrics=subgroup_list,
        limitations=config.get("limitations", []),
        ethical_considerations=config.get("ethical_considerations", ""),
        risk_category=config.get("risk_category", "minimal-risk"),
        regulatory_scope=config.get("regulatory_scope", []),
        model_owner=config.get("owner", ""),
        approved_by=config.get("approved_by", ""),
        approval_date=config.get("approval_date", ""),
        contact=config.get("contact", "")
    )

    return card


def log_model_card_to_mlflow(card: ModelCard, run_id: str):
    """Registra la model card come artefatto MLflow per tracciabilita."""
    with mlflow.start_run(run_id=run_id):
        # Log come JSON
        json_path = f"/tmp/model_card_{card.model_name}_v{card.model_version}.json"
        with open(json_path, "w") as f:
            f.write(card.to_json())
        mlflow.log_artifact(json_path, artifact_path="governance")

        # Log come Markdown
        md_path = f"/tmp/model_card_{card.model_name}_v{card.model_version}.md"
        with open(md_path, "w") as f:
            f.write(card.to_markdown())
        mlflow.log_artifact(md_path, artifact_path="governance")

        # Log metriche di fairness come tag MLflow per ricerca rapida
        mlflow.set_tag("governance.risk_category", card.risk_category)
        mlflow.set_tag("governance.model_owner", card.model_owner)
        mlflow.set_tag("governance.approved_by", card.approved_by)
        mlflow.set_tag("governance.has_subgroup_analysis", str(len(card.subgroup_metrics) > 0))

    print(f"Model Card registrata in MLflow run {run_id} sotto artifacts/governance/")

Fairlearn による公平性とバイアスの検出

ML における公平性は単一の概念ではありません。数学的にはいくつかの定義があります。互いに互換性がありません。 AI 法は、どの指標を使用するかを規定していませんが、システムが次のことを行うことを要求しています。リスクの高いグループは、保護されたグループと比較して評価され、文書化されます。最も重要な 2 つの指標共通かつ補完的なものは、 人口平等 (人口平等) e の均等化されたオッズ (真のラベルを条件とするオッズの等しい)。

La 人口平等 肯定的な結果が得られる確率が必要ですこれはすべてのグループで同じです: P(Y_pred=1 | A=0) = P(Y_pred=1 | A=1)。そして最も直感的な指標はただし、グループのラベル率が異なる場合、実際のパフォーマンスの差が隠れてしまう可能性があります。ザ」均等化されたオッズ さらに厳格: TPR と FPR の両方を要求します。グループ間で同等であり、モデルが同じ頻度でエラーを起こすことを保証します。敏感なグループに属しているかどうかに関係なく。

# fairness_checker.py
# Analisi completa di fairness con Fairlearn
# pip install fairlearn scikit-learn pandas

import pandas as pd
import numpy as np
from fairlearn.metrics import (
    MetricFrame,
    demographic_parity_difference,
    demographic_parity_ratio,
    equalized_odds_difference,
    equalized_odds_ratio,
    false_positive_rate,
    false_negative_rate,
    selection_rate
)
from fairlearn.reductions import ExponentiatedGradient, DemographicParity, EqualizedOdds
from sklearn.metrics import accuracy_score, f1_score
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
import mlflow


def run_fairness_analysis(
    y_true: pd.Series,
    y_pred: np.ndarray,
    sensitive_feature: pd.Series,
    y_proba: np.ndarray = None,
    threshold: float = 0.1
) -> dict:
    """
    Analisi completa di fairness per un modello.

    Args:
        y_true: Etichette vere
        y_pred: Predizioni del modello
        sensitive_feature: Feature sensibile (es. genere, eta_group)
        y_proba: Probabilità predette (opzionale)
        threshold: Soglia di accettabilita per le differenze di fairness

    Returns:
        dict con metriche di fairness e flag di conformità
    """
    results = {}

    # ---- 1. Demographic Parity ----
    dp_diff = demographic_parity_difference(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )
    dp_ratio = demographic_parity_ratio(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )

    results["demographic_parity_difference"] = float(dp_diff)
    results["demographic_parity_ratio"] = float(dp_ratio)
    results["demographic_parity_pass"] = abs(dp_diff) <= threshold

    # ---- 2. Equalized Odds ----
    eo_diff = equalized_odds_difference(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )
    eo_ratio = equalized_odds_ratio(
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )

    results["equalized_odds_difference"] = float(eo_diff)
    results["equalized_odds_ratio"] = float(eo_ratio)
    results["equalized_odds_pass"] = abs(eo_diff) <= threshold

    # ---- 3. MetricFrame: metriche disaggregate per gruppo ----
    metrics_dict = {
        "accuracy": accuracy_score,
        "f1": lambda y_t, y_p: f1_score(y_t, y_p, zero_division=0),
        "false_positive_rate": false_positive_rate,
        "false_negative_rate": false_negative_rate,
        "selection_rate": selection_rate,
    }

    metric_frame = MetricFrame(
        metrics=metrics_dict,
        y_true=y_true,
        y_pred=y_pred,
        sensitive_features=sensitive_feature
    )

    results["by_group"] = metric_frame.by_group.to_dict()
    results["overall"] = metric_frame.overall.to_dict()
    results["difference"] = metric_frame.difference().to_dict()
    results["ratio"] = metric_frame.ratio().to_dict()

    # ---- 4. Flag conformità complessiva ----
    results["is_fair"] = (
        results["demographic_parity_pass"] and
        results["equalized_odds_pass"]
    )

    # Messaggi esplicativi
    messages = []
    if not results["demographic_parity_pass"]:
        messages.append(
            f"ATTENZIONE: Demographic Parity Difference = {dp_diff:.4f} "
            f"(soglia: {threshold}). Il gruppo svantaggiato riceve outcome positivi "
            f"meno frequentemente del {abs(dp_diff)*100:.1f}%."
        )
    if not results["equalized_odds_pass"]:
        messages.append(
            f"ATTENZIONE: Equalized Odds Difference = {eo_diff:.4f} "
            f"(soglia: {threshold}). I tassi di errore variano significativamente tra gruppi."
        )
    if results["is_fair"]:
        messages.append("OK: Tutte le metriche di fairness rientrano nella soglia accettabile.")

    results["messages"] = messages

    return results


def mitigate_bias_with_reductions(
    estimator,
    X_train: pd.DataFrame,
    y_train: pd.Series,
    sensitive_train: pd.Series,
    constraint: str = "demographic_parity"
) -> object:
    """
    Mitigazione del bias tramite Exponentiated Gradient (Fairlearn).
    Restituisce un modello fairness-aware.

    Args:
        constraint: "demographic_parity" o "equalized_odds"
    """
    if constraint == "demographic_parity":
        fairness_constraint = DemographicParity(difference_bound=0.05)
    else:
        fairness_constraint = EqualizedOdds(difference_bound=0.05)

    mitigator = ExponentiatedGradient(
        estimator=estimator,
        constraints=fairness_constraint,
        max_iter=50,
        nu=1e-6
    )

    mitigator.fit(
        X_train,
        y_train,
        sensitive_features=sensitive_train
    )

    print(f"Mitigazione completata con constraint: {constraint}")
    print(f"N. classificatori nell'ensemble: {len(mitigator.predictors_)}")

    return mitigator


def log_fairness_to_mlflow(fairness_results: dict, run_id: str):
    """Registra i risultati di fairness in MLflow per audit trail."""
    with mlflow.start_run(run_id=run_id):
        mlflow.log_metrics({
            "fairness.demographic_parity_diff": fairness_results["demographic_parity_difference"],
            "fairness.demographic_parity_ratio": fairness_results["demographic_parity_ratio"],
            "fairness.equalized_odds_diff": fairness_results["equalized_odds_difference"],
            "fairness.equalized_odds_ratio": fairness_results["equalized_odds_ratio"],
        })

        mlflow.set_tag("fairness.is_fair", str(fairness_results["is_fair"]))

        # Log report completo come artefatto
        import json
        report_path = "/tmp/fairness_report.json"
        with open(report_path, "w") as f:
            # Serializza numpy floats
            serializable = {
                k: v for k, v in fairness_results.items()
                if isinstance(v, (dict, list, bool, str, float, int))
            }
            json.dump(serializable, f, indent=2, default=float)
        mlflow.log_artifact(report_path, artifact_path="governance/fairness")

    print("Fairness report loggato in MLflow.")

人口統計上の均等性と均等化されたオッズ: どちらを使用するか?

人口統計上の均等性: 分布の差が予想されない場合に理想的グループ間（例: 信用承認: 男性と女性の間で料金に差があってはなりません）実際の支払能力とは関係ありません）。全体的な精度が低下する可能性があります。
均等化されたオッズ: 実際のラベルがグループ間で異なる場合に最適です (例: 医療スクリーニング: 年齢ごとに異なる罹患率)。誤検知と誤検知を保証しますマイナスは均等に分配されます。
警告 (不可能性定理): 人口統計上の平等と均等化されたオッズは一致しない基本レートが同一でない限り、同時に満たすことができますグループ間で。コンテキストに適したメトリクスを選択し、モデルカードに文書化します。

SHAP による説明可能性: ローカルおよびグローバルの透明性

説明可能性は単なる規制要件ではなく、モデルをデバッグするための実際的な要件です。利害関係者の信頼を獲得し、潜在的な偏見を検出します。 シャープ (シャプレイ添加剤 exPlanations) は、プロパティを提供するため、ML における説明可能性の事実上の標準となっています。堅固な数学: 一貫性、ローカル精度、およびツリーベースのモデルのサポート (バリアントを使用) TreeSHAP、汎用バージョンの O(TL2^M) の代わりに O(TLD^2)。

SHAP は、ゲーム理論に基づいて、予測に対する各特徴の限界寄与度を計算します。協力的（シャプリーの価値観）。結果は、各サンプルの各特徴の SHAP 値です。正の値は予測を増加させ、負の値は予測を減少させます。 SHAP値の合計すべての特徴の値であり、モデル予測と平均予測の差に等しい (基本値)。

# explainability_shap.py
# Explainability completa con SHAP per modelli ML in produzione
# pip install shap matplotlib pandas scikit-learn

import shap
import numpy as np
import pandas as pd
import matplotlib
matplotlib.use('Agg')  # Backend non-interattivo per ambienti server
import matplotlib.pyplot as plt
import mlflow
import json
from pathlib import Path


class MLExplainer:
    """
    Classe per gestire l'explainability SHAP in produzione.
    Supporta TreeSHAP (XGBoost, LightGBM, RandomForest) e KernelSHAP (any model).
    """

    def __init__(self, model, model_type: str = "tree", background_data=None):
        """
        Args:
            model: Modello addestrato
            model_type: "tree" per modelli tree-based, "linear" per lineari, "kernel" per altri
            background_data: Dati di background per KernelSHAP (sample del training set)
        """
        self.model = model
        self.model_type = model_type

        if model_type == "tree":
            # TreeSHAP: molto più veloce, non richiede background data
            self.explainer = shap.TreeExplainer(model)
        elif model_type == "linear":
            self.explainer = shap.LinearExplainer(model, background_data)
        else:
            # KernelSHAP: universale ma lento, usa un sample piccolo come background
            if background_data is None:
                raise ValueError("KernelSHAP richiede background_data (sample del training set)")
            bg_summary = shap.kmeans(background_data, 50)  # Riduce a 50 cluster
            self.explainer = shap.KernelExplainer(model.predict_proba, bg_summary)

        self.shap_values = None
        self.feature_names = None

    def compute_shap_values(self, X: pd.DataFrame) -> np.ndarray:
        """Calcola i valori SHAP per un dataset."""
        self.feature_names = list(X.columns)
        shap_output = self.explainer(X)

        # Per classificazione binaria, prendi la classe positiva
        if hasattr(shap_output, 'values'):
            values = shap_output.values
            if len(values.shape) == 3:  # [samples, features, classes]
                self.shap_values = values[:, :, 1]  # Classe positiva
            else:
                self.shap_values = values
        else:
            self.shap_values = shap_output

        return self.shap_values

    def global_importance(self, top_n: int = 15) -> pd.DataFrame:
        """
        Feature importance globale: media dei valori SHAP assoluti.
        Questa e la visione che interessa ai regolatori (AI Act, XAI requirement).
        """
        if self.shap_values is None:
            raise RuntimeError("Esegui compute_shap_values() prima.")

        mean_abs_shap = np.abs(self.shap_values).mean(axis=0)
        importance_df = pd.DataFrame({
            "feature": self.feature_names,
            "mean_abs_shap": mean_abs_shap
        }).sort_values("mean_abs_shap", ascending=False)

        return importance_df.head(top_n)

    def explain_single_prediction(
        self, sample: pd.Series, threshold: float = 0.5
    ) -> dict:
        """
        Spiegazione locale per una singola predizione.
        Utile per audit di decisioni individuali (obbligatorio AI Act per High-Risk).
        """
        sample_df = pd.DataFrame([sample])
        single_shap = self.explainer(sample_df)

        if hasattr(single_shap, 'values'):
            values = single_shap.values[0]
            if len(values.shape) == 2:  # [features, classes]
                values = values[:, 1]
            base_value = float(single_shap.base_values[0]) if len(single_shap.base_values.shape) > 1 \
                else float(single_shap.base_values[0])
        else:
            values = single_shap[0]
            base_value = float(self.explainer.expected_value)

        # Predizione del modello
        pred_proba = self.model.predict_proba(sample_df)[0, 1]
        pred_class = int(pred_proba >= threshold)

        # Feature contributions ordinate per importanza
        contributions = sorted(
            zip(self.feature_names, values, sample.values),
            key=lambda x: abs(x[1]),
            reverse=True
        )

        return {
            "prediction_probability": float(pred_proba),
            "prediction_class": pred_class,
            "base_value": base_value,
            "top_contributing_features": [
                {
                    "feature": feat,
                    "shap_value": float(shap_val),
                    "feature_value": float(feat_val) if isinstance(feat_val, (int, float, np.number)) else str(feat_val),
                    "direction": "positive" if shap_val > 0 else "negative"
                }
                for feat, shap_val, feat_val in contributions[:10]
            ]
        }

    def save_summary_plot(self, X: pd.DataFrame, output_path: str):
        """Salva summary plot SHAP per documentazione/governance."""
        if self.shap_values is None:
            self.compute_shap_values(X)

        plt.figure(figsize=(10, 8))
        shap.summary_plot(
            self.shap_values,
            X,
            plot_type="bar",
            show=False,
            max_display=15
        )
        plt.tight_layout()
        plt.savefig(output_path, dpi=150, bbox_inches='tight')
        plt.close()
        print(f"Summary plot salvato in: {output_path}")

    def log_to_mlflow(self, X_sample: pd.DataFrame, run_id: str):
        """Registra explainability artifacts in MLflow per audit trail."""
        if self.shap_values is None:
            self.compute_shap_values(X_sample)

        with mlflow.start_run(run_id=run_id):
            # Global importance come JSON
            importance = self.global_importance()
            importance_path = "/tmp/shap_importance.json"
            importance.to_json(importance_path, orient="records", indent=2)
            mlflow.log_artifact(importance_path, artifact_path="governance/explainability")

            # Summary plot
            plot_path = "/tmp/shap_summary_plot.png"
            self.save_summary_plot(X_sample, plot_path)
            mlflow.log_artifact(plot_path, artifact_path="governance/explainability")

            # Top feature come metric (per dashboard governance)
            for i, row in importance.head(5).iterrows():
                feat_name = row["feature"].replace(" ", "_").replace("-", "_")
                mlflow.log_metric(
                    f"shap.top_feature_importance.{feat_name}",
                    float(row["mean_abs_shap"])
                )

        print(f"Explainability artifacts registrati in MLflow run {run_id}")

監査証跡: コンプライアンスのため変更不可能なログ

AI 法では、高リスクのシステムに関連イベントを自動的に記録することが義務付けられています。当局が許可できるほど詳細なログが運用中に記録されます。コンプライアンスを確認します。これらのログは次のとおりである必要があります。 変更不可、タイムスタンプ付き、追跡可能。堅牢な監査証跡システムには 3 つのレベルが含まれます。予測ログ個別のログ、モデルステージ移行ログ、ガバナンスイベントログ。

# audit_logger.py
# Sistema di audit trail conforme AI Act per modelli in produzione
# Usa struttura di log immodificabile con hash SHA-256 per integrità

import hashlib
import json
import logging
import datetime
import uuid
from typing import Optional
import structlog  # pip install structlog
import mlflow


# Configurazione structlog per log strutturati in JSON
structlog.configure(
    processors=[
        structlog.processors.TimeStamper(fmt="iso"),
        structlog.processors.add_log_level,
        structlog.processors.JSONRenderer()
    ]
)

audit_log = structlog.get_logger("audit")


class MLAuditLogger:
    """
    Sistema di audit trail per modelli ML in produzione.
    Ogni log entry include un hash SHA-256 del contenuto per rilevare manomissioni.
    """

    def __init__(self, model_name: str, model_version: str, log_file: str = None):
        self.model_name = model_name
        self.model_version = model_version
        self.log_file = log_file or f"audit_{model_name}_v{model_version}.jsonl"

        # Logger Python standard per file locale (append-only)
        self.file_logger = logging.getLogger(f"audit.{model_name}")
        if not self.file_logger.handlers:
            handler = logging.FileHandler(self.log_file, mode='a')
            handler.setFormatter(logging.Formatter('%(message)s'))
            self.file_logger.addHandler(handler)
            self.file_logger.setLevel(logging.INFO)

    def _compute_hash(self, entry: dict) -> str:
        """Calcola hash SHA-256 dell'entry per integrità."""
        content = json.dumps(entry, sort_keys=True, ensure_ascii=False)
        return hashlib.sha256(content.encode()).hexdigest()

    def log_prediction(
        self,
        request_id: str,
        input_features: dict,
        prediction: float,
        prediction_class: int,
        shap_explanation: Optional[dict] = None,
        user_id: Optional[str] = None,
        session_id: Optional[str] = None
    ):
        """
        Log di una singola predizione.
        Per AI Act High-Risk: OGNI decisione deve essere registrata.
        """
        entry = {
            "event_type": "PREDICTION",
            "event_id": str(uuid.uuid4()),
            "timestamp": datetime.datetime.utcnow().isoformat() + "Z",
            "model_name": self.model_name,
            "model_version": self.model_version,
            "request_id": request_id,
            "user_id": user_id or "anonymous",
            "session_id": session_id,
            "input": input_features,
            "output": {
                "prediction_probability": float(prediction),
                "prediction_class": int(prediction_class),
                "decision": "POSITIVE" if prediction_class == 1 else "NEGATIVE"
            },
            "explanation": shap_explanation,  # Top SHAP features per spiegazione
        }

        entry["content_hash"] = self._compute_hash(
            {k: v for k, v in entry.items() if k != "content_hash"}
        )

        self.file_logger.info(json.dumps(entry, ensure_ascii=False))
        audit_log.info("prediction_logged", request_id=request_id, decision=entry["output"]["decision"])

        return entry["event_id"]

    def log_model_stage_transition(
        self,
        from_stage: str,
        to_stage: str,
        approved_by: str,
        justification: str,
        metrics: Optional[dict] = None
    ):
        """
        Log di una transizione di stage del modello (Staging -> Production).
        Crea un audit trail delle approvazioni richiesto dal processo di governance.
        """
        entry = {
            "event_type": "STAGE_TRANSITION",
            "event_id": str(uuid.uuid4()),
            "timestamp": datetime.datetime.utcnow().isoformat() + "Z",
            "model_name": self.model_name,
            "model_version": self.model_version,
            "from_stage": from_stage,
            "to_stage": to_stage,
            "approved_by": approved_by,
            "justification": justification,
            "performance_metrics": metrics or {},
        }

        entry["content_hash"] = self._compute_hash(
            {k: v for k, v in entry.items() if k != "content_hash"}
        )

        self.file_logger.info(json.dumps(entry, ensure_ascii=False))
        audit_log.info(
            "stage_transition",
            model=self.model_name,
            from_stage=from_stage,
            to_stage=to_stage,
            approved_by=approved_by
        )

        # Registra anche in MLflow Model Registry per tracciabilita centralizzata
        client = mlflow.tracking.MlflowClient()
        try:
            client.set_registered_model_alias(
                name=self.model_name,
                alias=to_stage.lower(),
                version=self.model_version
            )
            client.set_model_version_tag(
                name=self.model_name,
                version=self.model_version,
                key="governance.approved_by",
                value=approved_by
            )
            client.set_model_version_tag(
                name=self.model_name,
                version=self.model_version,
                key="governance.approval_date",
                value=datetime.date.today().isoformat()
            )
        except Exception as e:
            audit_log.warning("mlflow_tag_failed", error=str(e))

    def log_governance_event(
        self,
        event_subtype: str,
        details: dict,
        actor: str
    ):
        """
        Log generico per eventi di governance: fairness check, model card update,
        bias detection alert, human override, etc.
        """
        entry = {
            "event_type": "GOVERNANCE",
            "event_subtype": event_subtype,
            "event_id": str(uuid.uuid4()),
            "timestamp": datetime.datetime.utcnow().isoformat() + "Z",
            "model_name": self.model_name,
            "model_version": self.model_version,
            "actor": actor,
            "details": details,
        }

        entry["content_hash"] = self._compute_hash(
            {k: v for k, v in entry.items() if k != "content_hash"}
        )

        self.file_logger.info(json.dumps(entry, ensure_ascii=False))
        audit_log.info("governance_event", subtype=event_subtype, actor=actor)

    def verify_log_integrity(self) -> dict:
        """
        Verifica l'integrita del file di log ricalcolando gli hash.
        Rileva eventuali manomissioni dei log.
        """
        results = {"total": 0, "valid": 0, "tampered": [], "errors": []}

        try:
            with open(self.log_file, 'r') as f:
                for line_num, line in enumerate(f, 1):
                    line = line.strip()
                    if not line:
                        continue
                    results["total"] += 1
                    try:
                        entry = json.loads(line)
                        stored_hash = entry.pop("content_hash", None)
                        recomputed = self._compute_hash(entry)
                        if stored_hash == recomputed:
                            results["valid"] += 1
                        else:
                            results["tampered"].append({
                                "line": line_num,
                                "event_id": entry.get("event_id"),
                                "timestamp": entry.get("timestamp")
                            })
                    except json.JSONDecodeError as e:
                        results["errors"].append({"line": line_num, "error": str(e)})
        except FileNotFoundError:
            results["errors"].append({"error": f"Log file non trovato: {self.log_file}"})

        integrity_ok = len(results["tampered"]) == 0 and len(results["errors"]) == 0
        results["integrity_ok"] = integrity_ok

        if not integrity_ok:
            audit_log.error(
                "log_integrity_violated",
                tampered_count=len(results["tampered"]),
                error_count=len(results["errors"])
            )

        return results

監査ログ: 保存と保護

AI 法では、高リスクシステムからのログの正確な保存期間は指定されていませんが、ガイドラインには、それらを維持する必要があることが示されています 少なくとも動作寿命全体にわたってシステムの、通常は 3 ～ 10 年です。ログを不変ストレージ (例: S3) に保存します。オブジェクトロック、保持ポリシーを備えた GCS、または追加専用データベース）。データベースは絶対に使用しないでください監査証跡の単一ストアとしての標準リレーショナル: 行を削除または削除できます。変更されました。上記のコードの SHA-256 ハッシュ構造により改ざん検出が可能になります事後的には可能ですが、ファイルの物理的な削除は妨げられません。

MLflow を使用してレジストリガバナンスをモデル化する

Il MLflow モデルレジストリ ガバナンスの中心的な要素: 集中化実験版からモデルまで、実稼働中のすべてのモデルとそのライフサイクル運用環境では、移行、コメント、ガバナンスタグの完全な履歴が含まれます。 MLflow 3.0 では、 2025 年に導入され、レジストリはモデルエイリアス (プロダクション、ステージング、チャンピオン、チャレンジャー) を使用して非推奨のステージを置き換え、Databricks の Unity Catalog と統合します。ワークスペース間のガバナンス。

# model_registry_governance.py
# Workflow di governance per MLflow Model Registry
# Include: registrazione, review, promozione con approvazione, deprecazione

import mlflow
from mlflow.tracking import MlflowClient
from mlflow.exceptions import MlflowException
import datetime
from typing import Optional
from dataclasses import dataclass

MLFLOW_TRACKING_URI = "http://localhost:5000"
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
client = MlflowClient()


@dataclass
class GovernanceConfig:
    """Configurazione di governance per un modello."""
    model_name: str
    required_min_accuracy: float = 0.80
    required_fairness_threshold: float = 0.10
    required_approvers: list = None
    risk_category: str = "minimal-risk"

    def __post_init__(self):
        if self.required_approvers is None:
            self.required_approvers = ["ml-lead", "compliance-officer"]


def register_model_with_governance(
    run_id: str,
    model_path: str,
    config: GovernanceConfig,
    model_card_path: str,
    fairness_report_path: str,
) -> str:
    """
    Registra un modello nel Model Registry con tutti i tag di governance.

    Returns:
        version: Versione registrata del modello
    """
    # Registra il modello
    model_uri = f"runs:/{run_id}/{model_path}"
    result = mlflow.register_model(
        model_uri=model_uri,
        name=config.model_name
    )
    version = result.version

    # Tag obbligatori per governance
    governance_tags = {
        "governance.risk_category": config.risk_category,
        "governance.registration_date": datetime.date.today().isoformat(),
        "governance.registration_author": "automated-pipeline",
        "governance.status": "PENDING_REVIEW",
        "governance.model_card_logged": "true",
        "governance.fairness_checked": "true",
        "governance.explainability_logged": "true",
        "governance.required_approvers": ",".join(config.required_approvers),
        "source.run_id": run_id,
    }

    for key, value in governance_tags.items():
        client.set_model_version_tag(
            name=config.model_name,
            version=version,
            key=key,
            value=value
        )

    # Alias iniziale: "candidate" (in attesa di review)
    client.set_registered_model_alias(
        name=config.model_name,
        alias="candidate",
        version=version
    )

    print(f"Modello registrato: {config.model_name} v{version} - Status: PENDING_REVIEW")
    return version


def approve_for_staging(
    model_name: str,
    version: str,
    approver: str,
    justification: str,
    performance_metrics: dict,
    config: GovernanceConfig
) -> bool:
    """
    Promuove un modello in Staging dopo review dei gate di qualità.
    Verifica automaticamente accuracy e fairness prima dell'approvazione.
    """
    # ---- Gate 1: Accuracy minima ----
    accuracy = performance_metrics.get("accuracy", 0)
    if accuracy < config.required_min_accuracy:
        print(f"GATE FALLITO: accuracy {accuracy:.4f} < soglia {config.required_min_accuracy}")
        client.set_model_version_tag(
            name=model_name, version=version,
            key="governance.rejection_reason",
            value=f"Accuracy insufficiente: {accuracy:.4f}"
        )
        return False

    # ---- Gate 2: Fairness ----
    dp_diff = performance_metrics.get("demographic_parity_difference", 999)
    if abs(dp_diff) > config.required_fairness_threshold:
        print(f"GATE FALLITO: Fairness violation - DP diff {dp_diff:.4f}")
        client.set_model_version_tag(
            name=model_name, version=version,
            key="governance.rejection_reason",
            value=f"Fairness violation: DP diff {dp_diff:.4f}"
        )
        return False

    # ---- Gate 3: Approvazione umana ----
    # In produzione, questo step richiede un sistema di ticketing/approval workflow
    # Per ora, verifica che l'approver sia autorizzato
    if approver not in config.required_approvers:
        print(f"GATE FALLITO: Approver non autorizzato: {approver}")
        return False

    # Tutti i gate superati: promuovi a Staging
    approval_tags = {
        "governance.status": "STAGING",
        "governance.approved_by": approver,
        "governance.approval_date": datetime.datetime.utcnow().isoformat(),
        "governance.justification": justification,
        f"governance.metrics.accuracy": str(accuracy),
        f"governance.metrics.dp_diff": str(dp_diff),
    }

    for key, value in approval_tags.items():
        client.set_model_version_tag(
            name=model_name, version=version,
            key=key, value=value
        )

    # Aggiorna alias
    client.set_registered_model_alias(
        name=model_name,
        alias="staging",
        version=version
    )

    print(f"Modello {model_name} v{version} promosso in STAGING da {approver}")
    return True


def promote_to_production(
    model_name: str,
    version: str,
    approver: str,
    champion_strategy: str = "blue-green"
) -> bool:
    """
    Promuove il modello in Production.
    Implementa champion/challenger: mantiene la versione precedente come challenger.
    """
    # Trova versione production corrente (champion)
    try:
        current_champion = client.get_model_version_by_alias(model_name, "production")
        old_champion_version = current_champion.version

        # Marca il vecchio champion come challenger
        client.set_registered_model_alias(
            name=model_name,
            alias="challenger",
            version=old_champion_version
        )
        client.set_model_version_tag(
            name=model_name, version=old_champion_version,
            key="governance.status", value="CHALLENGER"
        )
    except MlflowException:
        # Nessun champion precedente (primo deploy)
        old_champion_version = None

    # Promuovi nuova versione a champion
    production_tags = {
        "governance.status": "PRODUCTION",
        "governance.production_date": datetime.datetime.utcnow().isoformat(),
        "governance.production_approver": approver,
        "governance.deployment_strategy": champion_strategy,
        "governance.previous_version": str(old_champion_version) if old_champion_version else "none",
    }

    for key, value in production_tags.items():
        client.set_model_version_tag(
            name=model_name, version=version,
            key=key, value=value
        )

    client.set_registered_model_alias(
        name=model_name,
        alias="production",
        version=version
    )

    print(f"Modello {model_name} v{version} promosso in PRODUCTION (champion)")
    if old_champion_version:
        print(f"Versione precedente v{old_champion_version} mantenuta come CHALLENGER")

    return True


def get_governance_report(model_name: str) -> dict:
    """
    Genera un report di governance completo per un modello registrato.
    Utile per audit esterni e report di compliance.
    """
    registered_model = client.get_registered_model(model_name)
    versions = client.search_model_versions(f"name='{model_name}'")

    report = {
        "model_name": model_name,
        "report_date": datetime.date.today().isoformat(),
        "total_versions": len(versions),
        "versions_detail": []
    }

    for v in versions:
        tags = v.tags
        report["versions_detail"].append({
            "version": v.version,
            "status": tags.get("governance.status", "UNKNOWN"),
            "risk_category": tags.get("governance.risk_category", "UNKNOWN"),
            "registration_date": tags.get("governance.registration_date", ""),
            "approved_by": tags.get("governance.approved_by", ""),
            "approval_date": tags.get("governance.approval_date", ""),
            "fairness_checked": tags.get("governance.fairness_checked", "false"),
            "model_card_logged": tags.get("governance.model_card_logged", "false"),
        })

    return report

責任ある AI フレームワーク: ML プロジェクトのチェックリスト

運用上の責任ある AI フレームワークは理論的な文書である必要はありません。開発プロセスに組み込まれた具体的なチェックリスト。次のフレームワークは原則に基づいています AI 法、NIST AI RMF (リスク管理フレームワーク) ガイドライン、およびベストプラクティスの最先端の ML チームを擁する企業。オープンソースツールで実行できるように設計されていますコストゼロで。

# responsible_ai_framework.py
# Framework operativo per Responsible AI
# Integra tutti i componenti precedenti in una pipeline CI/CD-ready

import mlflow
import pandas as pd
import numpy as np
from typing import Optional
from pathlib import Path
import json
import datetime

# Import dei moduli sviluppati in questo articolo
# from model_card_generator import generate_model_card, log_model_card_to_mlflow
# from fairness_checker import run_fairness_analysis, log_fairness_to_mlflow
# from explainability_shap import MLExplainer
# from audit_logger import MLAuditLogger
# from model_registry_governance import GovernanceConfig, register_model_with_governance


class ResponsibleAIPipeline:
    """
    Pipeline completa di Responsible AI per training e deployment di modelli ML.
    Integra: model card, fairness check, explainability, audit trail, governance.
    """

    def __init__(
        self,
        model_name: str,
        model_version: str,
        risk_category: str,
        sensitive_features: list,
        output_dir: str = "./governance_output"
    ):
        self.model_name = model_name
        self.model_version = model_version
        self.risk_category = risk_category
        self.sensitive_features = sensitive_features
        self.output_dir = Path(output_dir)
        self.output_dir.mkdir(parents=True, exist_ok=True)

        self.audit_logger = MLAuditLogger(
            model_name=model_name,
            model_version=model_version,
            log_file=str(self.output_dir / f"audit_{model_name}.jsonl")
        )

        self.governance_report = {
            "model_name": model_name,
            "version": model_version,
            "risk_category": risk_category,
            "evaluation_date": datetime.date.today().isoformat(),
            "checks": {}
        }

    def run_full_governance_check(
        self,
        model,
        X_test: pd.DataFrame,
        y_test: pd.Series,
        run_id: str,
        config: dict
    ) -> dict:
        """
        Esegue tutti i controlli di governance in sequenza.
        Restituisce report completo con esito di ogni check.
        """
        print(f"\n=== RESPONSIBLE AI GOVERNANCE CHECK ===")
        print(f"Modello: {self.model_name} v{self.model_version}")
        print(f"Risk Category: {self.risk_category}\n")

        # ---- 1. Model Card ----
        print("[1/5] Generazione Model Card...")
        try:
            card = generate_model_card(
                model_name=self.model_name,
                model_version=self.model_version,
                model=model,
                X_test=X_test,
                y_test=y_test,
                sensitive_cols=self.sensitive_features,
                intended_use=config.get("intended_use", ""),
                config=config
            )
            log_model_card_to_mlflow(card, run_id)
            self.governance_report["checks"]["model_card"] = "PASS"
            print("  OK: Model Card generata e loggata")
        except Exception as e:
            self.governance_report["checks"]["model_card"] = f"FAIL: {str(e)}"
            print(f"  FAIL: {e}")

        # ---- 2. Fairness Analysis ----
        print("[2/5] Fairness Analysis...")
        fairness_results_all = {}
        fairness_pass = True

        y_pred = model.predict(X_test)
        for feat in self.sensitive_features:
            if feat not in X_test.columns:
                continue
            try:
                results = run_fairness_analysis(
                    y_true=y_test,
                    y_pred=y_pred,
                    sensitive_feature=X_test[feat],
                    threshold=config.get("fairness_threshold", 0.10)
                )
                fairness_results_all[feat] = results
                log_fairness_to_mlflow(results, run_id)

                if not results["is_fair"]:
                    fairness_pass = False
                    for msg in results["messages"]:
                        print(f"  {msg}")
                else:
                    print(f"  OK: Fairness per '{feat}' nei limiti accettabili")
            except Exception as e:
                print(f"  WARNING: Fairness check per '{feat}' fallito: {e}")

        self.governance_report["checks"]["fairness"] = "PASS" if fairness_pass else "FAIL"

        # ---- 3. Explainability ----
        print("[3/5] Explainability (SHAP)...")
        try:
            explainer = MLExplainer(
                model=model,
                model_type=config.get("model_type", "tree")
            )
            # Usa un sample per efficienza
            sample_size = min(500, len(X_test))
            X_sample = X_test.sample(n=sample_size, random_state=42)
            explainer.compute_shap_values(X_sample)
            explainer.log_to_mlflow(X_sample, run_id)

            top_features = explainer.global_importance(top_n=5)
            print(f"  OK: Top 5 features: {', '.join(top_features['feature'].tolist())}")
            self.governance_report["checks"]["explainability"] = "PASS"
        except Exception as e:
            self.governance_report["checks"]["explainability"] = f"FAIL: {str(e)}"
            print(f"  FAIL: {e}")

        # ---- 4. Risk Assessment ----
        print("[4/5] Risk Assessment...")
        risk_assessment = self._run_risk_assessment(config)
        self.governance_report["risk_assessment"] = risk_assessment

        if risk_assessment["risk_score"] > 0.7:
            print(f"  ATTENZIONE: Risk score alto ({risk_assessment['risk_score']:.2f})")
            self.governance_report["checks"]["risk_assessment"] = "HIGH_RISK"
        else:
            print(f"  OK: Risk score accettabile ({risk_assessment['risk_score']:.2f})")
            self.governance_report["checks"]["risk_assessment"] = "PASS"

        # ---- 5. Audit Log dell'evento di governance ----
        print("[5/5] Audit Trail...")
        self.audit_logger.log_governance_event(
            event_subtype="FULL_GOVERNANCE_CHECK",
            details={
                "checks": self.governance_report["checks"],
                "risk_score": risk_assessment["risk_score"],
                "fairness_pass": fairness_pass,
                "run_id": run_id
            },
            actor="automated-pipeline"
        )
        self.governance_report["checks"]["audit_trail"] = "PASS"
        print("  OK: Audit trail registrato")

        # Report finale
        all_pass = all(
            v == "PASS" for v in self.governance_report["checks"].values()
        )
        self.governance_report["overall_status"] = "APPROVED" if all_pass else "REQUIRES_REVIEW"

        print(f"\n=== RISULTATO: {self.governance_report['overall_status']} ===\n")

        # Salva report
        report_path = self.output_dir / f"governance_report_{self.model_name}_v{self.model_version}.json"
        with open(report_path, "w") as f:
            json.dump(self.governance_report, f, indent=2, ensure_ascii=False)

        return self.governance_report

    def _run_risk_assessment(self, config: dict) -> dict:
        """
        Calcola un risk score composito basato sul contesto del modello.
        Segue la tassonomia EU AI Act.
        """
        score = 0.0
        factors = []

        # Categoria rischio
        if self.risk_category == "high-risk":
            score += 0.4
            factors.append("High-risk AI Act category: +0.4")
        elif self.risk_category == "limited-risk":
            score += 0.2
            factors.append("Limited-risk AI Act category: +0.2")

        # Features sensibili
        if len(self.sensitive_features) > 0:
            score += 0.1 * min(len(self.sensitive_features), 3)
            factors.append(f"{len(self.sensitive_features)} sensitive features: +{0.1 * min(len(self.sensitive_features), 3)}")

        # Uso in decisioni automatiche
        if config.get("automated_decisions", False):
            score += 0.2
            factors.append("Decisioni automatiche senza revisione umana: +0.2")

        # Dati personali
        if config.get("processes_personal_data", False):
            score += 0.1
            factors.append("Elabora dati personali: +0.1")

        return {
            "risk_score": min(score, 1.0),
            "risk_level": "HIGH" if score > 0.6 else ("MEDIUM" if score > 0.3 else "LOW"),
            "factors": factors
        }

ML ガバナンスのベストプラクティスとアンチパターン

技術ツールを見た後は、ガバナンスをシステムに統合する方法を理解することが重要です。持続不可能なオーバーヘッドを発生させることなく、ML チームの日常生活を実現します。効果的なガバナンスは、完全に自動化され、後から追加される手動プロセスではなく、CI/CD パイプラインに統合されます。

ML ガバナンスのベストプラクティス

コードとしてのガバナンス: すべてのチェック（モデルカード、公平性、説明可能性）を統合します。 CI/CD パイプライン内で自動ステップとして実行されます。公平性チェックが失敗した場合、展開は行われません。技術的なゲートについては手動による決定は不要で、組織的なゲートについては人間による監督のみが行われます。
モデルレジストリに一元化します。 MLflow モデルレジストリは唯一の信頼できる情報源です。各バージョンには標準化されたタグ（risk_category、approved_by、fairness_checked）が必要です。必須タグのないバージョンからのデプロイメントを禁止します。
結果だけでなく決定事項を文書化します。 いつでもログに記録します正当な理由 (例: 「DP diff 0.12 を受け入れました)」を付けて残留バイアスを受け入れることにしました。 n=45 のサブグループ X についてのみ閾値を超えているため、統計的に有意ではありません)。
チャンピオン/チャレンジャーは常に: 以前のバージョンは決して削除しないでください新しいテンプレートをプロモートするときに、レジストリからテンプレートを取得します。ロールバックチャレンジャーとして保持します実稼働環境での公平性またはパフォーマンスの問題が発生した場合は、ただちに対処されます。
公平性ドリフトの定期的なレビュー: モデルのバイアスは変化する可能性があります時間の経過とともに入力の分布が変化した場合。公平性分析を毎月再実行する初期導入時だけでなく、実稼働データでも同様です。
高リスクの人間参加型: AI法高リスクシステム向けに実装高いリスクで決定を送信するフラグ機構 (例: 0.45 から 0.45 の間の確率) 0.55) をエンドユーザーに通知する前に、人間のオペレーターに手動でレビューしてもらいます。

避けるべきアンチパターン

トレーニング中のみの公平性チェック: 制作における公平性は時間の経過とともに変化します。トレーニングでは公平なモデルでも、運用データが変化すると不公平になる可能性があります (データドリフト)。 Evidently またはカスタムツールを使用して公平性を継続的に監視します。
静的モデルカード: 最初の展開時に作成され、その時点ではすでに廃止されているモデルカード 2回目の更新。新しいトレーニングごとに生成を自動化します。 Word 文書が手動で更新されました。
トレーニングセット全体のSHAP: 100 万サンプルのデータセット上の TreeSHAP 何時間もかかることもあります。常に代表的なサンプル (500 ～ 2000 サンプル) を使用してください。グローバルな視点。本番環境でのローカルな説明については、SHAP のみを計算します。説明が必要な予測 (高リスクまたは決定閾値に近い)。
トランザクションデータベースの監査ログ: 標準の SQL データベースでは UPDATE が可能ですそして削除します。 AI Act 監査ログの場合は、編集可能な SQL テーブルを使用しないでください。追加専用ファイルを使用してください。整合性ハッシュを備えた不変ストレージ上。
電子メール/チャットによる承認: ガバナンスの承認を追跡する必要がある Slack スレッドやメールではなく、システム (MLflow タグ、Jira チケットなど) 内で。監査で規制上、「マルコが Teams に問題ないと書いた」だけでは十分な文書ではありません。

中小企業向けの予算: 年間 5,000 ユーロ未満の ML ガバナンス

ML ガバナンスには企業の予算は必要ありません。この記事で説明するフレームワーク全体そして100%オープンソース:

MLフロー: 無料、単一サーバー上で自己ホスト型 (2 vCPU、4GB RAM で十分) 小規模チームの場合）。コスト: クラウドで月額約 15 ～ 20 ユーロ。
フェアラーン + SHAP + scikit-learn: オープンソースのゼロコスト Python ライブラリライセンス。
監査ログ: S3 互換オブジェクトストレージ上の JSONL ファイル (セルフホスト型 MinIO またはクラウド）。 100 GB のログ: 約 2 ～ 3 ユーロ/月。
プロメテウス + グラファナ 運用環境で公平性メトリクスを監視する場合: 無料で、K3s または Docker Compose にインストールできます。

合計: 300 ユーロ/年未満 包括的でコンプライアンスに準拠したガバナンスシステムを実現するために自動モデルカード、公平性チェック、SHAP 説明可能性、および AI 法の要件に準拠変更できない監査証跡。

結論

2026 年の ML ガバナンスは、人工知能システムの開発者にとってもはやオプションではありません EU では、AI 法により、厳しい制裁を伴う具体的な要件が定められました。しかし、コンプライアンスの先に目を向けると、優れたガバナンスの枠組みは具体的なメリットをもたらします: 公平性によるより堅牢なモデル分析、SHAP によるデバッグの高速化 (業界データによれば 31% 高速化)、関係者の信頼と、問題が発生した場合の安全なロールバック。

この記事で説明されているアプローチは完全にオープンソースであり、CI/CD で自動化できます。あらゆる規模のチームが持続不可能なオーバーヘッドを発生させることなく ML ガバナンスを実装できるようになります。鍵と自動化: コード生成されたモデルカード、CI ゲートとしての公平性チェック、監査サービスサイドカーとしてのトレイル。SHAP はデプロイメントごとに計算されます。ガバナンスが一部となるエンジニアリングプロセスであり、監査前に記入する文書ではありません。

このシリーズの次の最後の記事では、 ケーススタディ本番環境におけるチャーン予測 (ID 315)、シリーズのすべてのコンポーネントを統合します: MLflow 実験追跡、バージョン管理用の DVC、 FastAPI の提供、Kubernetes の導入、Prometheus とガバナンスフレームワークによる監視この記事では、単一の動作するエンドツーエンドパイプラインで説明されています。

この MLOps シリーズの関連記事

MLOps: 実験から実稼働へ - 基本と完全なライフサイクル
CI/CD を使用した ML パイプライン: GitHub Actions + Docker - ガバナンスゲートをCIに統合
MLflow を使用した実験の追跡 - ガバナンスの基礎としてのモデルレジストリ
モデルのドリフト検出と自動再トレーニング - 公平性ドリフトとモニタリング
Kubernetes での ML のスケーリング - K8s にガバナンスフレームワークを導入する
ML モデルの A/B テスト - チャンピオン/チャレンジャーのガバナンス

クロスシリーズ

高度な深層学習シリーズ - ディープラーニングとLLMモデルのガバナンス
データ＆AIビジネスシリーズ - ビジネスの文脈における AI ガバナンス