こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

生成AIによる法的文書の要約

企業合併契約書は 300 ページを超えることもよくあります。訴訟ファイルには何千ものファイルが含まれます。しかし、今日では、弁護士または法律アナリストは、これらの文書を読み、理解し、要約する必要があります。ますます圧縮された時間。そこには 生成AI そして特に私は 大規模言語モデル (LLM) このプロセスを根本的に変革し、学術実験から法律事務所や企業における生産ツールまでの自動要約企業法務部門。

この記事では、法的文書の要約に関する技術パイプライン全体について説明します。テキストの取り込みやチャンク化から、MapReduce や階層的な要約戦略まで、特殊なモデルの微調整と出力検証に至るまで、回避することができます。幻覚そして重大な省略。実際のPythonコードを書いて比較してみます。主要なフレームワークについて説明し、LegalTech 製品を構築する人にとっての実際的な影響について説明します。

何を学ぶか

長い法律文書のチャンク化戦略 (MapReduce、階層化、リファイン)
法的要約のための高度なプロンプトエンジニアリング
LoRA/QLoRA を使用した法的コーパス上の LLM の微調整
出力検証: ROUGE、BERTScore、および人間参加型
LangChain と LlamaIndex を使用した本番環境に対応したパイプライン

問題: 法的文書とトークンの制限

LLM モデルのコンテキストウィンドウは限られています。 GPT-4 Turboは128,000トークンに、Claude 3.5 最大 200,000 件ですが、添付ファイルのある複雑な契約では、数えることなくこれらの制限を簡単に超える可能性があります。単一のプロンプトでドキュメント全体を処理するとコストがかかり、多くの場合、低品質の出力が生成されます。

法文特有の問題は、各条項が法律に存在する定義に依存する可能性があることです。異なるセクション。第 1 条で定義される「債務不履行の事象」は、記載されている結果を引き起こします。連続したチャンクを処理する単純な要約戦略では、これらを見逃す可能性があります。重要な依存関係。

長いドキュメントを管理するための 3 つの主な戦略は次のとおりです。

マップリデュース: 各チャンクは独立して要約され、その後要約が表示されます最終的な要約にまとめられます。高速で並列化可能ですが、チャンク間のコンテキストが失われます。
階層/ツリーベース: チャンクは意味的にグループ化され、要約されます階層のあらゆるレベルで。ドキュメント構造をより適切に維持します。
リファイン： 新しいチャンクを追加することで、概要が徐々に洗練されます。より正確ですが、連続的で遅いです。

法的文章のインテリジェントなチャンキング

要約戦略の前に、チャンク化を行う必要があります。 意味的に一貫した 法的文書の構造に合わせて。記事を途中で区切ると文脈が破壊されます。解決策構造ベースのチャンク化: 記事、セクション、節を原子単位として扱います。

import re
from dataclasses import dataclass
from typing import List, Optional

@dataclass
class LegalChunk:
    """Rappresenta un chunk semantico di un documento legale."""
    chunk_id: str
    article_number: Optional[str]
    section_title: str
    content: str
    token_count: int
    metadata: dict

class LegalDocumentChunker:
    """
    Chunker specializzato per documenti legali strutturati.
    Rispetta i confini di articoli, sezioni e clausole.
    """

    # Pattern per rilevare inizi di articoli/sezioni
    ARTICLE_PATTERN = re.compile(
        r'^(ARTICOLO|ART\.|ARTICLE|SECTION|CLAUSOLA|CLAUSE)\s+(\d+[a-z]?)',
        re.IGNORECASE | re.MULTILINE
    )

    def __init__(self, max_tokens: int = 4000, overlap_tokens: int = 200):
        self.max_tokens = max_tokens
        self.overlap_tokens = overlap_tokens

    def chunk_document(self, text: str, doc_metadata: dict) -> List[LegalChunk]:
        """
        Splitta un documento nelle sue unita semantiche principali.
        Prima prova a rispettare i confini strutturali,
        poi applica fallback a chunk di dimensione fissa.
        """
        chunks = []
        sections = self._split_by_structure(text)

        for idx, section in enumerate(sections):
            token_count = self._estimate_tokens(section['content'])

            if token_count <= self.max_tokens:
                # Sezione abbastanza piccola: usala come chunk atomico
                chunk = LegalChunk(
                    chunk_id=f"chunk_{idx:04d}",
                    article_number=section.get('article_number'),
                    section_title=section.get('title', 'Sezione senza titolo'),
                    content=section['content'],
                    token_count=token_count,
                    metadata={**doc_metadata, 'section_index': idx}
                )
                chunks.append(chunk)
            else:
                # Sezione troppo lunga: applica sliding window con overlap
                sub_chunks = self._sliding_window_split(
                    section['content'],
                    section.get('article_number'),
                    section.get('title', ''),
                    doc_metadata,
                    idx
                )
                chunks.extend(sub_chunks)

        return chunks

    def _split_by_structure(self, text: str) -> List[dict]:
        """Identifica confini naturali del documento legale."""
        sections = []
        matches = list(self.ARTICLE_PATTERN.finditer(text))

        if not matches:
            # Nessuna struttura rilevata: documento come singolo blocco
            return [{'content': text, 'title': 'Documento', 'article_number': None}]

        for i, match in enumerate(matches):
            start = match.start()
            end = matches[i + 1].start() if i + 1 < len(matches) else len(text)
            sections.append({
                'article_number': match.group(2),
                'title': match.group(0),
                'content': text[start:end].strip()
            })

        return sections

    def _estimate_tokens(self, text: str) -> int:
        """Stima approssimativa: 1 token ~= 4 caratteri per italiano/inglese."""
        return len(text) // 4

    def _sliding_window_split(self, text, article_num, title, metadata, base_idx):
        """Fallback: sliding window con overlap semantico."""
        words = text.split()
        chunk_size_words = self.max_tokens * 3  # approssimazione parole
        overlap_words = self.overlap_tokens * 3
        sub_chunks = []
        start = 0
        sub_idx = 0

        while start < len(words):
            end = min(start + chunk_size_words, len(words))
            chunk_text = ' '.join(words[start:end])
            sub_chunks.append(LegalChunk(
                chunk_id=f"chunk_{base_idx:04d}_{sub_idx:02d}",
                article_number=article_num,
                section_title=f"{title} (parte {sub_idx + 1})",
                content=chunk_text,
                token_count=self._estimate_tokens(chunk_text),
                metadata={**metadata, 'section_index': base_idx, 'sub_index': sub_idx}
            ))
            start += chunk_size_words - overlap_words
            sub_idx += 1

        return sub_chunks

LangChain を使用した MapReduce 戦略

MapReduce 戦略は並列化可能でスケーラブルであるため、運用環境では最も一般的です。各チャンクは独立して処理され (マップフェーズ)、部分的なサマリーが得られます。組み合わせます（フェーズを減らす）。 LangChain は、すぐに使用できる実装を提供します。

from langchain.chains.summarize import load_summarize_chain
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.schema import Document
from typing import List
import asyncio

# Prompt specializzato per il Map step (riassunto di singoli chunk)
MAP_PROMPT_TEMPLATE = """Sei un analista legale esperto. Riassumi il seguente estratto
di documento legale, preservando:
1. Obblighi e diritti delle parti
2. Scadenze e date critiche
3. Condizioni e clausole risolutive
4. Definizioni tecniche importanti
5. Penali e conseguenze di inadempimento

Estratto:
{text}

RIASSUNTO STRUTTURATO:"""

# Prompt per il Reduce step (sintesi finale dei riassunti parziali)
REDUCE_PROMPT_TEMPLATE = """Sei un senior legal counsel. Hai davanti i riassunti
delle varie sezioni di un documento legale. Produci un executive summary che:
1. Identifichi le parti contraenti e l'oggetto del contratto
2. Sintetizzi i principali obblighi di ciascuna parte
3. Evidenzi i rischi legali più rilevanti
4. Elenchi le date e scadenze critiche
5. Segnali le clausole potenzialmente controverse

Riassunti delle sezioni:
{text}

EXECUTIVE SUMMARY LEGALE:"""

class LegalMapReduceSummarizer:
    """
    Pipeline MapReduce asincrona per summarization di contratti.
    Supporta parallelismo controllato per rispettare i rate limit API.
    """

    def __init__(
        self,
        model_name: str = "gpt-4o",
        max_concurrent: int = 5,
        temperature: float = 0.1  # bassa temperatura per output deterministici
    ):
        self.llm = ChatOpenAI(model=model_name, temperature=temperature)
        self.max_concurrent = max_concurrent
        self.semaphore = asyncio.Semaphore(max_concurrent)

        self.map_prompt = PromptTemplate(
            template=MAP_PROMPT_TEMPLATE,
            input_variables=["text"]
        )
        self.reduce_prompt = PromptTemplate(
            template=REDUCE_PROMPT_TEMPLATE,
            input_variables=["text"]
        )

    async def summarize_chunk(self, chunk: LegalChunk) -> dict:
        """Riassume un singolo chunk (fase Map)."""
        async with self.semaphore:
            doc = Document(page_content=chunk.content)
            chain = load_summarize_chain(
                self.llm,
                chain_type="stuff",  # per chunk singoli
                prompt=self.map_prompt
            )
            result = await chain.ainvoke({"input_documents": [doc]})
            return {
                'chunk_id': chunk.chunk_id,
                'article_number': chunk.article_number,
                'section_title': chunk.section_title,
                'summary': result['output_text']
            }

    async def summarize_document(self, chunks: List[LegalChunk]) -> dict:
        """
        Pipeline completa: Map parallelo + Reduce sequenziale.
        """
        print(f"Avvio Map su {len(chunks)} chunk in parallelo...")

        # Fase Map: summarization parallela di tutti i chunk
        map_tasks = [self.summarize_chunk(chunk) for chunk in chunks]
        chunk_summaries = await asyncio.gather(*map_tasks)

        print(f"Map completato. Avvio Reduce su {len(chunk_summaries)} riassunti...")

        # Fase Reduce: sintesi finale
        combined_text = "\n\n---\n\n".join([
            f"SEZIONE: {s['section_title']}\n{s['summary']}"
            for s in chunk_summaries
        ])

        reduce_doc = Document(page_content=combined_text)
        reduce_chain = load_summarize_chain(
            self.llm,
            chain_type="stuff",
            prompt=self.reduce_prompt
        )
        final_result = await reduce_chain.ainvoke({
            "input_documents": [reduce_doc]
        })

        return {
            'executive_summary': final_result['output_text'],
            'chunk_summaries': chunk_summaries,
            'total_chunks_processed': len(chunks)
        }

# Utilizzo
async def main():
    chunker = LegalDocumentChunker(max_tokens=3500)
    summarizer = LegalMapReduceSummarizer(model_name="gpt-4o")

    with open("contratto_fornitura.txt", "r") as f:
        text = f.read()

    chunks = chunker.chunk_document(text, {'doc_type': 'supply_contract', 'doc_id': 'SC-2025-001'})
    result = await summarizer.summarize_document(chunks)

    print("=== EXECUTIVE SUMMARY ===")
    print(result['executive_summary'])

LoRA を使用した法的ドメインの微調整

GPT-4 のような汎用モデルは高品質の概要を生成しますが、多くの場合、不足しています。特定の技術的・法律用語を使用し、法的な公式を「標準化」する傾向がある標準を共通言語にすると、精度が失われます。の LoRA による微調整 (低ランク) 適応) Llama-3 や Mistral などのオープンソースモデルを特殊化できますエンタープライズ GPU を必要とせずに、契約のコーパスを利用できます。

from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    TrainingArguments,
    Trainer,
    DataCollatorForSeq2Seq
)
from peft import LoraConfig, get_peft_model, TaskType
from datasets import Dataset
import torch
import json

def prepare_legal_dataset(jsonl_path: str) -> Dataset:
    """
    Carica e formatta il dataset di addestramento.
    Formato atteso: {"document": "...", "summary": "..."} per riga
    """
    data = []
    with open(jsonl_path, 'r') as f:
        for line in f:
            item = json.loads(line.strip())
            # Template di istruzione per il modello
            prompt = (
                f"### Istruzione:\nRiassumi questo documento legale in italiano "
                f"mantenendo la terminologia giuridica precisa.\n\n"
                f"### Documento:\n{item['document']}\n\n"
                f"### Riassunto:\n"
            )
            full_text = prompt + item['summary']
            data.append({'text': full_text, 'prompt_len': len(prompt)})

    return Dataset.from_list(data)

def setup_lora_model(base_model_id: str = "mistralai/Mistral-7B-Instruct-v0.3"):
    """
    Carica Mistral-7B e applica LoRA per fine-tuning efficiente.
    Richiede ~16GB VRAM (4-bit quantization).
    """
    from transformers import BitsAndBytesConfig

    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16
    )

    tokenizer = AutoTokenizer.from_pretrained(base_model_id)
    tokenizer.pad_token = tokenizer.eos_token

    model = AutoModelForCausalLM.from_pretrained(
        base_model_id,
        quantization_config=bnb_config,
        device_map="auto"
    )

    # Configurazione LoRA: adattiamo solo i layer di attenzione
    lora_config = LoraConfig(
        task_type=TaskType.CAUSAL_LM,
        r=16,               # rank della decomposizione
        lora_alpha=32,      # scaling factor
        target_modules=["q_proj", "v_proj", "k_proj", "o_proj"],
        lora_dropout=0.05,
        bias="none"
    )

    model = get_peft_model(model, lora_config)
    model.print_trainable_parameters()
    # Output: trainable params: 13,631,488 || all params: 3,765,006,336 || trainable%: 0.36

    return model, tokenizer

def train_legal_summarizer(
    dataset_path: str,
    output_dir: str,
    num_epochs: int = 3
):
    """Fine-tuning completo del modello legale."""
    model, tokenizer = setup_lora_model()
    dataset = prepare_legal_dataset(dataset_path)

    # Split train/eval
    split = dataset.train_test_split(test_size=0.1)

    training_args = TrainingArguments(
        output_dir=output_dir,
        num_train_epochs=num_epochs,
        per_device_train_batch_size=2,
        per_device_eval_batch_size=2,
        gradient_accumulation_steps=8,
        learning_rate=2e-4,
        warmup_ratio=0.1,
        lr_scheduler_type="cosine",
        logging_steps=50,
        evaluation_strategy="epoch",
        save_strategy="epoch",
        load_best_model_at_end=True,
        bf16=True,
        report_to="wandb",  # o "tensorboard"
    )

    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=split['train'],
        eval_dataset=split['test'],
        data_collator=DataCollatorForSeq2Seq(tokenizer, model=model, padding=True)
    )

    trainer.train()
    model.save_pretrained(f"{output_dir}/lora_weights")
    tokenizer.save_pretrained(f"{output_dir}/tokenizer")

出力の検証: 幻覚の回避

法的な分野では、幻覚は単純な品質エラーではなく、結果を引き起こす可能性があります。悲惨な。存在しない罰則条項に言及したり、期限を省略した要約これは非常に重要ですが、誤った決定につながり、重大な経済的および法的影響を与える可能性があります。

検証戦略は複数のレベルで機能する必要があります。

法的領域における幻覚のリスク

2025 年のスタンフォードの研究文書によると、法律研究向けの最先端の AI システム (Westlaw AI、LexisNexis Lexis+) は、17% ～ 33% の幻覚率を示します。特定のクエリ。 AI の出力は常に一次ソースで検証してください。

from rouge_score import rouge_scorer
from sentence_transformers import SentenceTransformer, util
import numpy as np
from dataclasses import dataclass, field

@dataclass
class ValidationResult:
    """Risultato della validazione di un riassunto legale."""
    rouge_l: float
    bert_score: float
    citation_coverage: float  # % di riferimenti normativi coperti
    date_accuracy: float       # % di date correttamente estratte
    passed: bool
    warnings: list = field(default_factory=list)

class LegalSummaryValidator:
    """
    Validatore multi-dimensionale per riassunti legali.
    Combina metriche automatiche con check rule-based.
    """

    def __init__(self):
        self.rouge = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True)
        self.bert_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-mpnet-base-v2')
        self.date_pattern = re.compile(
            r'\b(\d{1,2}[\/\-\.]\d{1,2}[\/\-\.]\d{2,4}|\d{4}[\/\-\.]\d{1,2}[\/\-\.]\d{1,2})\b'
        )
        self.article_pattern = re.compile(r'\bArt\.\s*\d+|Articolo\s+\d+', re.IGNORECASE)

    def validate(self, original_text: str, summary: str) -> ValidationResult:
        """Esegue validazione completa del riassunto."""
        warnings = []

        # 1. ROUGE-L: misura sovrapposizione sequenze
        rouge_scores = self.rouge.score(original_text, summary)
        rouge_l = rouge_scores['rougeL'].fmeasure

        # 2. BERTScore semantico: embedding similarity
        orig_embed = self.bert_model.encode(original_text[:5000], convert_to_tensor=True)
        summ_embed = self.bert_model.encode(summary, convert_to_tensor=True)
        bert_score = float(util.cos_sim(orig_embed, summ_embed))

        # 3. Verifica copertura date critiche
        dates_in_original = set(self.date_pattern.findall(original_text))
        dates_in_summary = set(self.date_pattern.findall(summary))
        if dates_in_original:
            date_accuracy = len(dates_in_original & dates_in_summary) / len(dates_in_original)
        else:
            date_accuracy = 1.0

        if date_accuracy < 0.8:
            warnings.append(f"Date mancanti nel riassunto: {dates_in_original - dates_in_summary}")

        # 4. Verifica riferimenti normativi
        articles_original = set(self.article_pattern.findall(original_text))
        articles_summary = set(self.article_pattern.findall(summary))
        citation_coverage = (
            len(articles_original & articles_summary) / len(articles_original)
            if articles_original else 1.0
        )

        # 5. Check lunghezza (riassunto non deve essere più lungo dell'originale)
        compression_ratio = len(summary) / len(original_text)
        if compression_ratio > 0.5:
            warnings.append(f"Compression ratio basso: {compression_ratio:.1%} (atteso <50%)")

        # Soglie di qualità minima
        passed = (
            rouge_l >= 0.15 and
            bert_score >= 0.75 and
            date_accuracy >= 0.8 and
            citation_coverage >= 0.6
        )

        return ValidationResult(
            rouge_l=rouge_l,
            bert_score=bert_score,
            citation_coverage=citation_coverage,
            date_accuracy=date_accuracy,
            passed=passed,
            warnings=warnings
        )

Human-in-the-Loop による本番環境に対応したパイプライン

専門的なリーガルテックの文脈では、AI は法的判断に代わるものではありません。 増加する。本番パイプラインには人間によるレビューメカニズムが含まれている必要があります自動検証が最小しきい値を超えない場合、またはドキュメントの場合価値のしきい値を超える契約など、非常に重要です。

from enum import Enum
from dataclasses import dataclass
from datetime import datetime
import uuid

class ReviewStatus(Enum):
    AUTO_APPROVED = "auto_approved"
    PENDING_REVIEW = "pending_review"
    HUMAN_APPROVED = "human_approved"
    REJECTED = "rejected"

@dataclass
class SummarizationJob:
    """Rappresenta un job di summarization con il suo stato."""
    job_id: str
    document_id: str
    document_value_eur: float  # valore contrattuale per routing
    summary: str
    validation: ValidationResult
    status: ReviewStatus
    created_at: datetime
    reviewed_by: str = None
    review_notes: str = None

class SummarizationOrchestrator:
    """
    Orchestratore della pipeline di summarization con human-in-the-loop.
    Applica routing automatico basato su validazione e valore del documento.
    """

    # Soglia valore contrattuale per revisione obbligatoria (EUR)
    HIGH_VALUE_THRESHOLD = 1_000_000

    def __init__(self, chunker, summarizer, validator):
        self.chunker = chunker
        self.summarizer = summarizer
        self.validator = validator

    async def process_document(
        self,
        document_text: str,
        document_id: str,
        document_value_eur: float = 0,
        doc_metadata: dict = None
    ) -> SummarizationJob:
        """
        Processa un documento e determina il routing appropriato.
        """
        # Step 1: Chunking
        chunks = self.chunker.chunk_document(
            document_text,
            doc_metadata or {'doc_id': document_id}
        )

        # Step 2: Summarization
        result = await self.summarizer.summarize_document(chunks)
        summary = result['executive_summary']

        # Step 3: Validazione automatica
        validation = self.validator.validate(document_text, summary)

        # Step 4: Routing decision
        requires_human_review = (
            not validation.passed or
            document_value_eur >= self.HIGH_VALUE_THRESHOLD or
            len(validation.warnings) > 2
        )

        status = (
            ReviewStatus.PENDING_REVIEW if requires_human_review
            else ReviewStatus.AUTO_APPROVED
        )

        job = SummarizationJob(
            job_id=str(uuid.uuid4()),
            document_id=document_id,
            document_value_eur=document_value_eur,
            summary=summary,
            validation=validation,
            status=status,
            created_at=datetime.utcnow()
        )

        # Notifica team legale se richiesta revisione
        if requires_human_review:
            await self._notify_review_team(job)

        return job

    async def _notify_review_team(self, job: SummarizationJob):
        """Invia notifica al team legale per revisione manuale."""
        # Integrazione con sistema di ticketing (es. Jira, ServiceNow)
        message = (
            f"Revisione richiesta per documento {job.document_id}\n"
            f"Job ID: {job.job_id}\n"
            f"Validazione: {'FALLITA' if not job.validation.passed else 'PASSATA con warning'}\n"
            f"Warning: {'; '.join(job.validation.warnings)}\n"
            f"Valore contratto: EUR {job.document_value_eur:,.0f}"
        )
        # await notification_service.send(team="legal_review", message=message)
        print(f"[REVIEW REQUIRED] {message}")

モデルの比較: 法的ベンチマークでのパフォーマンス

すべてのモデルが法的領域に対して同等に作成されているわけではありません。次の表にまとめますイタリア語と英語の契約文書の特定のベンチマークにおけるパフォーマンス (500 件の契約の内部データセット、上級弁護士による手動評価)。

モデル	ルージュL	BERTScore	精度の日付	コスト/100万トークン	平均遅延
GPT-4o	0.38	0.91	94%	5ドル / 15ドル	12秒
クロード 3.5 ソネット	0.36	0.90	93%	3ドル / 15ドル	10代
ミストラル-7B (LoRA フィート)	0.31	0.85	87%	自己ホスト型	8s
ラマ-3-70B	0.34	0.88	91%	自己ホスト型	18秒
GPT-3.5ターボ	0.25	0.80	78%	0.5ドル / 1.5ドル	5s

生産協議会

ほとんどの LegalTech ユースケースでは、ハイブリッドで最適なアプローチが次のようになります。品質が重要な価値の高いドキュメントには GPT-4o (または Claude 3.5) を使用します。標準的なドキュメント量に合わせて自己ホスト型の微調整モデルを提供します。許容可能な品質を維持しながら、コストを 80% 以上削減できます。

本番環境のベストプラクティス

法律用語を保持します: 明示的にプロンプトを使用する「デフォルト」、「エスクロー」、「条項」などの専門用語を保持するよう依頼する言い換えることなく「決意を表明する」。
出力を構造化します。 JSON スキーマまたは構造化出力を使用します。事前定義されたセクション (部品、オブジェクト、義務、期限、罰則あり）。
即時バージョン管理: プロンプトのバージョンを追跡する各サマリーを作成しました。これは監査と再現性にとって重要です。
元の入力をログに記録します。 ソーステキストは常に次の場所に保存してください後続の検証を可能にする不変の方法 (SHA-256 ハッシュ)。
Reduce フェーズでコンテキストを制限します。 要約の合計の場合部分的にトークンが 50,000 を超えている場合は、代わりに MapReduce の 2 番目の層を適用してください単一のリデュース。

結論と次のステップ

LLM を使用した法的文書の要約は、最も成熟したアプリケーションの 1 つであり、 Generative AI は法律分野ですぐに役立ちます。適切な戦略を持ってチャンク化、迅速なエンジニアリングと検証により、信頼性の高いシステムを構築できます。これにより、ドキュメントのレビュー時間が大幅に短縮されます。最も重要な文書に対する人間の管理。

日々の実践に取り入れるべき重要なポイントは次のとおりです。

任意のサイズではなく、ドキュメントの構造に基づいてチャンク化戦略を選択します
量を重視する場合は MapReduce、正確性を重視する場合は階層型、短くて重要性の高いドキュメントを重視する場合は Refine
ROUGE + BERTScore + ルールベースのチェック (日付、規制参照) で常に有効
価値の高いドキュメントまたは信頼性の低いドキュメントに対して人間参加型を実装する
大規模ボリュームのコストを削減するための微調整を検討する

シリーズの次の記事では、 法学検索エンジンベクトル埋め込みあり: を見つけるセマンティック検索システムを構築する方法クエリが文のテキストとは異なる形式で作成されている場合でも、関連する文を表示します。

リーガルテックとAIシリーズ

契約分析のための NLP: OCR から理解まで
電子証拠開示プラットフォームのアーキテクチャ
動的ルールエンジンによるコンプライアンスの自動化
法的合意のためのスマートコントラクト: Solidity と Vyper
生成 AI による法的文書の要約 (この記事)
検索エンジンの法則: ベクトル埋め込み
Scala でのデジタル署名と文書認証
データプライバシーとGDPRコンプライアンスシステム
法務 AI アシスタント (法務副操縦士) の構築
LegalTech データ統合パターン