안녕하세요!

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

연락하기

소개

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

역량

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

프로세스 자동화

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

맞춤 시스템

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

미션

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

기술의 민주화

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

IT와 비즈니스 통합

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

맞춤 솔루션

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

기술로 비즈니스를 혁신하세요

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

연락하기

프로젝트가 있으신가요? 아래 양식을 작성해 주시면 빠르게 답변드리겠습니다.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

제너레이티브 AI를 활용한 법률 문서 요약

기업 합병 계약서는 종종 300페이지를 초과합니다. 소송 파일에는 수천 개가 있습니다. 그러나 오늘날 변호사나 법률 분석가는 이러한 문서를 읽고, 이해하고, 요약해야 합니다. 점점 압축되는 시간. 거기 생성 AI 그리고 특히 나는 대형 언어 모델(LLM) 이러한 프로세스를 근본적으로 변화시켜 로펌 및 로펌의 학술 실험부터 생산 도구까지 자동 요약 기업 법무 부서.

이 기사에서는 법률 문서 요약을 위한 전체 기술 파이프라인을 살펴봅니다. 텍스트 수집 및 청킹부터 MapReduce 및 계층적 요약 전략까지, 방지하기 위해 특수 모델의 미세 조정 및 출력 검증까지 가능합니다. 환각 그리고 중요한 누락. 실제 Python 코드를 작성하고 비교하겠습니다. 주요 프레임워크를 살펴보고 LegalTech 제품 구축에 대한 실질적인 의미를 논의합니다.

무엇을 배울 것인가

긴 법률 문서에 대한 청킹 전략(MapReduce, Hierarchical, Refine)
법적 요약을 위한 고급 프롬프트 엔지니어링
LoRA/QLoRA를 사용한 법률 코퍼스의 LLM 미세 조정
출력 검증: ROUGE, BERTScore 및 Human-In-The-Loop
LangChain 및 LlamaIndex를 사용한 프로덕션 준비 파이프라인

문제: 법적 문서 및 토큰 한도

LLM 모델에는 제한된 컨텍스트 창이 있습니다. GPT-4 Turbo는 128,000개의 토큰으로 이동, Claude 3.5 최대 200,000개까지 가능하지만 첨부 파일이 포함된 복잡한 계약은 계산하지 않고도 이러한 제한을 쉽게 초과할 수 있습니다. 단일 프롬프트에서 전체 문서를 처리하는 데 비용이 많이 들고 종종 낮은 품질의 출력이 생성됩니다.

법률 텍스트의 구체적인 문제는 각 조항이 법률 텍스트의 정의에 따라 달라질 수 있다는 것입니다. 다른 섹션. 제1조에 정의된 "불이행 사건"은 다음과 같은 결과를 초래합니다. 12조에서. 순차적인 청크를 처리하는 순진한 요약 전략은 다음을 놓칠 수 있습니다. 중요한 종속성.

긴 문서를 관리하기 위한 세 가지 주요 전략은 다음과 같습니다.

맵리듀스: 각 청크는 독립적으로 요약된 다음 요약이 표시됩니다. 최종 요약으로 합쳐졌습니다. 빠르고 병렬화 가능하지만 청크 간 컨텍스트가 손실됩니다.
계층적/트리 기반: 청크는 의미적으로 그룹화되고 요약됩니다. 계층 구조의 모든 수준에서. 문서 구조를 더 잘 유지합니다.
구체화: 요약은 새로운 청크를 추가하여 점진적으로 개선됩니다. 더 정확하지만 순차적이고 느립니다.

법률 텍스트에 대한 지능형 청킹

요약 전략을 사용하기 전에 청킹을 수행해야 합니다. 의미상 일관성이 있는 법적 문서의 구조와 함께. 기사를 중간에 끊으면 문맥이 파괴됩니다. 해결책 구조 기반 청크: 원자 단위로 기사, 섹션, 절.

import re
from dataclasses import dataclass
from typing import List, Optional

@dataclass
class LegalChunk:
    """Rappresenta un chunk semantico di un documento legale."""
    chunk_id: str
    article_number: Optional[str]
    section_title: str
    content: str
    token_count: int
    metadata: dict

class LegalDocumentChunker:
    """
    Chunker specializzato per documenti legali strutturati.
    Rispetta i confini di articoli, sezioni e clausole.
    """

    # Pattern per rilevare inizi di articoli/sezioni
    ARTICLE_PATTERN = re.compile(
        r'^(ARTICOLO|ART\.|ARTICLE|SECTION|CLAUSOLA|CLAUSE)\s+(\d+[a-z]?)',
        re.IGNORECASE | re.MULTILINE
    )

    def __init__(self, max_tokens: int = 4000, overlap_tokens: int = 200):
        self.max_tokens = max_tokens
        self.overlap_tokens = overlap_tokens

    def chunk_document(self, text: str, doc_metadata: dict) -> List[LegalChunk]:
        """
        Splitta un documento nelle sue unita semantiche principali.
        Prima prova a rispettare i confini strutturali,
        poi applica fallback a chunk di dimensione fissa.
        """
        chunks = []
        sections = self._split_by_structure(text)

        for idx, section in enumerate(sections):
            token_count = self._estimate_tokens(section['content'])

            if token_count <= self.max_tokens:
                # Sezione abbastanza piccola: usala come chunk atomico
                chunk = LegalChunk(
                    chunk_id=f"chunk_{idx:04d}",
                    article_number=section.get('article_number'),
                    section_title=section.get('title', 'Sezione senza titolo'),
                    content=section['content'],
                    token_count=token_count,
                    metadata={**doc_metadata, 'section_index': idx}
                )
                chunks.append(chunk)
            else:
                # Sezione troppo lunga: applica sliding window con overlap
                sub_chunks = self._sliding_window_split(
                    section['content'],
                    section.get('article_number'),
                    section.get('title', ''),
                    doc_metadata,
                    idx
                )
                chunks.extend(sub_chunks)

        return chunks

    def _split_by_structure(self, text: str) -> List[dict]:
        """Identifica confini naturali del documento legale."""
        sections = []
        matches = list(self.ARTICLE_PATTERN.finditer(text))

        if not matches:
            # Nessuna struttura rilevata: documento come singolo blocco
            return [{'content': text, 'title': 'Documento', 'article_number': None}]

        for i, match in enumerate(matches):
            start = match.start()
            end = matches[i + 1].start() if i + 1 < len(matches) else len(text)
            sections.append({
                'article_number': match.group(2),
                'title': match.group(0),
                'content': text[start:end].strip()
            })

        return sections

    def _estimate_tokens(self, text: str) -> int:
        """Stima approssimativa: 1 token ~= 4 caratteri per italiano/inglese."""
        return len(text) // 4

    def _sliding_window_split(self, text, article_num, title, metadata, base_idx):
        """Fallback: sliding window con overlap semantico."""
        words = text.split()
        chunk_size_words = self.max_tokens * 3  # approssimazione parole
        overlap_words = self.overlap_tokens * 3
        sub_chunks = []
        start = 0
        sub_idx = 0

        while start < len(words):
            end = min(start + chunk_size_words, len(words))
            chunk_text = ' '.join(words[start:end])
            sub_chunks.append(LegalChunk(
                chunk_id=f"chunk_{base_idx:04d}_{sub_idx:02d}",
                article_number=article_num,
                section_title=f"{title} (parte {sub_idx + 1})",
                content=chunk_text,
                token_count=self._estimate_tokens(chunk_text),
                metadata={**metadata, 'section_index': base_idx, 'sub_index': sub_idx}
            ))
            start += chunk_size_words - overlap_words
            sub_idx += 1

        return sub_chunks

LangChain을 사용한 MapReduce 전략

MapReduce 전략은 병렬화 및 확장이 가능하므로 프로덕션에서 가장 일반적입니다. 각 청크는 독립적으로 처리되고(맵 단계) 부분 요약이 제공됩니다. 결합(단계 감소). LangChain은 즉시 사용 가능한 구현을 제공합니다.

from langchain.chains.summarize import load_summarize_chain
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.schema import Document
from typing import List
import asyncio

# Prompt specializzato per il Map step (riassunto di singoli chunk)
MAP_PROMPT_TEMPLATE = """Sei un analista legale esperto. Riassumi il seguente estratto
di documento legale, preservando:
1. Obblighi e diritti delle parti
2. Scadenze e date critiche
3. Condizioni e clausole risolutive
4. Definizioni tecniche importanti
5. Penali e conseguenze di inadempimento

Estratto:
{text}

RIASSUNTO STRUTTURATO:"""

# Prompt per il Reduce step (sintesi finale dei riassunti parziali)
REDUCE_PROMPT_TEMPLATE = """Sei un senior legal counsel. Hai davanti i riassunti
delle varie sezioni di un documento legale. Produci un executive summary che:
1. Identifichi le parti contraenti e l'oggetto del contratto
2. Sintetizzi i principali obblighi di ciascuna parte
3. Evidenzi i rischi legali più rilevanti
4. Elenchi le date e scadenze critiche
5. Segnali le clausole potenzialmente controverse

Riassunti delle sezioni:
{text}

EXECUTIVE SUMMARY LEGALE:"""

class LegalMapReduceSummarizer:
    """
    Pipeline MapReduce asincrona per summarization di contratti.
    Supporta parallelismo controllato per rispettare i rate limit API.
    """

    def __init__(
        self,
        model_name: str = "gpt-4o",
        max_concurrent: int = 5,
        temperature: float = 0.1  # bassa temperatura per output deterministici
    ):
        self.llm = ChatOpenAI(model=model_name, temperature=temperature)
        self.max_concurrent = max_concurrent
        self.semaphore = asyncio.Semaphore(max_concurrent)

        self.map_prompt = PromptTemplate(
            template=MAP_PROMPT_TEMPLATE,
            input_variables=["text"]
        )
        self.reduce_prompt = PromptTemplate(
            template=REDUCE_PROMPT_TEMPLATE,
            input_variables=["text"]
        )

    async def summarize_chunk(self, chunk: LegalChunk) -> dict:
        """Riassume un singolo chunk (fase Map)."""
        async with self.semaphore:
            doc = Document(page_content=chunk.content)
            chain = load_summarize_chain(
                self.llm,
                chain_type="stuff",  # per chunk singoli
                prompt=self.map_prompt
            )
            result = await chain.ainvoke({"input_documents": [doc]})
            return {
                'chunk_id': chunk.chunk_id,
                'article_number': chunk.article_number,
                'section_title': chunk.section_title,
                'summary': result['output_text']
            }

    async def summarize_document(self, chunks: List[LegalChunk]) -> dict:
        """
        Pipeline completa: Map parallelo + Reduce sequenziale.
        """
        print(f"Avvio Map su {len(chunks)} chunk in parallelo...")

        # Fase Map: summarization parallela di tutti i chunk
        map_tasks = [self.summarize_chunk(chunk) for chunk in chunks]
        chunk_summaries = await asyncio.gather(*map_tasks)

        print(f"Map completato. Avvio Reduce su {len(chunk_summaries)} riassunti...")

        # Fase Reduce: sintesi finale
        combined_text = "\n\n---\n\n".join([
            f"SEZIONE: {s['section_title']}\n{s['summary']}"
            for s in chunk_summaries
        ])

        reduce_doc = Document(page_content=combined_text)
        reduce_chain = load_summarize_chain(
            self.llm,
            chain_type="stuff",
            prompt=self.reduce_prompt
        )
        final_result = await reduce_chain.ainvoke({
            "input_documents": [reduce_doc]
        })

        return {
            'executive_summary': final_result['output_text'],
            'chunk_summaries': chunk_summaries,
            'total_chunks_processed': len(chunks)
        }

# Utilizzo
async def main():
    chunker = LegalDocumentChunker(max_tokens=3500)
    summarizer = LegalMapReduceSummarizer(model_name="gpt-4o")

    with open("contratto_fornitura.txt", "r") as f:
        text = f.read()

    chunks = chunker.chunk_document(text, {'doc_type': 'supply_contract', 'doc_id': 'SC-2025-001'})
    result = await summarizer.summarize_document(chunks)

    print("=== EXECUTIVE SUMMARY ===")
    print(result['executive_summary'])

법적인 영역을 위한 LoRA의 미세 조정

GPT-4와 같은 범용 모델은 좋은 품질의 요약을 생성하지만 부족한 경우가 많습니다. 특정 기술-법적 용어를 사용하고 법적 공식을 "정규화"하는 경향이 있습니다. 공통 언어의 표준으로 인해 정확성이 떨어집니다. 그만큼 LoRA(Low-Rank)로 미세 조정 적응) Llama-3 또는 Mistral과 같은 오픈 소스 모델을 전문화할 수 있습니다. 엔터프라이즈 GPU가 필요하지 않은 계약 코퍼스에서.

from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    TrainingArguments,
    Trainer,
    DataCollatorForSeq2Seq
)
from peft import LoraConfig, get_peft_model, TaskType
from datasets import Dataset
import torch
import json

def prepare_legal_dataset(jsonl_path: str) -> Dataset:
    """
    Carica e formatta il dataset di addestramento.
    Formato atteso: {"document": "...", "summary": "..."} per riga
    """
    data = []
    with open(jsonl_path, 'r') as f:
        for line in f:
            item = json.loads(line.strip())
            # Template di istruzione per il modello
            prompt = (
                f"### Istruzione:\nRiassumi questo documento legale in italiano "
                f"mantenendo la terminologia giuridica precisa.\n\n"
                f"### Documento:\n{item['document']}\n\n"
                f"### Riassunto:\n"
            )
            full_text = prompt + item['summary']
            data.append({'text': full_text, 'prompt_len': len(prompt)})

    return Dataset.from_list(data)

def setup_lora_model(base_model_id: str = "mistralai/Mistral-7B-Instruct-v0.3"):
    """
    Carica Mistral-7B e applica LoRA per fine-tuning efficiente.
    Richiede ~16GB VRAM (4-bit quantization).
    """
    from transformers import BitsAndBytesConfig

    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16
    )

    tokenizer = AutoTokenizer.from_pretrained(base_model_id)
    tokenizer.pad_token = tokenizer.eos_token

    model = AutoModelForCausalLM.from_pretrained(
        base_model_id,
        quantization_config=bnb_config,
        device_map="auto"
    )

    # Configurazione LoRA: adattiamo solo i layer di attenzione
    lora_config = LoraConfig(
        task_type=TaskType.CAUSAL_LM,
        r=16,               # rank della decomposizione
        lora_alpha=32,      # scaling factor
        target_modules=["q_proj", "v_proj", "k_proj", "o_proj"],
        lora_dropout=0.05,
        bias="none"
    )

    model = get_peft_model(model, lora_config)
    model.print_trainable_parameters()
    # Output: trainable params: 13,631,488 || all params: 3,765,006,336 || trainable%: 0.36

    return model, tokenizer

def train_legal_summarizer(
    dataset_path: str,
    output_dir: str,
    num_epochs: int = 3
):
    """Fine-tuning completo del modello legale."""
    model, tokenizer = setup_lora_model()
    dataset = prepare_legal_dataset(dataset_path)

    # Split train/eval
    split = dataset.train_test_split(test_size=0.1)

    training_args = TrainingArguments(
        output_dir=output_dir,
        num_train_epochs=num_epochs,
        per_device_train_batch_size=2,
        per_device_eval_batch_size=2,
        gradient_accumulation_steps=8,
        learning_rate=2e-4,
        warmup_ratio=0.1,
        lr_scheduler_type="cosine",
        logging_steps=50,
        evaluation_strategy="epoch",
        save_strategy="epoch",
        load_best_model_at_end=True,
        bf16=True,
        report_to="wandb",  # o "tensorboard"
    )

    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=split['train'],
        eval_dataset=split['test'],
        data_collator=DataCollatorForSeq2Seq(tokenizer, model=model, padding=True)
    )

    trainer.train()
    model.save_pretrained(f"{output_dir}/lora_weights")
    tokenizer.save_pretrained(f"{output_dir}/tokenizer")

출력 검증: 환각 방지

법적 영역에서 환각은 단순한 품질 오류가 아닙니다. 결과를 초래할 수 있습니다. 비참한. 존재하지 않는 벌칙 조항을 언급하거나 기한을 생략한 요약 이는 중대한 경제적, 법적 영향을 미치는 잘못된 결정으로 이어질 수 있습니다.

검증 전략은 여러 수준에서 작동해야 합니다.

법적 영역에서의 환각의 위험

법률 연구용 AI 시스템을 선도하는 2025 스탠포드 연구 문서 (Westlaw AI, LexisNexis Lexis+)는 17%에서 33% 사이의 환각 비율을 제시합니다. 특정 쿼리. 항상 기본 소스를 사용하여 AI 출력을 확인하십시오.

from rouge_score import rouge_scorer
from sentence_transformers import SentenceTransformer, util
import numpy as np
from dataclasses import dataclass, field

@dataclass
class ValidationResult:
    """Risultato della validazione di un riassunto legale."""
    rouge_l: float
    bert_score: float
    citation_coverage: float  # % di riferimenti normativi coperti
    date_accuracy: float       # % di date correttamente estratte
    passed: bool
    warnings: list = field(default_factory=list)

class LegalSummaryValidator:
    """
    Validatore multi-dimensionale per riassunti legali.
    Combina metriche automatiche con check rule-based.
    """

    def __init__(self):
        self.rouge = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True)
        self.bert_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-mpnet-base-v2')
        self.date_pattern = re.compile(
            r'\b(\d{1,2}[\/\-\.]\d{1,2}[\/\-\.]\d{2,4}|\d{4}[\/\-\.]\d{1,2}[\/\-\.]\d{1,2})\b'
        )
        self.article_pattern = re.compile(r'\bArt\.\s*\d+|Articolo\s+\d+', re.IGNORECASE)

    def validate(self, original_text: str, summary: str) -> ValidationResult:
        """Esegue validazione completa del riassunto."""
        warnings = []

        # 1. ROUGE-L: misura sovrapposizione sequenze
        rouge_scores = self.rouge.score(original_text, summary)
        rouge_l = rouge_scores['rougeL'].fmeasure

        # 2. BERTScore semantico: embedding similarity
        orig_embed = self.bert_model.encode(original_text[:5000], convert_to_tensor=True)
        summ_embed = self.bert_model.encode(summary, convert_to_tensor=True)
        bert_score = float(util.cos_sim(orig_embed, summ_embed))

        # 3. Verifica copertura date critiche
        dates_in_original = set(self.date_pattern.findall(original_text))
        dates_in_summary = set(self.date_pattern.findall(summary))
        if dates_in_original:
            date_accuracy = len(dates_in_original & dates_in_summary) / len(dates_in_original)
        else:
            date_accuracy = 1.0

        if date_accuracy < 0.8:
            warnings.append(f"Date mancanti nel riassunto: {dates_in_original - dates_in_summary}")

        # 4. Verifica riferimenti normativi
        articles_original = set(self.article_pattern.findall(original_text))
        articles_summary = set(self.article_pattern.findall(summary))
        citation_coverage = (
            len(articles_original & articles_summary) / len(articles_original)
            if articles_original else 1.0
        )

        # 5. Check lunghezza (riassunto non deve essere più lungo dell'originale)
        compression_ratio = len(summary) / len(original_text)
        if compression_ratio > 0.5:
            warnings.append(f"Compression ratio basso: {compression_ratio:.1%} (atteso <50%)")

        # Soglie di qualità minima
        passed = (
            rouge_l >= 0.15 and
            bert_score >= 0.75 and
            date_accuracy >= 0.8 and
            citation_coverage >= 0.6
        )

        return ValidationResult(
            rouge_l=rouge_l,
            bert_score=bert_score,
            citation_coverage=citation_coverage,
            date_accuracy=date_accuracy,
            passed=passed,
            warnings=warnings
        )

Human-in-the-Loop를 통해 파이프라인 생산 준비 완료

전문적인 LegalTech 맥락에서 AI는 법적 판단을 대체하지 않습니다. 증가하다. 프로덕션 파이프라인에는 사람의 검토 메커니즘이 포함되어야 합니다. 자동 검증이 최소 임계값을 초과하지 않는 경우 또는 문서의 경우 가치 임계값을 초과하는 계약과 같이 매우 중요합니다.

from enum import Enum
from dataclasses import dataclass
from datetime import datetime
import uuid

class ReviewStatus(Enum):
    AUTO_APPROVED = "auto_approved"
    PENDING_REVIEW = "pending_review"
    HUMAN_APPROVED = "human_approved"
    REJECTED = "rejected"

@dataclass
class SummarizationJob:
    """Rappresenta un job di summarization con il suo stato."""
    job_id: str
    document_id: str
    document_value_eur: float  # valore contrattuale per routing
    summary: str
    validation: ValidationResult
    status: ReviewStatus
    created_at: datetime
    reviewed_by: str = None
    review_notes: str = None

class SummarizationOrchestrator:
    """
    Orchestratore della pipeline di summarization con human-in-the-loop.
    Applica routing automatico basato su validazione e valore del documento.
    """

    # Soglia valore contrattuale per revisione obbligatoria (EUR)
    HIGH_VALUE_THRESHOLD = 1_000_000

    def __init__(self, chunker, summarizer, validator):
        self.chunker = chunker
        self.summarizer = summarizer
        self.validator = validator

    async def process_document(
        self,
        document_text: str,
        document_id: str,
        document_value_eur: float = 0,
        doc_metadata: dict = None
    ) -> SummarizationJob:
        """
        Processa un documento e determina il routing appropriato.
        """
        # Step 1: Chunking
        chunks = self.chunker.chunk_document(
            document_text,
            doc_metadata or {'doc_id': document_id}
        )

        # Step 2: Summarization
        result = await self.summarizer.summarize_document(chunks)
        summary = result['executive_summary']

        # Step 3: Validazione automatica
        validation = self.validator.validate(document_text, summary)

        # Step 4: Routing decision
        requires_human_review = (
            not validation.passed or
            document_value_eur >= self.HIGH_VALUE_THRESHOLD or
            len(validation.warnings) > 2
        )

        status = (
            ReviewStatus.PENDING_REVIEW if requires_human_review
            else ReviewStatus.AUTO_APPROVED
        )

        job = SummarizationJob(
            job_id=str(uuid.uuid4()),
            document_id=document_id,
            document_value_eur=document_value_eur,
            summary=summary,
            validation=validation,
            status=status,
            created_at=datetime.utcnow()
        )

        # Notifica team legale se richiesta revisione
        if requires_human_review:
            await self._notify_review_team(job)

        return job

    async def _notify_review_team(self, job: SummarizationJob):
        """Invia notifica al team legale per revisione manuale."""
        # Integrazione con sistema di ticketing (es. Jira, ServiceNow)
        message = (
            f"Revisione richiesta per documento {job.document_id}\n"
            f"Job ID: {job.job_id}\n"
            f"Validazione: {'FALLITA' if not job.validation.passed else 'PASSATA con warning'}\n"
            f"Warning: {'; '.join(job.validation.warnings)}\n"
            f"Valore contratto: EUR {job.document_value_eur:,.0f}"
        )
        # await notification_service.send(team="legal_review", message=message)
        print(f"[REVIEW REQUIRED] {message}")

모델 비교: 법적 벤치마크 성능

모든 모델이 법적 도메인에 대해 동일하게 생성되는 것은 아닙니다. 다음 표에 요약되어 있습니다. 이탈리아어와 영어로 된 계약 문서에 대한 특정 벤치마크의 성능 (500개 계약의 내부 데이터 세트, 선임 변호사의 수동 평가)

모델	루즈-L	BERT점수	정확도 날짜	비용/100만 토큰	평균 대기 시간
GPT-4o	0.38	0.91	94%	$5 / $15	12초
클로드 3.5 소네트	0.36	0.90	93%	$3 / $15	10초
미스트랄-7B(LoRA 피트)	0.31	0.85	87%	자체 호스팅	8s
라마-3-70B	0.34	0.88	91%	자체 호스팅	18초
GPT-3.5 터보	0.25	0.80	78%	$0.5 / $1.5	5s

생산협의회

대부분의 LegalTech 사용 사례에서 하이브리드 및 최적의 접근 방식은 다음과 같습니다. 품질이 중요한 고가치 문서에는 GPT-4o(또는 Claude 3.5)를 사용합니다. 표준 문서 볼륨을 위한 자체 호스팅 미세 조정 모델이 있습니다. 허용 가능한 품질을 유지하면서 비용을 80% 이상 절감할 수 있습니다.

생산 모범 사례

법적 용어를 보존합니다. 명시적으로 프롬프트를 사용하세요. "기본값", "에스크로", "조항"과 같은 기술 용어를 유지하도록 요청합니다. 의역하지 않고 결의안을 표현하십시오.
출력 구조화: JSON 스키마 또는 구조화된 출력을 사용합니다. 모델이 미리 정의된 섹션(부품, 객체, 의무, 마감일, 처벌).
프롬프트 버전 관리: 프롬프트의 버전을 추적하세요. 감사 및 재현성에 중요한 각 요약을 생성했습니다.
원래 입력 로깅: 항상 원본 텍스트를 다음 위치에 저장하세요. 후속 검증을 허용하는 불변 방식(SHA-256 해시)입니다.
감소 단계에서 컨텍스트를 제한합니다. 요약을 합하면 부분이 50,000개 토큰을 초과하면 대신 MapReduce의 두 번째 레이어를 적용하세요. 단일 감소.

결론 및 다음 단계

LLM을 사용한 법률 문서 요약은 가장 성숙한 응용 프로그램 중 하나이며 법률 분야에서 Generative AI가 즉시 유용합니다. 올바른 전략으로 청킹, 신속한 엔지니어링, 검증을 통해 안정적인 시스템 구축이 가능합니다. 문서 검토 시간을 크게 단축하는 동시에 가장 중요한 문서에 대한 인간의 통제.

매일 실천해야 할 핵심 사항:

임의의 크기가 아닌 문서 구조를 기반으로 청킹 전략을 선택하세요.
볼륨을 위한 MapReduce, 정확성을 위한 계층적, 매우 중요한 짧은 문서를 위한 구체화
ROUGE + BERTScore + 규칙 기반 확인(날짜, 규제 참조)으로 항상 유효합니다.
가치가 높거나 신뢰도가 낮은 문서에 대해 인간 개입(Human-In-The-Loop) 구현
대량의 비용을 절감하려면 미세 조정을 고려하세요.

시리즈의 다음 기사에서는 법학 검색 엔진 벡터 임베딩 사용: 찾는 의미 검색 시스템을 구축하는 방법 쿼리가 문장의 텍스트와 다르게 구성되어 있어도 관련 문장이 있습니다.

LegalTech 및 AI 시리즈

계약 분석을 위한 NLP: OCR에서 이해까지
e-Discovery 플랫폼 아키텍처
동적 규칙 엔진을 통한 규정 준수 자동화
법적 계약을 위한 스마트 계약: Solidity 및 Vyper
Generative AI를 사용한 법률 문서 요약(이 기사)
검색 엔진 법칙: 벡터 임베딩
Scala의 디지털 서명 및 문서 인증
데이터 개인정보 보호 및 GDPR 규정 준수 시스템
법률 AI 보조원 구축(Legal Copilot)
LegalTech 데이터 통합 패턴