こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

LLM を使用した個別の家庭教師: 知識の基礎を築くための RAG

24時間対応、レベルに応じて対応できる、生徒一人ひとりの夢の家庭教師そしてみんなの学習スタイルは、もはやSFではありません。ザ 大規模言語モデル (LLM) テクニックと組み合わせて 検索拡張生成 (RAG) 彼らはそれを可能にしている一般的なチャットボットや静的な FAQ の制限を克服する、パーソナライズされた AI 講師を構築します。

教育の文脈における LLM の中心的な問題は、 知識の基礎付け：モデル GPT-4o や Llama 3 のように、彼は幅広い一般知識を持っていますが、特定のプログラムについては知りませんボローニャ大学の数理解析コースの内容、教授の講義ノート、質問前年の試験や 1 年生の典型的な誤解。接地せずに、 AI 家庭教師は、もっともらしくても教育的に間違っているか、文脈から逸脱した答えを与える危険があります。

シリーズのこの記事では エドテックエンジニアリング 完全なAI家庭教師を構築します LLM と RAG を使用: 教育文書のインデックス作成パイプラインから教育上のガードレールまでこれにより、モデルは適応フィードバックに至るまで、演習に対する解決策を直接提供できなくなります。学生プロフィールに基づいて。すべて Python と TypeScript の具体的な例が含まれています。

この記事で学べること

LLM と RAG を使用した AI 家庭教師のエンドツーエンドアーキテクチャ
教育コンテンツのインデックス作成パイプライン (PDF、ビデオトランスクリプト、クイズ)
知識の基礎: LLM をコース教材に限定する方法
直接的な反応ではなく、批判的思考を促進するための教育的ガードレール
生徒のプロフィールと適応的なフィードバックのカスタマイズ
マルチセッションの会話メモリ管理
RAG メトリクスによる応答の品質の評価 (忠実性、関連性)
FastAPI とセマンティックキャッシュによるスケーラブルな導入

1. 教育家庭教師に RAG を選ぶ理由

ドメイン固有の知識にアクセスできない純粋な LLM は、3 つの重大な問題に悩まされます。教育の文脈では: 幻覚 (でっちあげだがもっともらしい情報)、 古い知識 (研修日の知識企業) e カリキュラムの文脈の欠如 （生徒がすでに何を勉強したかはわかりませんが、彼はどの本を使っているのか、プログラムのどの部分が取り上げられているのか）。

2024 年から 2025 年の学術研究では、教育に適用された RAG システムにより、純粋な LLM と比較して幻覚が 80% 軽減され、学生の満足度が向上します。コース教材に固定された回答のおかげで、40% 増加しました。 LPITutor システム (2025) 優れた RAG パイプラインを備えた 70 ～ 170 億パラメータのオープンソースモデルを実証しました GPT-4o と同等のパフォーマンスを実現し、オンプレミスでの導入が可能になります予算が限られている教育機関であっても。

重要なコンセプトは、 知識の基礎付け: LLM の答えをアンカーします検証済みのコンテキスト固有の文書 (配布資料、教科書、解決された演習)。生徒が「sin(x) の導関数はどのように計算しますか?」と尋ねても、講師はアクセスしません。彼の一般的な知識に基づいていますが、コースで使用された正確な定義を表記法で復元します。教授の言葉と採用された本の例。

高レベルのアーキテクチャ

成分	テクノロジー	関数
ドキュメントの取り込み	LangChain、PyMuPDF	PDF、スライド、トランスクリプトの解析
埋め込みモデル	テキスト埋め込み-3-小、BGE-M3	テキストチャンクのベクトル化
ベクターストア	pgvector、Qdrant、クロマ	セマンティックな保存と取得
LLM	GPT-4o、ラマ 3.1、ミストラル	教育的反応の生成
メモリ	Redis、PostgreSQL	会話セッション
ガードレール層	カスタムプロンプト、NeMo ガードレール	教育的コントロール
学生プロフィール	PostgreSQL、Redis キャッシュ	レベル、履歴、好み
APIレイヤー	FastAPI、WebSocket	ストリーミングインターフェース

2. 教育文書のインデックス作成パイプライン

最初のステップは、講師の知識ベースを構築することです。教材には特徴がある特定の文書と一般的な文書: 数式、ソースコード、回路図、表そして正確な専門用語。チャンク化戦略では、意味上の一貫性を維持する必要があります。

# pipeline/document_ingestion.py
import hashlib
from pathlib import Path
from typing import List, Dict, Any
from dataclasses import dataclass, field

from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import PyMuPDFLoader, DirectoryLoader
from langchain.schema import Document


@dataclass
class ChunkConfig:
    chunk_size: int = 512
    chunk_overlap: int = 64
    separators: List[str] = field(default_factory=lambda: [
        "\n## ", "\n### ", "\n\n", "\n", ". ", " "
    ])


@dataclass
class CourseMetadata:
    course_id: str
    tenant_id: str
    document_type: str  # 'lecture', 'textbook', 'exercise', 'exam'
    topic: str
    difficulty_level: int  # 1-5


class CourseDocumentPipeline:
    def __init__(
        self,
        vector_store,
        embedding_model,
        config: ChunkConfig = None
    ):
        self.vector_store = vector_store
        self.embedding_model = embedding_model
        self.config = config or ChunkConfig()
        self.splitter = RecursiveCharacterTextSplitter(
            chunk_size=self.config.chunk_size,
            chunk_overlap=self.config.chunk_overlap,
            separators=self.config.separators,
        )

    def ingest_pdf(
        self,
        file_path: str,
        metadata: CourseMetadata
    ) -> int:
        """Carica un PDF, lo divide in chunk e indicizza."""
        loader = PyMuPDFLoader(file_path)
        raw_docs = loader.load()

        # Arricchisci i metadati di ogni documento
        enriched_docs = [
            Document(
                page_content=doc.page_content,
                metadata={
                    **doc.metadata,
                    "course_id": metadata.course_id,
                    "tenant_id": metadata.tenant_id,
                    "document_type": metadata.document_type,
                    "topic": metadata.topic,
                    "difficulty_level": metadata.difficulty_level,
                    "source_hash": self._hash_content(doc.page_content),
                }
            )
            for doc in raw_docs
        ]

        # Split in chunk semantici
        chunks = self.splitter.split_documents(enriched_docs)

        # De-duplicazione basata su hash del contenuto
        unique_chunks = self._deduplicate(chunks)

        # Batch insertion nel vector store
        self.vector_store.add_documents(unique_chunks, batch_size=100)

        return len(unique_chunks)

    def ingest_video_transcript(
        self,
        transcript: str,
        timestamps: List[Dict],
        metadata: CourseMetadata
    ) -> int:
        """Indicizza trascrizioni di video lezioni con timestamp."""
        # Dividi per blocchi temporali (ogni 2 minuti di lezione)
        chunks = self._split_transcript_by_time(transcript, timestamps, window_seconds=120)

        docs = [
            Document(
                page_content=chunk["text"],
                metadata={
                    "course_id": metadata.course_id,
                    "tenant_id": metadata.tenant_id,
                    "document_type": "video_transcript",
                    "topic": metadata.topic,
                    "start_time": chunk["start"],
                    "end_time": chunk["end"],
                    "video_url": chunk.get("video_url", ""),
                }
            )
            for chunk in chunks
        ]

        self.vector_store.add_documents(docs)
        return len(docs)

    def _hash_content(self, content: str) -> str:
        return hashlib.sha256(content.encode()).hexdigest()[:16]

    def _deduplicate(self, chunks: List[Document]) -> List[Document]:
        seen = set()
        unique = []
        for chunk in chunks:
            h = self._hash_content(chunk.page_content)
            if h not in seen:
                seen.add(h)
                unique.append(chunk)
        return unique

    def _split_transcript_by_time(
        self,
        transcript: str,
        timestamps: List[Dict],
        window_seconds: int
    ) -> List[Dict]:
        """Raggruppa le parole della trascrizione in finestre temporali."""
        chunks = []
        current_chunk_words = []
        current_start = timestamps[0]["start"] if timestamps else 0
        words = transcript.split()

        for i, (word, ts) in enumerate(zip(words, timestamps)):
            current_chunk_words.append(word)
            if ts["start"] - current_start >= window_seconds:
                chunks.append({
                    "text": " ".join(current_chunk_words),
                    "start": current_start,
                    "end": ts["start"],
                })
                current_chunk_words = []
                current_start = ts["start"]

        if current_chunk_words:
            chunks.append({
                "text": " ".join(current_chunk_words),
                "start": current_start,
                "end": timestamps[-1]["end"] if timestamps else 0,
            })

        return chunks

3. 検索と知識の基礎付け

取得は RAG システムの中心です。質問に最も類似したチャンクを取得するだけでは十分ではありません。教育の文脈では、次のことも考慮する必要があります。 難易度 学生の、 現在の話題 プログラムと 書類の種類 (例: 生徒が勉強するときは、解決済みの演習を好む練習するようお願いします）。

# rag/retriever.py
from typing import List, Optional
from dataclasses import dataclass
from enum import Enum


class QueryIntent(Enum):
    CONCEPT_EXPLANATION = "concept"
    EXERCISE_HELP = "exercise"
    EXAM_PREPARATION = "exam"
    DEFINITION = "definition"
    COMPARISON = "comparison"


@dataclass
class StudentProfile:
    student_id: str
    course_id: str
    difficulty_level: int  # 1-5 (adattivo)
    current_topic: str
    mastered_topics: List[str]
    weak_areas: List[str]
    preferred_style: str  # 'visual', 'text', 'example-first'


@dataclass
class RetrievalContext:
    query: str
    student: StudentProfile
    intent: QueryIntent
    top_k: int = 5


class AdaptiveRetriever:
    def __init__(self, vector_store, intent_classifier):
        self.vector_store = vector_store
        self.intent_classifier = intent_classifier

    def retrieve(self, context: RetrievalContext) -> List[dict]:
        """
        Retrieval adattivo che considera il profilo studente.
        """
        intent = context.intent or self.intent_classifier.classify(context.query)

        # Costruisci filtri metadata basati sul profilo
        metadata_filter = self._build_filter(context.student, intent)

        # Hybrid search: semantico + keyword per termini tecnici
        semantic_results = self.vector_store.similarity_search_with_score(
            query=context.query,
            k=context.top_k * 2,
            filter=metadata_filter,
        )

        # Re-ranking: penalizza documenti troppo avanzati o già masterizzati
        reranked = self._rerank(
            results=semantic_results,
            student=context.student,
            intent=intent,
        )

        return reranked[:context.top_k]

    def _build_filter(
        self,
        student: StudentProfile,
        intent: QueryIntent
    ) -> dict:
        base_filter = {
            "course_id": student.course_id,
            "difficulty_level": {"$lte": student.difficulty_level + 1},
        }

        if intent == QueryIntent.EXERCISE_HELP:
            base_filter["document_type"] = {"$in": ["exercise", "exam"]}
        elif intent == QueryIntent.CONCEPT_EXPLANATION:
            base_filter["document_type"] = {"$in": ["lecture", "textbook"]}
        elif intent == QueryIntent.EXAM_PREPARATION:
            base_filter["document_type"] = {"$in": ["exam", "exercise", "summary"]}

        return base_filter

    def _rerank(
        self,
        results: List[tuple],
        student: StudentProfile,
        intent: QueryIntent,
    ) -> List[dict]:
        scored = []
        for doc, semantic_score in results:
            score = semantic_score

            # Boost se il documento e sul topic corrente
            if doc.metadata.get("topic") == student.current_topic:
                score *= 1.3

            # Penalizza se il topic e già masterizzato (mostra contenuti avanzati)
            if doc.metadata.get("topic") in student.mastered_topics:
                score *= 0.7

            # Boost per aree deboli dello studente
            if doc.metadata.get("topic") in student.weak_areas:
                score *= 1.5

            scored.append({"document": doc, "score": score})

        return sorted(scored, key=lambda x: x["score"], reverse=True)

4. 教育的ガードレール: 家庭教師は答えを与えない

ガードレールのない AI 家庭教師の最大のリスクは、模倣のツールになることです演習。優れた教育的な家庭教師は、直接的な答えを与えるのではなく、生徒を導きます。ソクラテスの質問、段階的な提案（足場）を通じて解決に向けて概念的なエラーについてのフィードバック。

私たちは 3 層のガードレールシステムを実装しています。 意図の分類 (答えを求めていますか、それとも概念的な疑問がありますか?)、 教育政策 (どれくらいの足場を適用するか?) e 迅速なエンジニアリング (定式化する方法アクティブラーニングの促進に対するLLMの対応）。

# guardrails/pedagogical_guardrail.py
from enum import Enum
from typing import Optional
from pydantic import BaseModel


class ScaffoldingLevel(Enum):
    HINT = "hint"           # Solo un indizio
    GUIDED = "guided"       # Domande socratiche
    STEP_BY_STEP = "steps"  # Breakdown del processo
    EXAMPLE = "example"     # Esempio analogo (non la soluzione)
    SOLUTION = "solution"   # Soluzione completa (solo per esercizi risolti)


class PedagogicalPolicy(BaseModel):
    allow_direct_answer: bool = False
    max_scaffolding_level: ScaffoldingLevel = ScaffoldingLevel.GUIDED
    promote_reflection: bool = True
    suggest_resources: bool = True
    track_misconceptions: bool = True


SYSTEM_PROMPT_TEMPLATE = """Sei un tutor educativo AI specializzato nel corso "{course_name}".

PROFILO STUDENTE:
- Livello: {difficulty_level}/5
- Topic corrente: {current_topic}
- Aree di debolezza: {weak_areas}

CONTESTO DEL CORSO (recuperato dalla knowledge base):
{retrieved_context}

REGOLE PEDAGOGICHE FONDAMENTALI:
1. NON fornire mai la risposta diretta a un esercizio non ancora risolto
2. Usa domande socratiche per guidare la riflessione ("Cosa succede se...?", "perchè pensi che...?")
3. Identifica le misconcezioni dello studente e correggile con gentilezza
4. Adatta il linguaggio al livello {difficulty_level}/5:
   - Livello 1-2: linguaggio semplice, molti esempi quotidiani
   - Livello 3: bilanciato tra intuizione e rigore
   - Livello 4-5: terminologia tecnica precisa, proofs formali
5. Suggerisci sempre il materiale specifico del corso dove approfondire
6. Se lo studente e bloccato dopo 3 tentativi, aumenta gradualmente il supporto
7. Celebra i progressi e normalizza gli errori come parte dell'apprendimento

RISPOSTA:"""


class PedagogicalGuardrail:
    def __init__(self, llm_client, policy: PedagogicalPolicy = None):
        self.llm = llm_client
        self.policy = policy or PedagogicalPolicy()

    async def generate_response(
        self,
        query: str,
        student: "StudentProfile",
        retrieved_docs: list,
        conversation_history: list,
        course_name: str,
    ) -> dict:
        # Classifica se la domanda chiede direttamente una soluzione
        is_homework_request = await self._detect_homework_request(query)

        # Scegli il livello di scaffolding appropriato
        scaffolding = self._choose_scaffolding(
            student=student,
            is_homework=is_homework_request,
            attempt_count=self._count_attempts(conversation_history, query),
        )

        # Costruisci il contesto RAG
        context = self._format_context(retrieved_docs)

        # Costruisci il prompt
        system_prompt = SYSTEM_PROMPT_TEMPLATE.format(
            course_name=course_name,
            difficulty_level=student.difficulty_level,
            current_topic=student.current_topic,
            weak_areas=", ".join(student.weak_areas),
            retrieved_context=context,
        )

        # Aggiungi istruzioni di scaffolding
        scaffolding_instruction = self._get_scaffolding_instruction(scaffolding)
        full_system = f"{system_prompt}\n\nMODALITA RISPOSTA: {scaffolding_instruction}"

        response = await self.llm.chat(
            system=full_system,
            messages=conversation_history + [{"role": "user", "content": query}],
            temperature=0.3,  # Bassa temperatura per risposte più accurate e coerenti
            max_tokens=1024,
        )

        return {
            "content": response.content,
            "scaffolding_used": scaffolding.value,
            "sources": [doc["document"].metadata for doc in retrieved_docs],
        }

    def _choose_scaffolding(
        self,
        student,
        is_homework: bool,
        attempt_count: int,
    ) -> ScaffoldingLevel:
        if not is_homework:
            return ScaffoldingLevel.GUIDED

        if attempt_count == 0:
            return ScaffoldingLevel.HINT
        elif attempt_count == 1:
            return ScaffoldingLevel.GUIDED
        elif attempt_count == 2:
            return ScaffoldingLevel.STEP_BY_STEP
        elif attempt_count >= 3:
            return ScaffoldingLevel.EXAMPLE
        else:
            return ScaffoldingLevel.SOLUTION if self.policy.allow_direct_answer else ScaffoldingLevel.EXAMPLE

    def _get_scaffolding_instruction(self, level: ScaffoldingLevel) -> str:
        instructions = {
            ScaffoldingLevel.HINT: "Fornisci solo un breve indizio (1-2 frasi) che metta lo studente sulla giusta strada. Non procedere oltre.",
            ScaffoldingLevel.GUIDED: "Usa domande socratiche. Non dare la risposta, ma guida lo studente con 2-3 domande che stimolino la riflessione.",
            ScaffoldingLevel.STEP_BY_STEP: "Scomponi il problema in passi. Descrivi i passi da seguire senza eseguirli tu. Chiedi allo studente di provare ogni passo.",
            ScaffoldingLevel.EXAMPLE: "Mostra un esempio ANALOGO ma non identico al problema. Spiega l'esempio, poi chiedi allo studente di applicare lo stesso ragionamento.",
            ScaffoldingLevel.SOLUTION: "Fornisci la soluzione completa con spiegazione dettagliata di ogni passaggio.",
        }
        return instructions.get(level, instructions[ScaffoldingLevel.GUIDED])

    async def _detect_homework_request(self, query: str) -> bool:
        """Classifica se la domanda chiede la risposta a un esercizio."""
        keywords = ["risolvi", "calcola", "trova", "dimostra", "soluzione", "risposta",
                    "solve", "calculate", "find", "answer", "result", "quanto fa"]
        query_lower = query.lower()
        return any(kw in query_lower for kw in keywords)

    def _count_attempts(self, history: list, current_query: str) -> int:
        """Conta quante volte lo studente ha chiesto aiuto sullo stesso tema."""
        similar_attempts = sum(
            1 for msg in history
            if msg["role"] == "user" and self._is_similar_query(msg["content"], current_query)
        )
        return similar_attempts

    def _is_similar_query(self, q1: str, q2: str) -> bool:
        words1 = set(q1.lower().split())
        words2 = set(q2.lower().split())
        overlap = len(words1 & words2) / max(len(words1 | words2), 1)
        return overlap > 0.5

    def _format_context(self, docs: list) -> str:
        sections = []
        for i, item in enumerate(docs, 1):
            doc = item["document"]
            source = doc.metadata.get("document_type", "documento")
            topic = doc.metadata.get("topic", "")
            sections.append(f"[Fonte {i} - {source} su '{topic}']\n{doc.page_content}")
        return "\n\n---\n\n".join(sections)

5. マルチセッションの会話記憶

効果的な指導者は、以前の会話を覚えています。生徒が困難を抱えていた場合先週のデリバティブについては、家庭教師は答えるときにこのことを念頭に置いておかなければなりません積分に関する質問に答えます。 2 レベルのメモリを実装します。 短期記憶 (現在の会話、Redis) e 長期記憶 (セッション履歴、LLM を使用した PostgreSQL の概要)。

# memory/session_manager.py
import json
from datetime import datetime, timedelta
from typing import List, Optional
import redis.asyncio as redis
from sqlalchemy.ext.asyncio import AsyncSession


class TutorMemoryManager:
    SHORT_TERM_TTL = 3600  # 1 ora per sessione attiva
    MAX_SHORT_TERM_MESSAGES = 20  # Finestra conversazione

    def __init__(self, redis_client: redis.Redis, db_session: AsyncSession, llm_client):
        self.redis = redis_client
        self.db = db_session
        self.llm = llm_client

    async def get_conversation_history(
        self,
        student_id: str,
        session_id: str
    ) -> List[dict]:
        """Recupera storia conversazione dalla cache Redis."""
        key = f"tutor:session:{student_id}:{session_id}"
        raw = await self.redis.get(key)
        if raw:
            return json.loads(raw)

        # Se non in cache, prova a recuperare dall'ultimo riassunto
        summary = await self._get_session_summary(student_id)
        if summary:
            return [{"role": "system", "content": f"Riassunto sessioni precedenti: {summary}"}]
        return []

    async def save_message(
        self,
        student_id: str,
        session_id: str,
        role: str,
        content: str,
    ) -> None:
        key = f"tutor:session:{student_id}:{session_id}"
        history = await self.get_conversation_history(student_id, session_id)

        # Rimuovi il messaggio di sistema con il riassunto se presente
        history = [m for m in history if m.get("role") != "system"]
        history.append({"role": role, "content": content, "timestamp": datetime.utcnow().isoformat()})

        # Mantieni solo gli ultimi N messaggi (finestra scorrevole)
        if len(history) > self.MAX_SHORT_TERM_MESSAGES:
            await self._archive_old_messages(student_id, history[:-self.MAX_SHORT_TERM_MESSAGES])
            history = history[-self.MAX_SHORT_TERM_MESSAGES:]

        await self.redis.setex(key, self.SHORT_TERM_TTL, json.dumps(history))

    async def end_session(self, student_id: str, session_id: str) -> None:
        """Chiudi sessione: genera riassunto e aggiorna profilo studente."""
        history = await self.get_conversation_history(student_id, session_id)
        if len(history) < 3:
            return  # Sessione troppo breve per riassumere

        summary = await self._generate_session_summary(history)
        misconceptions = await self._extract_misconceptions(history)

        # Salva in PostgreSQL
        await self.db.execute(
            """INSERT INTO tutor_sessions
               (student_id, session_id, summary, misconceptions, created_at)
               VALUES (:sid, :sess, :summary, :misc, :ts)""",
            {
                "sid": student_id,
                "sess": session_id,
                "summary": summary,
                "misc": json.dumps(misconceptions),
                "ts": datetime.utcnow(),
            },
        )
        await self.db.commit()

        # Aggiorna il profilo studente con le nuove misconcezioni
        if misconceptions:
            await self._update_student_weak_areas(student_id, misconceptions)

        # Elimina dalla cache
        key = f"tutor:session:{student_id}:{session_id}"
        await self.redis.delete(key)

    async def _generate_session_summary(self, history: List[dict]) -> str:
        messages_text = "\n".join(
            f"{m['role'].upper()}: {m['content']}"
            for m in history if m.get("role") in ("user", "assistant")
        )
        prompt = f"""Riassumi in 3-4 frasi questa sessione di tutoring educativo.
Includi: argomenti discussi, difficolta incontrate, progressi dello studente.

Sessione:
{messages_text}

Riassunto conciso:"""

        response = await self.llm.complete(prompt, max_tokens=200)
        return response.text

    async def _extract_misconceptions(self, history: List[dict]) -> List[str]:
        """Estrai le misconcezioni rilevate durante la sessione."""
        # Implementazione semplificata basata su keyword
        misconceptions = []
        for msg in history:
            if msg.get("role") == "assistant" and "misconcezione" in msg.get("content", "").lower():
                misconceptions.append(msg["content"][:100])
        return misconceptions

    async def _get_session_summary(self, student_id: str) -> Optional[str]:
        result = await self.db.execute(
            """SELECT summary FROM tutor_sessions
               WHERE student_id = :sid
               ORDER BY created_at DESC LIMIT 3""",
            {"sid": student_id},
        )
        rows = result.fetchall()
        if rows:
            return " | ".join(row[0] for row in rows)
        return None

    async def _update_student_weak_areas(self, student_id: str, misconceptions: List[str]) -> None:
        await self.db.execute(
            """UPDATE student_profiles
               SET weak_areas = weak_areas || :misc::jsonb
               WHERE student_id = :sid""",
            {"sid": student_id, "misc": json.dumps(misconceptions)},
        )
        await self.db.commit()

6. FastAPI による API ストリーミング

AI 家庭教師のユーザーエクスペリエンスは大幅に向上します ストリーミング 回答の割合: 生徒は、あたかも家庭教師であるかのように、テキストが徐々に表示されるのを確認します。リアルタイムで書いていました。 Server-Sent Events (SSE) を使用して FastAPI エンドポイントを実装します。

# api/tutor_endpoint.py
from fastapi import FastAPI, Depends, HTTPException
from fastapi.responses import StreamingResponse
from pydantic import BaseModel
from typing import AsyncGenerator
import json
import uuid

app = FastAPI(title="EdTech AI Tutor API")


class TutorRequest(BaseModel):
    student_id: str
    query: str
    session_id: str = None
    course_id: str


@app.post("/api/tutor/stream")
async def tutor_stream(
    request: TutorRequest,
    retriever: AdaptiveRetriever = Depends(get_retriever),
    guardrail: PedagogicalGuardrail = Depends(get_guardrail),
    memory: TutorMemoryManager = Depends(get_memory),
):
    session_id = request.session_id or str(uuid.uuid4())

    async def generate() -> AsyncGenerator[str, None]:
        try:
            # 1. Carica profilo studente
            student = await get_student_profile(request.student_id, request.course_id)

            # 2. Recupera storico conversazione
            history = await memory.get_conversation_history(request.student_id, session_id)

            # 3. Salva il messaggio utente
            await memory.save_message(request.student_id, session_id, "user", request.query)

            # 4. Retrieval adattivo
            context = RetrievalContext(
                query=request.query,
                student=student,
                intent=None,  # classificato automaticamente
            )
            docs = retriever.retrieve(context)

            # 5. Genera risposta con guardrail pedagogici (streaming)
            full_response = ""
            async for chunk in guardrail.generate_response_stream(
                query=request.query,
                student=student,
                retrieved_docs=docs,
                conversation_history=history,
                course_name=await get_course_name(request.course_id),
            ):
                full_response += chunk
                yield f"data: {json.dumps({'chunk': chunk, 'session_id': session_id})}\n\n"

            # 6. Salva risposta in memoria
            await memory.save_message(request.student_id, session_id, "assistant", full_response)

            # 7. Invia metadata finali
            yield f"data: {json.dumps({'done': True, 'session_id': session_id})}\n\n"

        except Exception as e:
            yield f"data: {json.dumps({'error': str(e)})}\n\n"

    return StreamingResponse(
        generate(),
        media_type="text/event-stream",
        headers={
            "Cache-Control": "no-cache",
            "X-Accel-Buffering": "no",
        },
    )

7. RAG品質評価

本番環境の AI 家庭教師は継続的に監視する必要があります。フレームワークを使用します ラガス (RAG 評価) 4 つの側面を評価します。忠実 (答えは回収された文書に忠実ですか?)、 答え。関連性 (答えは質問に関連していますか?)、 コンテキストの精度 (回収された文書は関連性がありますか?) e コンテキストの想起 （必要な書類はすべて回収しましたか？）

# evaluation/rag_evaluator.py
from ragas import evaluate
from ragas.metrics import (
    faithfulness,
    answer_relevancy,
    context_precision,
    context_recall,
)
from datasets import Dataset
from typing import List, Dict
import pandas as pd


class TutorRAGEvaluator:
    def __init__(self, llm_client, embedding_model):
        self.llm = llm_client
        self.embeddings = embedding_model
        self.metrics = [
            faithfulness,
            answer_relevancy,
            context_precision,
            context_recall,
        ]

    def evaluate_batch(
        self,
        test_cases: List[Dict],
        ground_truths: List[str],
    ) -> pd.DataFrame:
        """
        Valuta un batch di interazioni tutor.
        test_cases: list di {question, answer, contexts}
        ground_truths: risposte attese (da esperti didattici)
        """
        dataset = Dataset.from_dict({
            "question": [tc["question"] for tc in test_cases],
            "answer": [tc["answer"] for tc in test_cases],
            "contexts": [tc["contexts"] for tc in test_cases],
            "ground_truth": ground_truths,
        })

        results = evaluate(
            dataset=dataset,
            metrics=self.metrics,
            llm=self.llm,
            embeddings=self.embeddings,
        )

        return results.to_pandas()

    def evaluate_pedagogical_quality(self, responses: List[Dict]) -> Dict:
        """
        Valuta la qualità pedagogica delle risposte:
        - Tasso di risposte dirette (dovrebbero essere basse per esercizi)
        - Uso di domande socratiche
        - Presenza di suggerimenti di risorse
        """
        direct_answer_count = 0
        socratic_question_count = 0
        resource_suggestion_count = 0

        for resp in responses:
            content = resp.get("content", "").lower()
            if resp.get("scaffolding_used") == "solution":
                direct_answer_count += 1
            if "?" in content:
                socratic_question_count += 1
            if any(kw in content for kw in ["vedi capitolo", "consulta", "approfondisci", "leggi"]):
                resource_suggestion_count += 1

        total = len(responses)
        return {
            "direct_answer_rate": direct_answer_count / total if total else 0,
            "socratic_rate": socratic_question_count / total if total else 0,
            "resource_suggestion_rate": resource_suggestion_count / total if total else 0,
            "total_evaluated": total,
        }

避けるべきアンチパターン

テナントフィルターを使用しない RAG: 異なるコースまたは機関間で文書を共有しないでください。常に tenant_id と course_id でフィルターします。
チャンクが大きすぎます: 2000 以上のトークンの塊は関連性を薄めます。 10 ～ 15% の重複がある 512 ～ 768 トークンを使用します。
高温： 温度が 0.5 度を超えると幻覚が増加します。教育家庭教師の場合は、0.2 ～ 0.4 を使用します。
ガードレールなし: 教育的なガードレールのない LLM は、宿題をコピーするためのシステムになります。ガードレールは必須であり、オプションではありません。
無限の記憶: すべての会話履歴を読み込むとコンテキストウィンドウを超えてしまい、コストが増加します。スライディングウィンドウとサマリーを使用します。
評価なし: RAGAS または同様の指標がなければ、講師が実際に優れたパフォーマンスを発揮しているかどうかはわかりません。

結論と次のステップ

私たちは、LLM と RAG に基づいた AI 家庭教師の完全なアーキテクチャを構築しました。教材のインデックス作成パイプラインから適応型検索まで学生のプロフィールを考慮し、彼らが推進する教育的ガードレールを考慮するアクティブラーニング、最大マルチセッションメモリ、品質モニタリング。

その結果、質問に答えるだけでなく、 ガイド 生徒は学習プロセスを通じて自分のレベルに適応し、誤解を特定し、批判的な反省を促すこと、すべて一般的な LLM 知識ではなく、特定のコース教材に基づいています。

シリーズの次の記事では、 ゲーミフィケーションエンジン ステートマシンとエンゲージメントメカニズムを使用これにより、学生のモチベーションとプラットフォームへの粘り強さが向上します。

EdTechエンジニアリングシリーズ

スケーラブルな LMS アーキテクチャ: マルチテナントパターン
適応学習アルゴリズム: 理論から本番まで
教育向けビデオストリーミング: WebRTC vs HLS vs DASH
AI 監督システム: コンピュータービジョンによるプライバシー最優先
LLM を使用したパーソナライズされた家庭教師: 知識の基礎を築くための RAG (この記事)
ゲーミフィケーションエンジン: アーキテクチャとステートマシン
ラーニングアナリティクス: xAPI と Kafka を使用したデータパイプライン
EdTech におけるリアルタイムコラボレーション: CRDT と WebSocket
モバイルファーストの EdTech: オフラインファーストのアーキテクチャ
マルチテナントコンテンツ管理: バージョン管理と SCORM