こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

はじめに: パターン知識の再利用

Il 高度な転移学習 事前トレーニングされたモデルを活用するための鍵計算リソースを使用して最初からトレーニングする必要がなく、巨大なデータセット上でのトレーニングが可能になります。のようなモデル バート e GPT 何百ものトレーニングを受けてきました数十億のトークンを使用して、言語を深く理解することができます。 転送された データが少なくリソースが限られている特定のタスクに集中します。

この記事では、最新の微調整戦略、プロンプトエンジニアリング、検索拡張生成 (RAG) と Hugging Face エコシステムの比較。 Llama、Mistral、Falcon などのオープンソースモデル。

何を学ぶか

BERT: 理解タスクのための双方向の事前トレーニングと微調整
GPT: 自動回帰生成とコンテキスト内学習
微調整戦略: フル、LoRA、アダプター、QLoRA
プロンプトエンジニアリング: より良い成果を得るテクニック
RAG: LLM とリサーチを組み合わせて正確な答えを得る
オープンソースモデル: Llama、Mistral、Falcon - いつどれを使用するか
Hugging Face Hub: 事前トレーニングされたモデルのエコシステム

BERT: 双方向テキスト理解

バート (トランスフォーマーによる双方向エンコーダー表現) が革命を起こした双方向の事前トレーニングによって言語表現が生成されることを実証する NLP 異常に裕福。事前トレーニング中に、BERT は 2 つの目標を使用します。

マスクされた言語モデリング (MLM): トークンの 15% がマスクされており、モデルは双方向コンテキストからトークンを予測する必要があります。
次の文の予測 (NSP): モデルは、元のテキストで 2 つの文が連続しているかどうかを予測します

微調整するには、BERT 出力の上に分類レイヤーを追加するだけです。数千のラベル付きサンプルですべてをトレーニングします。


from transformers import BertTokenizer, BertForSequenceClassification
from transformers import Trainer, TrainingArguments
import torch

# Caricare BERT per classificazione di sentiment
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForSequenceClassification.from_pretrained(
    'bert-base-uncased',
    num_labels=2  # positivo/negativo
)

# Tokenizzare i dati
texts = ["This movie is great!", "Terrible waste of time."]
labels = [1, 0]  # 1=positivo, 0=negativo

inputs = tokenizer(texts, padding=True, truncation=True,
                   max_length=128, return_tensors="pt")
inputs['labels'] = torch.tensor(labels)

# Forward pass
outputs = model(**inputs)
print(f"Loss: {outputs.loss:.4f}")
print(f"Logits: {outputs.logits}")

# Fine-tuning con Trainer API
training_args = TrainingArguments(
    output_dir='./results',
    num_train_epochs=3,
    per_device_train_batch_size=16,
    learning_rate=2e-5,
    weight_decay=0.01,
    warmup_steps=100,
    evaluation_strategy="epoch"
)

効率的な微調整: LoRA と QLoRA

数十億のパラメータを使用してモデルを完全に微調整するには、膨大なリソースが必要です。 パラメータ効率の良い微調整 (PEFT) モデルを適応させることができますパラメータのほんの一部のみを変更します。

LoRA (低ランク適応)

LoRA モデルの元の重みを凍結し、低ランクの行列を追加します注意層と一緒にトレーニング可能。通常、変更されるパラメータは 1% 未満ですトータルでフルファインチューニングに匹敵するパフォーマンスを実現します。

QLoRA

QLoRA LoRA と 4 ビット量子化を組み合わせて微調整が可能 48 GB の VRAM を備えた単一の GPU 上で 65B のパラメーターモデルを実行できます。データ型を使用する NF4 (NormalFloat 4 ビット) と二重量子化により効率を最大化します。


from peft import LoraConfig, get_peft_model, TaskType
from transformers import AutoModelForCausalLM, AutoTokenizer

# Configurazione LoRA
lora_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,
    r=16,                    # Rango delle matrici LoRA
    lora_alpha=32,           # Scaling factor
    lora_dropout=0.1,
    target_modules=["q_proj", "v_proj", "k_proj", "o_proj"],
    bias="none"
)

# Applicare LoRA al modello
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-2-7b-hf")
peft_model = get_peft_model(model, lora_config)

# Contare parametri addestrabili
trainable = sum(p.numel() for p in peft_model.parameters() if p.requires_grad)
total = sum(p.numel() for p in peft_model.parameters())
print(f"Trainable: {trainable:,} / {total:,} "
      f"({100*trainable/total:.2f}%)")
# Output: ~0.5% dei parametri sono addestrabili

プロンプトエンジニアリング: LLM とのコミュニケーション術

Il 迅速なエンジニアリング そして、それを導く指示を策定する実践。重みを変更せずに、目的の出力に向かってモデル化します。主なテクニックには次のようなものがあります。 数回の学習 (プロンプトに例を示します)、 思考の連鎖 (モデルに段階的に考えるように依頼します)、 役割のプロンプト (モデルに特定の役割を割り当てます) e 構造化された出力 (リクエスト JSON などの特定の形式）。

RAG: 検索拡張生成

Il ラグ LLM の生成能力と検索システムを組み合わせます。特定の文書に基づいて正確な回答を提供します。ただ依存するのではなく、事前トレーニング中に保存された知識により、モデルは関連するコンテキストを受け取ります文書データベースから取得されます。

RAG プロセスは 3 つのフェーズに分かれています。

インデックス作成: ドキュメントはチャンクに分割され、ベクトル埋め込みに変換されます。
検索: クエリを指定すると、類似性検索によって最も類似したチャンクが取得されます。
世代: 取得されたチャンクは、LLM のコンテキストとしてプロンプトに挿入されます。


from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

# 1. Splitting dei documenti
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    separators=["\n\n", "\n", ". ", " "]
)
chunks = text_splitter.split_text(document_text)

# 2. Creazione degli embedding e vector store
embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2"
)
vector_store = FAISS.from_texts(chunks, embeddings)

# 3. Retrieval e generazione
query = "Come funziona il transfer learning?"
relevant_docs = vector_store.similarity_search(query, k=3)

# Costruire il prompt con contesto
context = "\n".join([doc.page_content for doc in relevant_docs])
prompt = f"""Basandoti sul seguente contesto, rispondi alla domanda.

Contesto:
{context}

Domanda: {query}

Risposta:"""

オープンソースモデル: Llama、Mistral、Falcon

オープンソースのテンプレートエコシステムが爆発的に拡大し、テンプレートに代わる競争力のある選択肢が提供されています所有者:

ラマ (メタ): 7B ～ 70B パラメータのモデルファミリで、微調整とオンプレミス展開に優れています。 Llama 3 は GPT-3.5 で競争力のあるパフォーマンスを実現
ミストラル: 革新的なアーキテクチャを備えた効率的なモデル (スライディングウィンドウの注意、専門家の混合)。 Mistral 7B は多くのベンチマークで Llama 2 13B を上回ります
ファルコン: 高品質のデータセット (RefinedWeb) でトレーニングされ、優れたゼロショットパフォーマンスを提供します

選択はユースケースによって異なります。汎用テキスト生成の場合は、Llama 3、そして多くの場合、より良い選択。限られたリソースで効率を高めるには、Mistral 7B が最適です。特定のタスクについては、これらのモデルのいずれかで LoRA を微調整すると、優れた結果が得られます。

ハグフェイス: 完全なエコシステム

ハグフェイス NLPディープラーニングのベンチマークとなっており、完全なエコシステムを提供します。

モデルハブ: 500,000 を超える事前トレーニング済みモデル、1 行のコードでダウンロード可能
トランスフォーマーライブラリ: 全モデルの統一 API (BERT、GPT、T5、Llama など)
データセット: トレーニングと評価用の数千のデータセット
APIトレーナー: 分散トレーニング、混合精度、勾配累積による最適化されたトレーニングループ
スペース: デモと ML アプリの無料ホスティング

シリーズの次のステップ

次の記事では、詳しく見ていきます TinyML とエッジ AI
深層学習モデルを組み込みデバイスやスマートフォンに導入する方法を見ていきます。
モデル圧縮のための量子化、枝刈り、知識の蒸留を分析します。