こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

はじめに: 情報の測定

La 情報理論1948 年にクロードシャノンによって設立され、私たちにツールを提供します。不確実性を定量化するには、メッセージに含まれる情報量を測定します。モデルがどれだけ現実に近似しているかを評価します。機械学習では、次の概念が登場します。どこでも： クロスエントロピー 分類用のデフォルトの損失関数、の KL ダイバージェンス VAE と知識の蒸留の中心です。

何を学ぶか

情報内容: -log(p) としての驚き
エントロピー: 分布の不確実性の尺度
クロスエントロピー: 分類に最もよく使用される損失
KL ダイバージェンス: 分布間の非対称距離
相互情報量: 変数間の依存関係
複雑性と言語モデルとの関係

情報内容: サプライズ

L'情報内容 確率のある出来事の（または自己情報） $p$ その出来事がどれほど「驚くべきこと」かを測定します。

I(x) = -\\log_2 P(x)

直感: 非常に可能性の高い出来事 ( $P\\約1$ ) 情報はほとんどありません（驚きは少ない）。珍しい出来事（ $P\\約0$ ) 多くの情報をもたらします（大きな驚き）。基数 2 の単位は、少し: 1ビットそして公平なコイントスの情報量。

エントロピー: 平均的な不確実性

L'エントロピ そして情報コンテンツの期待値、つまり 中程度の驚き 分布の:

H(X) = -\\sum_{x} P(x) \\log P(x) = \\mathbb{E}[-\\log P(X)]

継続的な展開の場合:

H(X) = -\\int f(x) \\log f(x) \\, dx

基本的な特性:

$H(X) \\geq 0$ 常に（不確実性は決して否定的ではありません）
$H(X) = 0$ 場合のみ $X$ 決定的 (単一のイベントの確率は 1)
$H(X)$ 一様分布の最大値（最大不確かさ）

Esempio: 公正なコインの場合 ( $P(T) = P(C) = 0.5$ ）、エントロピーe $H = -0.5\\log_2(0.5) - 0.5\\log_2(0.5) = 1$ 少し。不正なコインの場合 $P(T) = 0.99$ 、エントロピーは約 0.08 ビットです。不確実性はほとんどなく、ほぼ常に結果がわかります。


import numpy as np

def entropy(probs):
    """Calcola entropia in bit (log base 2)."""
    probs = np.array(probs)
    probs = probs[probs > 0]  # Evita log(0)
    return -np.sum(probs * np.log2(probs))

# Moneta equa
print(f"Moneta equa: H = {entropy([0.5, 0.5]):.4f} bit")

# Moneta truccata
print(f"Moneta truccata (0.99): H = {entropy([0.99, 0.01]):.4f} bit")

# Dado a 6 facce (uniforme)
print(f"Dado equo: H = {entropy([1/6]*6):.4f} bit")

# Dado truccato (3 esce il 50%)
probs_loaded = [0.1, 0.1, 0.5, 0.1, 0.1, 0.1]
print(f"Dado truccato: H = {entropy(probs_loaded):.4f} bit")

クロスエントロピー: 分類の喪失

La クロスエントロピー 真の分布の間 $p$ そしてモデルによって予測された分布 $q$ 必要なビット数を測定する 平均して データをエンコードする $p$ を使用して最適なコード $q$ :

H(p, q) = -\\sum_{x} p(x) \\log q(x)

分類では、 $p$ およびターゲット分布 (ワンホット) e $q$ そしてソフトマックスの出力。ラベル付き単一サンプルの場合 $y$ (ワンホット) と予測 $\\ハット{y}$ :

L = -\\sum_{k=1}^{K} y_k \\log \\hat{y}_k

二項分類の場合、次のように単純化されます。 バイナリクロスエントロピー:

L = -[y \\log(\\hat{y}) + (1-y) \\log(1 - \\hat{y})]

基本的な接続: クロスエントロピーの最小化は次と同等です。 対数尤度を最大化する モデルの。これにより、クロスエントロピーが発生する理由が説明されます。分類のための自然損失: 最大値を割り当てるモデルを探しています。観測データに対する確率。


import numpy as np

def cross_entropy(p, q):
    """Cross-entropy H(p, q) usando logaritmo naturale."""
    q = np.clip(q, 1e-15, 1 - 1e-15)  # Evita log(0)
    return -np.sum(p * np.log(q))

def binary_cross_entropy(y_true, y_pred):
    """Binary cross-entropy per un singolo campione."""
    y_pred = np.clip(y_pred, 1e-15, 1 - 1e-15)
    return -(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))

# Classificazione a 3 classi
y_true = np.array([0, 0, 1])  # Classe 3

# Predizione buona
y_pred_good = np.array([0.05, 0.05, 0.90])
print(f"Buona predizione: CE = {cross_entropy(y_true, y_pred_good):.4f}")

# Predizione mediocre
y_pred_mid = np.array([0.2, 0.3, 0.5])
print(f"Predizione media: CE = {cross_entropy(y_true, y_pred_mid):.4f}")

# Predizione sbagliata
y_pred_bad = np.array([0.7, 0.2, 0.1])
print(f"Predizione errata: CE = {cross_entropy(y_true, y_pred_bad):.4f}")

# Binary cross-entropy
print(f"\nBCE(y=1, pred=0.9) = {binary_cross_entropy(1, 0.9):.4f}")
print(f"BCE(y=1, pred=0.5) = {binary_cross_entropy(1, 0.5):.4f}")
print(f"BCE(y=1, pred=0.1) = {binary_cross_entropy(1, 0.1):.4f}")

KL ダイバージェンス: 分布間の距離

La KL ダイバージェンス (カルバック・ライブラー) 分布がどの程度かを測定します。 $q$ 参照分布とは異なります $p$ :

D_{\\text{KL}}(p \\| q) = \\sum_{x} p(x) \\log \\frac{p(x)}{q(x)} = H(p, q) - H(p)

重要なプロパティ:

$D_{\\text{KL}}(p \\| q) \\geq 0$ 常に (ギブズの不等式)
$D_{\\text{KL}}(p \\| q) = 0$ もし、そしてその場合に限り $p = q$
左右対称ではありません: $D_{\\text{KL}}(p \\| q) \\neq D_{\\text{KL}}(q \\| p)$

関係 $H(p, q) = H(p) + D_{\\text{KL}}(p \\| q)$ それを私たちに教えてくれますクロスエントロピーとエントロピー $p$ プラスKLダイバージェンス。限り $H(p)$ かつ定数（機種に依存しない）、 を最小限に抑えるクロスエントロピーは、KL 発散を最小限に抑えることと同じです.

VAE における KL ダイバージェンス

Nei 変分オートエンコーダ、損失には KL 発散項が含まれます。潜在分布を標準ガウス分布に近づけます。

D_{\\text{KL}}(\\mathcal{N}(\\mu, \\sigma^2) \\| \\mathcal{N}(0, 1)) = \\frac{1}{2}(\\mu^2 + \\sigma^2 - \\log \\sigma^2 - 1)


import numpy as np

def kl_divergence(p, q):
    """KL divergence D_KL(p || q)."""
    p = np.array(p, dtype=float)
    q = np.array(q, dtype=float)
    mask = p > 0
    return np.sum(p[mask] * np.log(p[mask] / q[mask]))

# Due distribuzioni su 4 classi
p = np.array([0.25, 0.25, 0.25, 0.25])  # Uniforme
q1 = np.array([0.3, 0.2, 0.3, 0.2])     # Leggermente diversa
q2 = np.array([0.9, 0.03, 0.04, 0.03])  # Molto diversa

print(f"KL(p || q1) = {kl_divergence(p, q1):.6f}")
print(f"KL(p || q2) = {kl_divergence(p, q2):.6f}")

# Asimmetria della KL
print(f"\nKL(p || q1) = {kl_divergence(p, q1):.6f}")
print(f"KL(q1 || p) = {kl_divergence(q1, p):.6f}")

# KL per VAE (Gaussiana vs standard normal)
def kl_gaussian(mu, log_var):
    """KL divergence tra N(mu, sigma^2) e N(0, 1)."""
    return -0.5 * np.sum(1 + log_var - mu**2 - np.exp(log_var))

mu = np.array([0.5, -0.3, 0.1])
log_var = np.array([-0.5, 0.2, -0.1])
print(f"\nKL(N(mu,sigma^2) || N(0,1)) = {kl_gaussian(mu, log_var):.4f}")

相互情報

La 相互情報 確率変数がどれだけの情報を持っているかを測定します別のもので提供されます:

I(X; Y) = \\sum_{x, y} P(x, y) \\log \\frac{P(x, y)}{P(x) P(y)} = H(X) - H(X|Y)

Se $I(X; Y) = 0$ 、変数は独立しています。 ML では、相互情報であり、次の用途に使用されます。 機能の選択 (最も有益な機能を選択してください)、クラスタリングの評価、およびその目的としてInfoNCE 損失 対照的な学習のこと。

Perplexity: 言語パターンの評価

La 困惑言語モデルを評価するための標準的な指標。そして次のように定義されますトークンごとの平均クロスエントロピーの指数:

\\text{PPL} = \\exp\\left(-\\frac{1}{N} \\sum_{i=1}^{N} \\log P(w_i | w_{<i})\\right)

の困惑 $k$ これは、平均してモデル e があたかも一様にどちらかを選択しなければならないかのように「混乱している」 $k$ オプションあらゆる段階で。複雑さが低いほど、モデルは優れています。

概要と ML との関係

覚えておくべき重要なポイント

エントロピ $H(X)$ : 不確実性を測定します。一様分布の最大値です。
クロスエントロピー $H(p,q)$ : 分類の標準損失
KL ダイバージェンス: VAE で使用される分布間の距離 (非対称)
クロスエントロピーを最小化 = 対数尤度を最大化 = KL を最小化
相互情報: 依存性の尺度、特徴選択と対照学習で使用されます。
困惑: 言語モデルの標準指標。低いほど優れており、

次の記事で: 探索してみます PCAと寸法削減。共分散行列、固有ベクトル、SVD を使用してデータをどのように圧縮できるかを見ていきます。ほとんどの情報を保持します。