Merhaba! Ben

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

İletişime Geç

Hakkımda

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

Yeteneklerim

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

Süreç Otomasyonu

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

Özel Sistemler

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

Misyonum

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

Teknolojiyi Demokratikleştirmek

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

BT ve İş Dünyasını Birleştirmek

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

Özel Çözümler Oluşturmak

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

İşletmenizi Teknolojiyle Dönüştürün

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

İletişime Geç

Aklınızda bir proje mi var? Konuşalım! Formu doldurun, en kısa sürede dönüş yapacağım.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

Giriş: Ölçüm Bilgisi

La bilgi teorisi1948'de Claude Shannon tarafından kurulan bize gerekli araçları sağlıyor Belirsizliği ölçmek, bir mesajda yer alan bilgi miktarını ölçmek Bir modelin gerçeğe ne kadar iyi yaklaştığını değerlendirin. Makine öğrenmesinde bu kavramlar ortaya çıkıyor her yerde: çapraz entropi ve sınıflandırma için varsayılan kayıp fonksiyonu, the KL farklılığı VAE'nin ve bilgi damıtmanın kalbinde yer alır.

Ne Öğreneceksiniz

Bilgi içeriği: -log(p) olarak sürpriz
Entropi: bir dağılımın belirsizliğinin ölçüsü
Çapraz entropi: sınıflandırma için en çok kullanılan kayıp
KL sapması: dağılımlar arasındaki asimetrik mesafe
Karşılıklı bilgi: değişkenler arasındaki bağımlılık
Şaşkınlık ve dil modelleriyle bağlantıları

Bilgi İçeriği: Sürpriz

L'bilgi içeriği Olasılığı olan bir olayın (veya kişisel bilgisinin) $p$ bu olayın ne kadar "şaşırtıcı" olduğunu ölçer:

I(x) = -\\log_2 P(x)

Sezgi: çok muhtemel bir olay ( $P \\yaklaşık 1$ ) çok az bilgi taşır (düşük sürpriz). Nadir bir olay ( $P \\yaklaşık 0$ ) çok fazla bilgi getirir (yüksek sürpriz). 2. tabandaki birim biraz: bir bit ve adil bir yazı tura atmanın bilgi miktarı.

Entropi: Ortalama Belirsizlik

L'entropi ve bilgi içeriğinin beklenen değeri, yani orta sürpriz bir dağıtım:

H(X) = -\\sum_{x} P(x) \\log P(x) = \\mathbb{E}[-\\log P(X)]

Sürekli dağıtım için:

H(X) = -\\int f(x) \\log f(x) \\, dx

Temel özellikler:

$H(X) \\geq 0$ her zaman (belirsizlik asla olumsuz değildir)
$H(X) = 0$ sadece eğer $X$ ve deterministik (tek bir olayın olasılığı 1'dir)
$H(X)$ ve tekdüze dağılım için maksimum (maksimum belirsizlik)

Örnek: adil bir para için ( $P(T) = P(C) = 0,5$ ), entropi e $H = -0,5\\log_2(0,5) - 0,5\\log_2(0,5) = 1$ biraz. Hileli bir para için $P(T) = 0,99$ , entropi yaklaşık 0,08 bittir: neredeyse hiç belirsizlik yok, neredeyse her zaman sonucu biliyoruz.


import numpy as np

def entropy(probs):
    """Calcola entropia in bit (log base 2)."""
    probs = np.array(probs)
    probs = probs[probs > 0]  # Evita log(0)
    return -np.sum(probs * np.log2(probs))

# Moneta equa
print(f"Moneta equa: H = {entropy([0.5, 0.5]):.4f} bit")

# Moneta truccata
print(f"Moneta truccata (0.99): H = {entropy([0.99, 0.01]):.4f} bit")

# Dado a 6 facce (uniforme)
print(f"Dado equo: H = {entropy([1/6]*6):.4f} bit")

# Dado truccato (3 esce il 50%)
probs_loaded = [0.1, 0.1, 0.5, 0.1, 0.1, 0.1]
print(f"Dado truccato: H = {entropy(probs_loaded):.4f} bit")

Çapraz Entropi: Sınıflandırmanın Kaybı

La çapraz entropi gerçek dağılım arasında $p$ ve model tarafından tahmin edilen dağılım $q$ kaç bitin gerekli olduğunu ölç ortalama olarak gelen verileri kodlamak için $p$ kullanarak için en uygun kod $q$ :

H(p, q) = -\\sum_{x} p(x) \\log q(x)

Sınıflandırmada, $p$ ve hedef dağılımı (tek sıcak) e $q$ ve softmax'ın çıktısı. Etiketli tek bir numune için $y$ (tek-sıcak) ve tahmin $\\hat{y}$ :

L = -\\sum_{k=1}^{K} y_k \\log \\hat{y} k

İkili sınıflandırma için basitleştirir ikili çapraz entropi:

L = -[y \\log(\\hat{y}) + (1-y) \\log(1 - \\hat{y})]

Temel bağlantı: çapraz entropinin en aza indirilmesi şuna eşdeğerdir: günlük olasılığını en üst düzeye çıkarın modelin. Bu neden çapraz entropinin ve sınıflandırma için doğal kayıp: Maksimum değeri atayan modeli arıyoruz gözlemlenen verilere olasılık.


import numpy as np

def cross_entropy(p, q):
    """Cross-entropy H(p, q) usando logaritmo naturale."""
    q = np.clip(q, 1e-15, 1 - 1e-15)  # Evita log(0)
    return -np.sum(p * np.log(q))

def binary_cross_entropy(y_true, y_pred):
    """Binary cross-entropy per un singolo campione."""
    y_pred = np.clip(y_pred, 1e-15, 1 - 1e-15)
    return -(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))

# Classificazione a 3 classi
y_true = np.array([0, 0, 1])  # Classe 3

# Predizione buona
y_pred_good = np.array([0.05, 0.05, 0.90])
print(f"Buona predizione: CE = {cross_entropy(y_true, y_pred_good):.4f}")

# Predizione mediocre
y_pred_mid = np.array([0.2, 0.3, 0.5])
print(f"Predizione media: CE = {cross_entropy(y_true, y_pred_mid):.4f}")

# Predizione sbagliata
y_pred_bad = np.array([0.7, 0.2, 0.1])
print(f"Predizione errata: CE = {cross_entropy(y_true, y_pred_bad):.4f}")

# Binary cross-entropy
print(f"\nBCE(y=1, pred=0.9) = {binary_cross_entropy(1, 0.9):.4f}")
print(f"BCE(y=1, pred=0.5) = {binary_cross_entropy(1, 0.5):.4f}")
print(f"BCE(y=1, pred=0.1) = {binary_cross_entropy(1, 0.1):.4f}")

KL Diverjansı: Dağılımlar Arasındaki Mesafe

La KL farklılığı (Kullback-Leibler) dağılımın ne kadar olduğunu ölçer $q$ referans dağılımından farklı $p$ :

D_{\\text{KL}}(p \\| q) = \\sum_{x} p(x) \\log \\frac{p(x)}{q(x)} = H(p, q) - H(p)

Önemli özellikler:

$D_{\\text{KL}}(p \\| q) \\geq 0$ her zaman (Gibbs eşitsizliği)
$D_{\\text{KL}}(p \\| q) = 0$ ancak ve ancak $p = q$
Simetrik değil: $D_{\\text{KL}}(p \\| q) \\neq D_{\\text{KL}}(q \\| p)$

ilişki $H(p, q) = H(p) + D_{\\text{KL}}(p \\| q)$ bize bunu söylüyor çapraz entropi ve entropi $p$ artı KL sapması. sürece $H(p)$ ve sabit (modele bağlı değildir), en aza indirmek çapraz entropi KL sapmasını en aza indirmeye eşdeğerdir.

VAE'lerde KL Farklılığı

içinde Varyasyonel Otomatik Kodlayıcılar, kayıp bir KL sapma terimini içerir; gizli dağılımı standart Gaussian'a yakın olmaya zorlar:

D_{\\text{KL}}(\\mathcal{N}(\\mu, \\sigma^2) \\| \\mathcal{N}(0, 1)) = \\frac{1}{2}(\\mu^2 + \\sigma^2 - \\log \\sigma^2 - 1)


import numpy as np

def kl_divergence(p, q):
    """KL divergence D_KL(p || q)."""
    p = np.array(p, dtype=float)
    q = np.array(q, dtype=float)
    mask = p > 0
    return np.sum(p[mask] * np.log(p[mask] / q[mask]))

# Due distribuzioni su 4 classi
p = np.array([0.25, 0.25, 0.25, 0.25])  # Uniforme
q1 = np.array([0.3, 0.2, 0.3, 0.2])     # Leggermente diversa
q2 = np.array([0.9, 0.03, 0.04, 0.03])  # Molto diversa

print(f"KL(p || q1) = {kl_divergence(p, q1):.6f}")
print(f"KL(p || q2) = {kl_divergence(p, q2):.6f}")

# Asimmetria della KL
print(f"\nKL(p || q1) = {kl_divergence(p, q1):.6f}")
print(f"KL(q1 || p) = {kl_divergence(q1, p):.6f}")

# KL per VAE (Gaussiana vs standard normal)
def kl_gaussian(mu, log_var):
    """KL divergence tra N(mu, sigma^2) e N(0, 1)."""
    return -0.5 * np.sum(1 + log_var - mu**2 - np.exp(log_var))

mu = np.array([0.5, -0.3, 0.1])
log_var = np.array([-0.5, 0.2, -0.1])
print(f"\nKL(N(mu,sigma^2) || N(0,1)) = {kl_gaussian(mu, log_var):.4f}")

Karşılıklı Bilgi

La karşılıklı bilgi bir rastgele değişkenin ne kadar bilgiye sahip olduğunu ölçer bir başkasında şunu sağlar:

I(X; Y) = \\sum_{x, y} P(x, y) \\log \\frac{P(x, y)}{P(x) P(y)} = H(X) - H(X|Y)

Se $ben(X; Y) = 0$ değişkenler bağımsızdır. ML'de karşılıklı bilgi ve aşağıdakiler için kullanılır: özellik seçimi (en bilgilendirici özellikleri seçin), kümelenmenin değerlendirilmesi ve bir amaç olarakInfoNCE kaybı karşılaştırmalı öğrenme.

Şaşkınlık: Dil Kalıplarını Değerlendirmek

La şaşkınlık ve dil modellerini değerlendirmek için standart bir ölçüm. Ve olarak tanımlandı jeton başına ortalama çapraz entropinin üstel değeri:

\\text{PPL} = \\exp\\left(-\\frac{1}{N} \\sum_{i=1}^{N} \\log P(w_i | w_{<i})\\right)

Bir şaşkınlık $k$ ortalama olarak e modelinin olduğu anlamına gelir sanki ikisi arasında tekdüze bir seçim yapmak zorundaymış gibi "kafası karışmış" $k$ seçenekler her adımda. Karışıklık ne kadar düşük olursa model o kadar iyi olur.

Özet ve ML ile Bağlantılar

Hatırlanması Gereken Önemli Noktalar

Entropi $H(X)$ : Tekdüze dağılım için maksimum belirsizliği ölçer
Çapraz entropi $H(p,q)$ : sınıflandırma için standart kayıp
KL farklılığı: VAE'de kullanılan dağılımlar arasındaki mesafe (asimetrik)
Çapraz entropiyi en aza indirin = log olasılığını en üst düzeye çıkarın = KL'yi en aza indirin
Karşılıklı bilgi: özellik seçiminde ve karşılaştırmalı öğrenmede kullanılan bağımlılık ölçüsü
Şaşkınlık: dil modelleri için standart metrik, ne kadar düşük olursa o kadar iyi ve

Bir sonraki makalede: Keşfedeceğiz PCA ve boyut küçültme. Kovaryans matrisinin, özvektörlerin ve SVD'nin verileri sıkıştırmamıza nasıl izin verdiğini göreceğiz bilgilerin çoğunu saklıyor.