こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

はじめに: 情報を失わずにデータを圧縮する

実際のデータセットには、多くの場合、数百または数千の特徴があります。これらの多くは冗長であるか、互いに関連しています。そこには 寸法縮小 データを次のように圧縮できます有用な情報のほとんどを保持しながら、低次元の空間を実現します。アルゴリズム最もよく使われており、 PCA (主成分分析)、完全に基づいています共分散行列の固有値と固有ベクトルについて。

何を学ぶか

次元の呪いとそれを減らす理由
共分散行列: 相関関係を理解する
PCA: 最大分散の方向を見つける
差異の説明とコンポーネント数の選択
非線形可視化のための t-SNE と UMAP
NumPy と scikit-learn での完全な実装

次元の呪い

高次元空間では、データは次のようになります。 散らばっている: すべてのポイントはほぼ等距離。これにより、距離メトリックがあまり役に立たなくなり、次のような問題が発生します。モデルの過学習。 PCA は、データを方向に投影することでこの問題に対処します。より有益です。

共分散行列

La 共分散行列 $\\mathbf{C}$ 彼らを捕まえる特徴のすべてのペア間の相関関係。中心化されたデータセットの場合 (ゼロ平均) $\\mathbf{X} \\in \\mathbb{R}^{n \\times d}$ :

\\mathbf{C} = \\frac{1}{n-1} \\mathbf{X}^T \\mathbf{X}

あらゆる要素 $C{ij}$ 特徴間の共分散 $i$ e $j$ :

C_{ij} = \\frac{1}{n-1} \\sum_{k=1}^{n} (x_{ki} - \\bar{x}_i)(x_{kj} - \\bar{x}_j)

対角には各特徴の分散が含まれ、対角以外の要素には共分散が含まれます。もし $C_{ij} > 0$ 、特徴は正の相関があります。もし $C_{ij} = 0$ 、相関はありません。

PCA: 数学的導出

PCA が検索するのは、方向これに沿ってデータの分散が最大になります。最初の主成分 $\\mathbf{w}_1$ そして単位ベクトルは投影の分散を最大化します。

\\mathbf{w}_1 = \\arg\\max_{\\|\\mathbf{w}\\| = 1} \\text{Var}(\\mathbf{X}\\mathbf{w}) = \\arg\\max_{\\|\\mathbf{w}\\| = 1} \\mathbf{w}^T \\mathbf{C} \\mathbf{w}

ラグランジュ乗数を使用すると、解と固有ベクトル 最大のものに相当する 固有値 di $\\mathbf{C}$ :

\\mathbf{C} \\mathbf{w}_i = \\lambda_i \\mathbf{w}_i

どこ $\\lambda_1 \\geq \\lambda_2 \\geq \\cdots \\geq \\lambda_d \\geq 0$ 彼らは順序付けられた固有値。固有値 $\\ラムダ_i$ そしてまさにそこにによって捕捉された差異 $i$ -番目の主成分。

投影と再構成

に減らすには $k$ 次元を前者に投影します $k$ 固有ベクトル:

\\mathbf{Z} = \\mathbf{X} \\mathbf{W}_k \\quad \\text{where} \\quad \\mathbf{W}_k = [\\mathbf{w}_1, \\mathbf{w}_2, \\ldots, \\mathbf{w}_k] \\in \\mathbb{R}^{d \\times k}

おおよその再構成は次のとおりです。

\\hat{\\mathbf{X}} = \\mathbf{Z} \\mathbf{W}_k^T

差異の説明

La 説明された分散 最初のものから $k$ コンポーネントと:

\\text{分散の説明} = \\frac{\\sum_{i=1}^{k} \\lambda_i}{\\sum_{i=1}^{d} \\lambda_i}

実際には、あなたが選択します $k$ 95% または 99% を維持するなど合計の差異。


import numpy as np

# Dataset sintetico: 200 campioni, 5 feature (correlate)
np.random.seed(42)
n, d = 200, 5
X = np.random.randn(n, 2) @ np.array([[2, 1, 0.5, 0.3, 0.1],
                                        [0.5, 1.5, 1, 0.2, 0.8]])
X += np.random.randn(n, d) * 0.3  # Rumore

# PCA da zero
# 1. Centrare i dati
X_centered = X - X.mean(axis=0)

# 2. Matrice di covarianza
C = np.cov(X_centered, rowvar=False)
print(f"Matrice di covarianza:\n{np.round(C, 3)}\n")

# 3. Autovalori e autovettori
eigenvalues, eigenvectors = np.linalg.eigh(C)
# Ordinare in ordine decrescente
idx = np.argsort(eigenvalues)[::-1]
eigenvalues = eigenvalues[idx]
eigenvectors = eigenvectors[:, idx]

print(f"Autovalori: {np.round(eigenvalues, 4)}")

# 4. Varianza spiegata
var_explained = eigenvalues / eigenvalues.sum()
cumulative = np.cumsum(var_explained)
for i in range(d):
    print(f"PC{i+1}: {var_explained[i]*100:.1f}% (cumulativa: {cumulative[i]*100:.1f}%)")

# 5. Proiezione a 2D
k = 2
W_k = eigenvectors[:, :k]
Z = X_centered @ W_k
print(f"\nShape originale: {X.shape} -> Ridotta: {Z.shape}")

# 6. Errore di ricostruzione
X_reconstructed = Z @ W_k.T + X.mean(axis=0)
reconstruction_error = np.mean((X - X_reconstructed)**2)
print(f"Errore di ricostruzione (MSE): {reconstruction_error:.6f}")

Scikit-Learn を使用した PCA


from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import numpy as np

# Standardizzazione (importante! PCA e sensibile alla scala)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# PCA automatica
pca = PCA(n_components=0.95)  # Mantieni 95% varianza
X_pca = pca.fit_transform(X_scaled)

print(f"Componenti selezionate: {pca.n_components_}")
print(f"Varianza spiegata: {pca.explained_variance_ratio_}")
print(f"Shape: {X.shape} -> {X_pca.shape}")

PCA を超えて: t-SNE と UMAP

PCA は以下に限定されます 線形変換。データ内の非線形構造の場合、 t-SNE や UMAP などの手法が使用されます。

t-SNE

t-SNE (t 分布確率的隣接埋め込み) は、 距離地元の: 元の空間内の近い点は、2D 表現でも近くに残ります。元の空間と縮小された空間での類似度分布間の KL 発散を最小限に抑えます。

p_{j|i} = \\frac{\\exp(-\\|\\mathbf{x}_i - \\mathbf{x}_j\\|^2 / 2\\sigma_i^2)}{\\sum_{k \\neq i} \\exp(-\\|\\mathbf{x}_i - \\mathbf{x}_k\\|^2 / 2\\シグマ_i^2)}

q_{ij} = \\frac{(1 + \\|\\mathbf{y}_i - \\mathbf{y}_j\\|^2)^{-1}}{\\sum_{k \\neq l} (1 + \\|\\mathbf{y}_k - \\mathbf{y}_l\\|^2)^{-1}}

UMAP

UMAP (均一多様体近似と投影)、t-SNE e より高速保存性が良くなります グローバル構造。それは代数トポロジーに基づいており、ファジィグラフ理論。

いつどれを使うか: PCA 前処理用 (分類器の前のサイズを削減し、ノイズを除去します)。 t-SNE/UMAP 2D/3D 視覚化 (クラスター、外れ値の調査) 用。 PCA は可逆的で解釈可能ですが、t-SNE/UMAP はそうではありません。

アプリケーション: ML での前処理のための PCA


from sklearn.datasets import load_digits
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
import numpy as np

# Dataset digits: 1797 immagini 8x8 = 64 feature
digits = load_digits()
X, y = digits.data, digits.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Senza PCA (64 feature)
scaler = StandardScaler()
X_train_s = scaler.fit_transform(X_train)
X_test_s = scaler.transform(X_test)

clf_full = LogisticRegression(max_iter=5000)
clf_full.fit(X_train_s, y_train)
acc_full = clf_full.score(X_test_s, y_test)

# Con PCA (mantieni 95% varianza)
pca = PCA(n_components=0.95)
X_train_pca = pca.fit_transform(X_train_s)
X_test_pca = pca.transform(X_test_s)

clf_pca = LogisticRegression(max_iter=5000)
clf_pca.fit(X_train_pca, y_train)
acc_pca = clf_pca.score(X_test_pca, y_test)

print(f"Senza PCA: {X_train_s.shape[1]} feature, Accuracy: {acc_full:.4f}")
print(f"Con PCA:   {X_train_pca.shape[1]} feature, Accuracy: {acc_pca:.4f}")
print(f"Riduzione: {(1 - X_train_pca.shape[1]/X_train_s.shape[1])*100:.0f}% delle feature")

概要と ML との関係

覚えておくべき重要なポイント

PCA: 最初のものに投影します $k$ 共分散行列の固有ベクトル
固有値 $\\ラムダ_i$ : 各コンポーネントによってキャプチャされた分散
差異の説明: あなたが選択します $k$ 分散の 95% 以上を維持するには
標準化: PCA 前の基本 (スケールセンシティブ)
t-SNE/UMAP：ノンリニア2D/3D表示用
前処理用の PCA: オーバーフィッティングを軽減し、トレーニングを加速します

次の記事で: を探索してみます 損失関数 で詳細。 MSE、クロスエントロピー、焦点損失、ヒンジ損失、およびカスタムの選択と作成方法。