こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

はじめに: ニューラルネットワークの学習方法

線形代数と言語機械学習、微分積分学、彼の 学習エンジン。モデルが予測を改善するたびに、その予測が改善されますと呼ばれるプロセスのおかげで 勾配降下法、完全にデリバティブに基づいており、グラデーション。計算がなければ、ニューラルネットワークは学習できません。

この記事ではその方法について説明します 偏導関数 彼らは私たちにどの方向を指しているのかを教えてくれますなどの重みを変更します。 連鎖ルール バックプロパゲーションを可能にする、そしてその方法基本的にすべては NumPy で実装されます。

何を学ぶか

デリバティブ: 変化率の概念
偏導関数と勾配ベクトル
連鎖則: 導関数の作り方 (バックプロパゲーションの核心)
計算グラフ: 前方パスと後方パス
ヤコビアンとヘシアン: 高次情報
NumPy でのバックプロパゲーションの手動実装

デリバティブ: 変化率

La 派生関数 関数の $f(x)$ ある時点で彼は私たちに言います関数の値がどのくらいの速さで変化するか $x$ の変更無限微量:

f'(x) = \\frac{df}{dx} = \\lim_{h \\to 0} \\frac{f(x + h) - f(x)}{h}

直感: 導関数と スロープ ある点での関数の。正の場合、関数は上昇しています。負の場合は低下しています。 if とゼロの場合、私たちは静止点 (最小値、最大値、または鞍点)。

深層学習における一般的な活性化関数の導関数:

\\text{ReLU}: f(x) = \\max(0, x) \\quad \\Rightarrow \\quad f'(x) = \\begin{cases} 1 & \\text{se } x > 0 \\\\ 0 & \\text{se } x \\leq 0 \\end{cases}

\\text{シグモイド}: \\sigma(x) = \\frac{1}{1 + e^{-x}} \\quad \\Rightarrow \\quad \\sigma'(x) = \\sigma(x)(1 - \\sigma(x))

\\text{Tanh}: \\tanh(x) = \\frac{e^x - e^{-x}}{e^x + e^{-x}} \\quad \\Rightarrow \\quad \\tanh'(x) = 1 - \\tanh^2(x)

それは重要だから: シグモイドの導関数の最大値は 0.25 (次の場合) $x = 0$ ）。これは、各レイヤーでグラデーションが乗算されることを意味します。最大係数 0.25 で、次のような有名な問題が発生します。 消失勾配 で深いネットワーク。これが、ReLU (導関数 = 1 あたり 1) である理由です。 $x > 0$ ）とお気に入り。

偏導関数と勾配

関数が複数の変数に依存する場合 (すべての重みに依存する損失関数など)、計算してみましょう 偏導関数: 各変数に関する導関数、他は固定したままにします。

関数の場合 $f(x_1, x_2, \\ldots, x_n)$ , il 勾配すべての偏導関数のベクトル:

\\nabla f = \\begin{bmatrix} \\frac{\\partial f}{\\partial x_1} \\\\ \\frac{\\partial f}{\\partial x_2} \\\\ \\vdots \\\\ \\frac{\\partial f}{\\partial x_n} \\end{bmatrix}

重要な洞察: のグラデーションポイント 最大の成長の方向性 機能の。損失を最小限に抑えるために、次の方向に進みます。反対グラデーションに:

\\theta_{\\text{new}} = \\theta_{\\text{old}} - \\eta \\nabla_{\\theta} L(\\theta)

どこ $\\年$ そして 学習率 e $L(\\シータ)$ 損失関数。これが基本的な式です 勾配降下法.


import numpy as np

# Esempio: f(x, y) = x^2 + 3xy + y^2
# Gradiente: [2x + 3y, 3x + 2y]

def f(x, y):
    return x**2 + 3*x*y + y**2

def gradient_f(x, y):
    df_dx = 2*x + 3*y
    df_dy = 3*x + 2*y
    return np.array([df_dx, df_dy])

# Punto di partenza
x, y = 3.0, 2.0
print(f"f({x}, {y}) = {f(x, y)}")
print(f"Gradiente: {gradient_f(x, y)}")

# Gradient descent
lr = 0.1
for step in range(20):
    grad = gradient_f(x, y)
    x -= lr * grad[0]
    y -= lr * grad[1]
    if step % 5 == 0:
        print(f"Step {step}: x={x:.4f}, y={y:.4f}, f={f(x, y):.6f}")

連鎖ルール: バックプロパゲーションの核心

La 連鎖ルール （連鎖律）とそれを可能にする数学的原理ディープニューラルネットワークのトレーニング。複合関数がある場合 $y = f(g(x))$ 、導関数は次のとおりです。

\\frac{dy}{dx} = \\frac{dy}{dg} \\cdot \\frac{dg}{dx} = f'(g(x)) \\cdot g'(x)

複数の複合関数を搭載 $y = f_1(f_2(f_3(x)))$ :

\\frac{dy}{dx} = \\frac{df_1}{df_2} \\cdot \\frac{df_2}{df_3} \\cdot \\frac{df_3}{dx}

ニューラルネットワークはまさに機能の組み合わせです。各層が変換を適用します。線形の後に非線形のアクティベーションが続きます。連鎖ルールを使用すると、損失がどのように発生するかを計算できます。は各重みに対して変化し、すべての層を逆順に通過します。

例: 単一ニューロンでのバックプロパゲーション

MSE 損失のある単一のニューロンを考えてみましょう。

L = (y - \\hat{y})^2 \\quad \\text{where} \\quad \\hat{y} = \\sigma(wx + b)

に対する勾配 $w$ 連鎖ルールを使用すると、次のようになります。

\\frac{\\partial L}{\\partial w} = \\frac{\\partial L}{\\partial \\hat{y}} \\cdot \\frac{\\partial \\hat{y}}{\\partial z} \\cdot \\frac{\\partial z}{\\partial w} = 2(\\hat{y} - y) \\cdot \\シグマ'(z) \\cdot x

どこ $z = wx + b$ 。連鎖内の各用語には意味があります正確: エラー、アクティベーション感度、および入力。


import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_deriv(x):
    s = sigmoid(x)
    return s * (1 - s)

# Singolo neurone: forward e backward pass
x = 2.0    # input
y = 1.0    # target
w = 0.5    # peso
b = 0.1    # bias
lr = 0.1

for epoch in range(50):
    # Forward pass
    z = w * x + b
    y_hat = sigmoid(z)
    loss = (y - y_hat) ** 2

    # Backward pass (chain rule)
    dL_dyhat = 2 * (y_hat - y)           # dL/d(y_hat)
    dyhat_dz = sigmoid_deriv(z)          # d(y_hat)/dz
    dz_dw = x                             # dz/dw
    dz_db = 1.0                           # dz/db

    dL_dw = dL_dyhat * dyhat_dz * dz_dw  # Chain rule completa
    dL_db = dL_dyhat * dyhat_dz * dz_db

    # Aggiorna pesi
    w -= lr * dL_dw
    b -= lr * dL_db

    if epoch % 10 == 0:
        print(f"Epoch {epoch}: loss={loss:.6f}, w={w:.4f}, b={b:.4f}")

計算グラフ: 前方と後方の視覚化

Un 計算グラフ 関数を演算ツリーとして表します初歩的な。各ノードは単純な演算 (和、積、アクティブ化) を実行します。逆方向に渡す連鎖ルールのおかげで、グラフ内を逆の順序でグラデーションフローが通過します。

考えてみましょう $L = (\\sigma(w_1 x_1 + w_2 x_2 + b) - y)^2$ :

フォワード: $z_1 = w_1 x_1$ , $z_2 = w_2 x_2$ , $s = z_1 + z_2 + b$ , $a = \\シグマ$ , $L = (a - y)^2$
後方へ：計算してみましょう $\\frac{\\部分 L}{\\部分 a}$ 、それから $\\frac{\\部分 L}{\\部分 s}$ 、それから $\\frac{\\部分 L}{\\部分 w_1}$ e $\\frac{\\部分 L}{\\部分 w_2}$

これはまさに PyTorch と TensorFlow が自動的に行うことです。自動差別化.

ヤコビアンとヘシアン

Il ヤコビアン 勾配をベクトル関数に一般化します。もし $\\mathbf{f}: \\mathbb{R}^n \\to \\mathbb{R}^m$ 、ヤコビアンと行列 $m \\times n$ :

\\mathbf{J} = \\begin{bmatrix} \\frac{\\partial f_1}{\\partial x_1} & \\cdots & \\frac{\\partial f_1}{\\partial x_n} \\\\ \\vdots & \\ddots & \\vdots \\\\ \\frac{\\partial f_m}{\\partial x_1} & \\cdots & \\frac{\\partial f_m}{\\partial x_n} \\end{bmatrix}

L'ヘッセ行列 と二次導関数の行列、およびに関する情報が得られます。曲率損失関数の:

\\mathbf{H} = \\begin{bmatrix} \\frac{\\partial^2 f}{\\partial x_1^2} & \\frac{\\partial^2 f}{\\partial x_1 \\partial x_2} \\\\ \\frac{\\partial^2 f}{\\partial x_2 \\partial x_1} & \\frac{\\partial^2 f}{\\部分 x_2^2} \\end{bmatrix}

ヘッセ行列の固有値によって、臨界点が臨界点であるかどうかが決まります。最小 (すべて肯定的)、最大 (すべて否定的)、または サドルポイント （混合）。の問題では、ニューラルネットワークの最適化では、鞍点は極小点よりもはるかに一般的です。

完全なバックプロパゲーション: 2 層ネットワーク


import numpy as np

np.random.seed(42)

# Dataset XOR (non-linearmente separabile)
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [1], [1], [0]])

# Inizializzazione pesi
W1 = np.random.randn(2, 4) * 0.5   # (2 input, 4 hidden)
b1 = np.zeros((1, 4))
W2 = np.random.randn(4, 1) * 0.5   # (4 hidden, 1 output)
b2 = np.zeros((1, 1))

def sigmoid(x):
    return 1 / (1 + np.exp(-np.clip(x, -500, 500)))

lr = 1.0

for epoch in range(10000):
    # === FORWARD PASS ===
    z1 = X @ W1 + b1         # (4, 2) @ (2, 4) = (4, 4)
    a1 = sigmoid(z1)          # Attivazione hidden
    z2 = a1 @ W2 + b2        # (4, 4) @ (4, 1) = (4, 1)
    a2 = sigmoid(z2)          # Output

    # Loss: MSE
    loss = np.mean((y - a2) ** 2)

    # === BACKWARD PASS (Chain Rule) ===
    m = X.shape[0]
    # Gradiente output layer
    dL_da2 = 2 * (a2 - y) / m
    da2_dz2 = a2 * (1 - a2)        # Derivata sigmoid
    dz2 = dL_da2 * da2_dz2         # (4, 1)

    dW2 = a1.T @ dz2               # (4, 4).T @ (4, 1) = (4, 1)
    db2 = np.sum(dz2, axis=0, keepdims=True)

    # Gradiente hidden layer (chain rule continua!)
    da1 = dz2 @ W2.T               # (4, 1) @ (1, 4) = (4, 4)
    dz1 = da1 * (a1 * (1 - a1))    # Derivata sigmoid

    dW1 = X.T @ dz1                # (2, 4).T @ (4, 4) = (2, 4)
    db1 = np.sum(dz1, axis=0, keepdims=True)

    # === AGGIORNAMENTO PESI ===
    W2 -= lr * dW2
    b2 -= lr * db2
    W1 -= lr * dW1
    b1 -= lr * db1

    if epoch % 2000 == 0:
        print(f"Epoch {epoch}: Loss = {loss:.6f}")

# Risultato finale
predictions = np.round(a2, 2)
print(f"\nPredizioni finali:\n{predictions.flatten()}")
print(f"Target:    {y.flatten()}")

勾配のチェック: 勾配を確認する

バックプロパゲーションが正しく実装されていることを確認するために、次のように比較できます。それらを使用した分析勾配数値有限差分を使用して計算されます。

\\frac{\\部分 L}{\\部分 \\theta_i} \\およそ \\frac{L(\\theta_i + \\epsilon) - L(\\theta_i - \\epsilon)}{2\\epsilon}

con $\\イプシロン \\約 10^{-7}$ 。勾配間の相対的な差分析的および数値的値は以下である必要があります $10^{-5}$ .


import numpy as np

def numerical_gradient(f, params, idx, epsilon=1e-7):
    """Calcola gradiente numerico per verifica."""
    original = params[idx].copy()

    params[idx] = original + epsilon
    loss_plus = f()

    params[idx] = original - epsilon
    loss_minus = f()

    params[idx] = original
    return (loss_plus - loss_minus) / (2 * epsilon)

# Esempio semplice: f = (w*x - y)^2
w = np.array([0.5])
x, y_true = 2.0, 3.0

def compute_loss():
    return (w[0] * x - y_true) ** 2

# Gradiente analitico
grad_analytical = 2 * (w[0] * x - y_true) * x

# Gradiente numerico
grad_numerical = numerical_gradient(compute_loss, [w], 0)

print(f"Analitico: {grad_analytical:.8f}")
print(f"Numerico:  {grad_numerical:.8f}")
print(f"Diff relativa: {abs(grad_analytical - grad_numerical) / max(abs(grad_analytical), 1e-8):.2e}")

概要と ML との関係

覚えておくべき重要なポイント

デリバティブ: 変化率を測定し、関数の傾きを示します
勾配 $\\nabla L$ : 損失が最大増加する方向を指します。
勾配降下法: $\\theta \\leftarrow \\theta - \\eta \\nabla L$ - 勾配とは逆に移動します
チェーンルール: 関数合成を通じて勾配を計算できます。
バックプロパゲーション: ネットワークの計算グラフへの連鎖規則の適用
消失勾配: シグモイドの最大導関数は 0.25、ReLU は導関数 1 で解決します。

次の記事で: 探索してみます 確率と統計 ML用。ベイズの定理、分布、最尤推定、およびその方法について見ていきます。予測の不確実性を定量化します。