こんにちは！

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

お問い合わせ

自己紹介

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

スキル

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

プロセス自動化

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

カスタムシステム

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

ミッション

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

🚀

テクノロジーの民主化

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

💡

ITとビジネスの融合

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

🎯

カスタムソリューション

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

テクノロジーでビジネスを変革

Dicembre 2024

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

💻 Linguaggi & Tecnologie

☕Java

🐍Python

📜JavaScript

🅰️Angular

⚛️React

🔷TypeScript

🗄️SQL

🐘PHP

🎨CSS/SCSS

🔧Node.js

🐳Docker

🌿Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

お問い合わせ

プロジェクトをお考えですか？お気軽にお問い合わせください。

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

はじめに: モデルが最適な重みを見つける方法

機械学習モデルのトレーニングとは、機械学習モデルが最小化するパラメーター値を見つけることを意味します。 1つ 損失関数。このプロセスはと呼ばれます 最適化 そしてそれはすべてのディープラーニングの中心です。最もよく使われるアルゴリズムは、 勾配降下法、速度、安定性、汎用性のバランスをとった多くのバリエーションがあります。

何を学ぶか

勾配降下法バニラとその制限事項
確率的勾配降下法 (SGD) とミニバッチ
運動量とネステロフ加速勾配
適応アルゴリズム: RMSprop と Adam
学習率のスケジューリング: ウォームアップ、コサインアニーリング
収束、鞍点、損失の状況

勾配降下法: 基本的なアルゴリズム

Il 勾配降下法 (勾配降下法) 移動するとパラメータが更新されます損失勾配と反対の方向:

\\theta_{t+1} = \\theta_t - \\eta \\nabla_{\\theta} L(\\theta_t)

どこ $\\年$ そして 学習率 (重要なハイパーパラメータ) e $\\nabla_{\\theta} L$ で計算された勾配 みんな トレーニングデータ (バッチ勾配降下法)。

類推: あなたが霧の中の丘の上にいて、そこに到達したいと思っていると想像してください。下の谷。一歩ごとに足元に傾斜（勾配）を感じながら歩いていきます。より急な下方向。学習率とステップサイズ: 大きすぎますそして谷を飛び越えると、小さすぎて永遠に時間がかかります。

学習率の問題

学習率の選択は非常に重要です。

$\\年$ 大きすぎる：損失が変動または発散する
$\\年$ 小さすぎる: 収束が非常に遅い
$\\年$ 右: 最小値に向けて安定した収束


import numpy as np

# Funzione obiettivo: f(x) = x^4 - 3x^2 + 2 (ha due minimi)
def f(x):
    return x**4 - 3*x**2 + 2

def grad_f(x):
    return 4*x**3 - 6*x

# Gradient descent con diversi learning rate
for lr in [0.01, 0.05, 0.1]:
    x = 2.0  # punto di partenza
    history = [x]
    for _ in range(100):
        x = x - lr * grad_f(x)
        history.append(x)
    print(f"lr={lr}: x_finale={x:.6f}, f(x)={f(x):.6f}")

確率的勾配降下法 (SGD)

データセット全体にわたる勾配の計算にはコストがかかります。 シンガポールドル 単一のサンプルを使用する (または ミニバッチ) 勾配を推定するには:

\\theta_{t+1} = \\theta_t - \\eta \\nabla_{\\theta} L(\\theta_t; x_i, y_i)

推定勾配はノイズが多いですが、 平均して 正しい方向を指します。騒音には驚くべき利点があります。極小値を回避するのに役立ち、次のように機能します。 レギュラライザー暗黙的な.

実際には、 ミニバッチ SGD 32 ～ 256 サンプルのバッチ、妥協案勾配の分散と計算効率の間の関係:

\\theta_{t+1} = \\theta_t - \\eta \\frac{1}{|B|} \\sum_{i \\in B} \\nabla_{\\theta} L(\\theta_t; x_i, y_i)

勢い: 加速するコンバージェンス

勢いは更新に「速度」を加え、過去の勾配を 1 つとして蓄積します。 指数移動平均:

v_t = \\beta v_{t-1} + (1 - \\beta) \\nabla_{\\theta} L(\\theta_t)

\\theta_{t+1} = \\theta_t - \\eta v_t

どこ $\\ベータ \\約 0.9$ 「メモリ」の勢いがどのくらいあるかを制御します。

直感: 丘を転がり落ちるボールを想像してください。勢いがないと、小さな異常に遭遇するたびに停止します。勢いに乗ってボールはスピードを重ねるそして小さな穴を乗り越え、谷に向かってより早く収束します。運動量が振動を軽減する交互の勾配を持つ方向に加速し、一定の勾配を持つ方向に加速します。

ネステロフ加速勾配 (NAG)

NAG は、「将来の」位置 (先読み) の勾配を計算することで勢いを改善します。

v_t = \\beta v_{t-1} + \\eta \\nabla_{\\theta} L(\\theta_t - \\beta v_{t-1})

\\theta_{t+1} = \\theta_t - v_t

「まず自分がどこに行くのかを見て、それから方向を修正します。」 NAG はより速く収束します標準的な勢いで、安値の前に減速します。

RMSprop: 適応学習率

RMSプロップ 各パラメータの学習率を個別に調整し、次のように割ります。過去の勾配の二乗平均の根：

s_t = \\beta s_{t-1} + (1 - \\beta) (\\nabla_{\\theta} L)^2

\\theta_{t+1} = \\theta_t - \\frac{\\eta}{\\sqrt{s_t} + \\epsilon} \\nabla_{\\theta} L

勾配が大きいパラメータの場合、実効学習率は低下します。パラメータの場合勾配が小さいと増加します。これにより、フィーチャ間のスケールが異なるという問題が解決されます。

アダム: 最先端

アダム (適応モーメント推定) は最高の運動量と RMSprop を組み合わせます。勾配の移動平均 (最初の瞬間) と勾配の移動平均の両方を維持する 2 乗 (2 番目のモーメント):

m_t = \\beta_1 m_{t-1} + (1 - \\beta_1) g_t \\quad \\text{(最初の瞬間 - 平均)}

v_t = \\beta_2 v_{t-1} + (1 - \\beta_2) g_t^2 \\quad \\text{(2 番目のモーメント - 分散)}

Con バイアス補正 ゼロ初期化を補正するには:

\\hat{m}_t = \\frac{m_t}{1 - \\beta_1^t} \\qquad \\hat{v}_t = \\frac{v_t}{1 - \\beta_2^t}

最終更新:

\\theta_{t+1} = \\theta_t - \\frac{\\eta}{\\sqrt{\\hat{v}_t} + \\epsilon} \\hat{m}_t

推奨されるデフォルトのハイパーパラメータ: $\\beta_1 = 0.9$ , $\\beta_2 = 0.999$ , $\\イプシロン = 10^{-8}$ .


import numpy as np

class Adam:
    def __init__(self, lr=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8):
        self.lr = lr
        self.beta1 = beta1
        self.beta2 = beta2
        self.epsilon = epsilon
        self.m = None  # Primo momento
        self.v = None  # Secondo momento
        self.t = 0

    def update(self, params, grads):
        if self.m is None:
            self.m = np.zeros_like(params)
            self.v = np.zeros_like(params)

        self.t += 1
        self.m = self.beta1 * self.m + (1 - self.beta1) * grads
        self.v = self.beta2 * self.v + (1 - self.beta2) * grads**2

        # Bias correction
        m_hat = self.m / (1 - self.beta1**self.t)
        v_hat = self.v / (1 - self.beta2**self.t)

        params -= self.lr * m_hat / (np.sqrt(v_hat) + self.epsilon)
        return params

# Test: minimizzare f(x,y) = x^2 + 10*y^2 (landscape ellittico)
def f(params):
    return params[0]**2 + 10 * params[1]**2

def grad_f(params):
    return np.array([2*params[0], 20*params[1]])

# Confronto SGD vs Adam
params_sgd = np.array([5.0, 5.0])
params_adam = np.array([5.0, 5.0])
optimizer = Adam(lr=0.1)

print("Step | SGD f(x) | Adam f(x)")
for step in range(50):
    # SGD
    g = grad_f(params_sgd)
    params_sgd -= 0.01 * g

    # Adam
    g = grad_f(params_adam)
    params_adam = optimizer.update(params_adam, g)

    if step % 10 == 0:
        print(f"{step:4d} | {f(params_sgd):8.4f} | {f(params_adam):8.4f}")

学習率のスケジューリング

固定学習率から始めるのは最適ではありません。スケジュール戦略が適応する $\\年$ トレーニング中:

ステップディケイ

\\eta_t = \\eta_0 \\cdot \\gamma^{\\lfloor t / s \\rfloor}

どこ $\\ガンマ = 0.1$ e $s$ そしてその番号各縮小間のエポック数。

コサインアニーリング

\\eta_t = \\eta_{\\min} + \\frac{1}{2}(\\eta_{\\max} - \\eta_{\\min})\\left(1 + \\cos\\left(\\frac{t \\pi}{T}\\right)\\right)

コサイン曲線に従って学習率を徐々に下げ、最後にはより積極的に学習します。

ウォームアップ + ディケイ

Transformers で使用: 低い学習率から開始し、学習率が直線的に増加します。 $た_w$ ステップ (ウォームアップ)、その後減少します:

\\eta_t = \\begin{cases} \\eta_{\\max} \\cdot \\frac{t}{T_w} & \\text{se } t \\leq T_w \\\\ \\eta_{\\max} \\cdot \\text{decay}(t - T_w) & \\text{se } t > T_w \\end{cases}


import numpy as np

def cosine_annealing(t, T, eta_min=1e-6, eta_max=1e-3):
    return eta_min + 0.5 * (eta_max - eta_min) * (1 + np.cos(t * np.pi / T))

def warmup_cosine(t, warmup_steps, total_steps, eta_max=1e-3):
    if t < warmup_steps:
        return eta_max * t / warmup_steps
    else:
        progress = (t - warmup_steps) / (total_steps - warmup_steps)
        return eta_max * 0.5 * (1 + np.cos(progress * np.pi))

# Visualizzazione (valori)
total_steps = 1000
warmup = 100
print("Step | Cosine LR | Warmup+Cosine LR")
for t in range(0, total_steps, 100):
    cos_lr = cosine_annealing(t, total_steps)
    warm_lr = warmup_cosine(t, warmup, total_steps)
    print(f"{t:4d} | {cos_lr:.6f} | {warm_lr:.6f}")

サドルポイントと損失状況

高次元空間 (数百万のパラメータ) では、i 極小値 彼らはまれです。本当の問題は、 サドルポイント: 勾配がゼロではない点それらは最小値でも最大値でもありません。鞍点の確率は、次元性。

幸いなことに、勢いのあるSGDとアダムは騒音のおかげでなんとか鞍部を逃れることができました。確率的かつ蓄積された勢い。

概要と ML との関係

覚えておくべき重要なポイント

勾配降下法: $\\theta \\leftarrow \\theta - \\eta \\nabla L$ - 基本的なアルゴリズム
シンガポールドル: 効率を上げるためにミニバッチを使用し、ノイズは一般化に役立ちます
勢い: スピードを蓄積し、損失面の凹凸を克服します。
アダム: 運動量と適応学習率を組み合わせたもので、DL のデフォルトです。
学習率のスケジュール設定: ウォームアップ + コサイン減衰はトランスフォーマーの標準です
サドルポイント: 高次元では極小値よりも問題がある

次の記事で: を探索してみます 情報理論。エントロピー、クロスエントロピー (分類に最もよく使用される損失)、KL 発散、可能性が最も高い深いつながり。