{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# La più semplice rete neurale, per trovare la retta che meglio modella un insieme di punti $(x,y)$\n",
"Luca Mari, aggiornamento maggio 2024 \n",
"\n",
"Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale - Condividi allo stesso modo 4.0 Internazionale. \n",
"\n",
"\n",
"[i file di questa attività: [linear.ipynb](linear.ipynb), [linearutils.py](linearutils.py)]\n",
"\n",
"**Obiettivi**: comprendere il funzionamento di base di una (molto) semplice rete neurale, per come specificato in Python mediante un modulo di alto livello come `PyTorch`, e poi anche comprendendo come la rete è addestrata e poi funziona \"a basso livello\". \n",
"**Precompetenze**: basi di Python; almeno qualche idea di analisi matematica.\n",
"\n",
"> Per eseguire questo notebook, supponiamo con VSCode, occorre:\n",
"> * installare un interprete Python\n",
"> * scaricare da https://code.visualstudio.com/download e installare VSCode\n",
"> * eseguire VSCode e attivare le estensioni per Python e Jupyter\n",
"> * ancora in VSCode:\n",
"> * creare una cartella di lavoro e renderla la cartella corrente\n",
"> * copiare nella cartella questo notebook e il file `linearutils.py` e aprire il notebook\n",
"> * creare un ambiente virtuale locale Python (Select Kernel | Python Environments | Create Python Environment | Venv, e scegliere un interprete Python):\n",
"> * installare i moduli Python richiesti, eseguendo dal terminale: \n",
"> `pip install torch matplotlib ipympl`"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Supponiamo di disporre di un insieme di dati $(x_i, y_i)$, e da questo di voler costruire una funzione $f$ in grado di prevedere un $y$ per ogni $x$ dato, dunque tale che $y = f(x)$. Per ogni $x_i$, indicheremo dunque con $y_i$ il dato nel training set e con $\\hat y_i$ il valore previsto dal modello.\n",
"\n",
"Ipotizziamo che il modello $f$ da costruire sia una funzione lineare, dunque geometricamente una retta $y = k_0 + k_1 x$, così che il modello è una funzione $y = f_{k_0, k_1}(x)$ a due parametri, $k_0$ e $k_1$, di cui occorre stimare i valori: si tratta di un problema noto in statistica come *regressione lineare*.\n",
"\n",
"Il problema è così semplice che, come è noto, potrebbe essere risolto per via analitica, con il metodo dei minimi quadrati, dunque assumendo che la retta migliore sia quella che minimizza la sua distanza euclidea con i dati $(x_i, y_i)$. Noi risolveremo però il problema per via numerica, costruendo una semplice rete neurale, da addestrare mediante i dati $(x_i, y_i)$, considerati come il *training set*.\n",
"\n",
"Importiamo prima di tutto i moduli Python necessari."
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"%matplotlib widget\n",
"from linearutils import get_params, plot, polyfit, train\n",
"import torch\n",
"import matplotlib.pyplot as plt\n",
"from matplotlib.animation import FuncAnimation"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Costruiamo sinteticamente il training set, che supponiamo generato dalla sovrapposizione di valori disposti su una retta e di valori casuali estratti da una distribuzione normale standard, dunque a media 0 e deviazione standard 1, e quindi rappresentiamolo graficamente."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "a888f7d81d6f4a8aad371f03caee64d2",
"version_major": 2,
"version_minor": 0
},
"image/png": "",
"text/html": [
"\n",
"