{ "cells": [ { "cell_type": "markdown", "metadata": { "id": "mWGJJFnQhflL" }, "source": [ "<style>\n", " .justified {\n", " text-align: justify;\n", " text-justify: inter-word;\n", " }\n", "</style>\n", "\n", "<div class=\"justified\">\n", "\n", "# Elementos de procesamiento de lenguajes naturales, parte II\n", "\n", "Siguiendo nuestra lección anterior, optimizaremos nuestro modelo de red neuronal para crear nombres. Ahora, lo haremos al estilo de Yoshua Bengio {cite}`Bengio2000`." ] }, { "cell_type": "code", "execution_count": 286, "metadata": { "id": "20vcSVe-RXia" }, "outputs": [], "source": [ "import torch\n", "import torch.nn.functional as F\n", "from torch import nn\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "import os\n", "import requests\n", "from pathlib import Path" ] }, { "cell_type": "code", "execution_count": 287, "metadata": { "id": "2wiy1BkyVoK6" }, "outputs": [], "source": [ "path = Path('data/')\n", "if not path.is_dir():\n", " path.mkdir(parents=True, exist_ok=True)\n", "\n", "with open(path / 'nombres.txt', 'wb') as f:\n", " request = requests.get('https://github.com/DanteNoguez/CalculusRatiocinator/raw/main/data/nombres.txt')\n", " f.write(request.content)" ] }, { "cell_type": "code", "execution_count": 288, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "I_nJ3lXeWVII", "outputId": "e644144c-8e42-4ce4-c026-054f43f84668" }, "outputs": [ { "data": { "text/plain": [ "['maria', 'rosa', 'jose', 'carmen', 'ana', 'juana', 'antonio', 'elena']" ] }, "execution_count": 288, "metadata": {}, "output_type": "execute_result" } ], "source": [ "nombres = open('data/nombres.txt', 'r').read().splitlines()\n", "nombres[:8]" ] }, { "cell_type": "code", "execution_count": 289, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "okwXbLowXOQl", "outputId": "9d63074e-d763-43cf-8573-b17d4b9bdb67" }, "outputs": [ { "data": { "text/plain": [ "21029" ] }, "execution_count": 289, "metadata": {}, "output_type": "execute_result" } ], "source": [ "len(nombres)" ] }, { "cell_type": "code", "execution_count": 290, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "FOuM5vdCXkVd", "outputId": "34adb3ca-d5ab-4714-e0d0-bd7cf79a8d27" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "{1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e', 6: 'f', 7: 'g', 8: 'h', 9: 'i', 10: 'j', 11: 'k', 12: 'l', 13: 'm', 14: 'n', 15: 'o', 16: 'p', 17: 'q', 18: 'r', 19: 's', 20: 't', 21: 'u', 22: 'v', 23: 'w', 24: 'x', 25: 'y', 26: 'z', 0: '.'}\n" ] } ], "source": [ "V = sorted(set(''.join(nombres)))\n", "paf = {p:f+1 for f, p in enumerate(V)}\n", "paf['.'] = 0\n", "fap = {f:p for p,f in paf.items()}\n", "print(fap)" ] }, { "cell_type": "markdown", "metadata": { "id": "n2O-rwNLp0YM" }, "source": [ "### Un modelo neuronal probabilístico de lenguaje\n", "\n", "Primero, comenzaremos dividiendo nuestros datos en «bloques». Por ejemplo, en nuestro modelo de bigramas, el bloque contenía un solo carácter, puesto que realizábamos la predicción a partir de una letra; pero podemos aumentar el «contexto» de nuestras predicciones para involucrar más letras al momento de predecir la siguiente. Veamos, por ejemplo, cómo luciría nuestro tratamiento de los datos si hiciéramos bloques de tres caracteres para predecir el siguiente:" ] }, { "cell_type": "code", "execution_count": 291, "metadata": { "id": "9N7EnXZTZgco" }, "outputs": [], "source": [ "def construir_dataset(nombres):\n", " block_size = 3 # longitud del contexto\n", " X, Y = [], []\n", " for n in nombres:\n", " #print(f'nombre: {n}')\n", " contexto = [0] * block_size\n", " for c in n + '.':\n", " ix = paf[c]\n", " X.append(contexto)\n", " Y.append(ix)\n", " #print(''.join(fap[i] for i in contexto), '----> ', fap[ix])\n", " contexto = contexto[1:] + [ix]\n", " \n", " X = torch.tensor(X) # contexto\n", " Y = torch.tensor(Y) # objetivo\n", " return X, Y" ] }, { "cell_type": "markdown", "metadata": { "id": "eH9gpAd8DT69" }, "source": [ "```{margin}\n", "“The training set is a sequence $w_1 · · · w_T$ of words $w_t \\in V$, where the vocabulary $V$ is a large but finite set.”\n", "```" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "q-tv_YsjwIfh", "outputId": "99a8c5e9-444b-40be-b3d9-e5fae9f15ced" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "nombre: maria\n", "... ----> m\n", "..m ----> a\n", ".ma ----> r\n", "mar ----> i\n", "ari ----> a\n", "ria ----> .\n", "nombre: rosa\n", "... ----> r\n", "..r ----> o\n", ".ro ----> s\n", "ros ----> a\n", "osa ----> .\n", "nombre: jose\n", "... ----> j\n", "..j ----> o\n", ".jo ----> s\n", "jos ----> e\n", "ose ----> .\n" ] }, { "data": { "text/plain": [ "(tensor([[ 0, 0, 0],\n", " [ 0, 0, 13],\n", " [ 0, 13, 1],\n", " [13, 1, 18],\n", " [ 1, 18, 9],\n", " [18, 9, 1],\n", " [ 0, 0, 0],\n", " [ 0, 0, 18],\n", " [ 0, 18, 15],\n", " [18, 15, 19],\n", " [15, 19, 1],\n", " [ 0, 0, 0],\n", " [ 0, 0, 10],\n", " [ 0, 10, 15],\n", " [10, 15, 19],\n", " [15, 19, 5]]),\n", " tensor([13, 1, 18, 9, 1, 0, 18, 15, 19, 1, 0, 10, 15, 19, 5, 0]))" ] }, "execution_count": 18, "metadata": {}, "output_type": "execute_result" } ], "source": [ "construir_dataset(nombres[:3])" ] }, { "cell_type": "markdown", "metadata": { "id": "dO_nn97fssxp" }, "source": [ "Nuestra intuición detrás de esta aproximación es que el lenguaje funciona mejor con contexto: así como el sentido de un concepto se entiende mejor en contexto, también los caracteres se pueden predecir más razonablemente dado un contexto más amplio. \n", "\n", "Similar a como habíamos hecho anteriormente, construimos una matriz `X` para contener el contexto como entrada y un vector `Y` que contiene el objetivo (es decir, carácter) que debe seguir a cada respectivo contexto. Como se puede apreciar, solamente estamos construyendo `X` e `Y` con sus respectivos índices del vocabulario.\n", "\n", "Dado que solo tomamos 3 nombres como ejemplo, nuestros datos únicamente contienen 16 contextos o *inputs* y 16 objetivos o *outputs*:" ] }, { "cell_type": "code", "execution_count": 292, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "UnQbjfrAvkdi", "outputId": "71f74b62-77a0-4efe-a8dc-4c25d272b68d" }, "outputs": [ { "data": { "text/plain": [ "(torch.Size([16, 3]), torch.Size([16]))" ] }, "execution_count": 292, "metadata": {}, "output_type": "execute_result" } ], "source": [ "X, Y = construir_dataset(nombres[:3])\n", "X.shape, Y.shape" ] }, { "cell_type": "markdown", "metadata": { "id": "0mwDZ-E5wpGu" }, "source": [ "Ahora estamos listos para hacer el *embedding*. Mientras que en el *paper* los datos se incrustan en una tabla de consulta de 30 dimensiones (o *features*) para un vocabulario de 17,000 palabras, nosotros —que únicamente tenemos un vocabulario de 27 caracteres— podemos aproximarnos a la incrustación con algo más pequeño, como una incrustación de dos dimensiones ($m = 2$)." ] }, { "cell_type": "code", "execution_count": 293, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "tGlTifYhzqv7", "outputId": "d83d47d5-b28d-481a-b689-dadfc4c44d95" }, "outputs": [ { "data": { "text/plain": [ "tensor([[ 1.1950, -1.6664],\n", " [ 1.0195, -0.4103],\n", " [-0.2143, 1.6073],\n", " [ 1.3569, 1.3905],\n", " [ 0.7943, -0.9118],\n", " [ 0.4180, 0.3789],\n", " [-1.1457, 0.4822],\n", " [-0.5390, -1.8550],\n", " [ 0.1015, 1.0336],\n", " [ 0.1822, 1.7465],\n", " [ 1.0465, 0.5108],\n", " [-0.3649, 1.3349],\n", " [-1.6279, -1.2823],\n", " [ 0.3673, -1.0746],\n", " [ 1.4023, -0.8277],\n", " [ 1.2148, -0.7885],\n", " [ 0.3532, -0.8317],\n", " [ 0.4932, 0.6096],\n", " [-1.4151, 0.7786],\n", " [ 3.8467, -1.3610],\n", " [ 1.9704, -0.0231],\n", " [-0.5216, -0.7434],\n", " [ 0.9543, -0.3574],\n", " [ 1.0646, -0.6760],\n", " [-0.2655, -0.1184],\n", " [ 2.4975, 0.1847],\n", " [-2.5699, 0.6519]])" ] }, "execution_count": 293, "metadata": {}, "output_type": "execute_result" } ], "source": [ "C = torch.randn((27, 2)) # tabla de consulta\n", "C" ] }, { "cell_type": "markdown", "metadata": { "id": "KXQ0eItb0cAM" }, "source": [ "Como vemos, cada *token* o elemento del volcabulario se incrustará en dos dimensiones, es decir, tendrá dos números asociados. Ahora, tomaremos un atajo que nos permitirá ser más eficientes con la codificación y la primera capa de la red neuronal. Anteriormente, habíamos hecho un *one-hot encoding* para luego pasarlo por una capa `W`; pero, bien visto, estos dos pasos pueden ser omitidos porque consiguen el mismo resultado que la incrustación en nuestra tabla `C`. \n", "\n", "Primero: la codificación *one-hot*, si fuéramos a multiplicarla por `C`, anularía todos los valores de `C` al multiplicarlos por 0 y conservaría una fila correspondiente a la de la multiplicación por 1. Ergo, podemos omitir la multiplicación y hacer una indexación para asociar directamente cada carácter con cada fila que un vector *one-hot* multiplicaría por 1. Dicho esto, podemos concebir a `C` como un equivalente de la capa `W`, puesto que consiste de valores aleatorios que asignan un número a cada carácter y luego pueden optimizarse con propagación hacia atrás.\n", "\n", "Dicho esto, la indexación (*embedding*) será bastante simple:\n", "\n", "```{margin}\n", "“A mapping $C$ from any element $i$ of $V$ to a real vector $C(i) \\in \\mathbb{R}^m$. It represents the distributed feature vectors associated with each word in the vocabulary. In practice, C is represented by a $\\left|V\\right| \\times m$ matrix of free parameters”.\n", "```" ] }, { "cell_type": "code", "execution_count": 295, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 37 }, "id": "AWRbIvaQAJbc", "outputId": "b4fda9e0-b821-41e0-cf39-a833e5b0f306" }, "outputs": [ { "data": { "application/vnd.google.colaboratory.intrinsic+json": { "type": "string" }, "text/plain": [ "'Segunda fila de C: [ 1.0194591 -0.41030166] | Tercer valor del tercer bloque incrustado (es decir, letra a): [ 1.0194591 -0.41030166]'" ] }, "execution_count": 295, "metadata": {}, "output_type": "execute_result" } ], "source": [ "emb = C[X] # embedding\n", "\n", "f'Segunda fila de C: {C[1].numpy()} | Tercer valor del tercer bloque incrustado (es decir, letra a): {emb[2][2].numpy()}'" ] }, { "cell_type": "code", "execution_count": 296, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "2wVT6iiNIale", "outputId": "6018f44f-0831-4c6b-975b-3af72e68023a" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Dimensiones del embedding: torch.Size([16, 3, 2])\n", "Tres bloques del embedding, correspondientes a «..m», «.ma» y «mar»: tensor([[[ 1.1950, -1.6664],\n", " [ 1.1950, -1.6664],\n", " [ 0.3673, -1.0746]],\n", "\n", " [[ 1.1950, -1.6664],\n", " [ 0.3673, -1.0746],\n", " [ 1.0195, -0.4103]],\n", "\n", " [[ 0.3673, -1.0746],\n", " [ 1.0195, -0.4103],\n", " [-1.4151, 0.7786]]])\n" ] } ], "source": [ "print('Dimensiones del embedding: ', emb.shape) \n", "print('Tres bloques del embedding, correspondientes a «..m», «.ma» y «mar»:', emb[1:4])" ] }, { "cell_type": "markdown", "metadata": { "id": "Mvh5GMkLIWsk" }, "source": [ "Ahora, echemos un vistazo a la arquitectura que deseamos lograr:\n", "\n", "```{figure} ../../img/bengio2003.png\n", "---\n", "width: 70%\n", "name: bengio2003\n", "---\n", "Arquitectura neuronal $f\\left(i, w_{t-1}, \\cdots, w_{t-n+1}\\right)=g\\left(i, C\\left(w_{t-1}\\right), \\cdots, C\\left(w_{t-n+1}\\right)\\right)$ donde $g$ es la red neuronal y $C(i)$ es el $i$-ésimo vector de cada palabra. En nuestro caso, utilizamos bloques de tres letras (`contexto`, vector `X`) en lugar de palabras ($w$).\n", "```" ] }, { "cell_type": "markdown", "metadata": { "id": "Ln__Tj3MQz1p" }, "source": [ "Como vemos, tenemos casi terminado el inicio y únicamente nos falta concatenar entre sí los bloques del *embedding*, puesto que juntos atravesarán la misma capa de neuronas.\n", "```{margin}\n", "“\\[...] $x$ is the word features layer activation vector, which is the concatenation of the input word features from the matrix $C$: $x = C\\left(w_{t-1}\\right), \\left(w_{t-2}\\right) \\cdots, C\\left(w_{t-n+1}\\right)$.”\n", "```\n", "Para conseguirlo, podemos utilizar distintos métodos con PyTorch:" ] }, { "cell_type": "code", "execution_count": 297, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "llevzXqoY8kG", "outputId": "1269073c-3523-4f13-c6c9-b40b8d7fc82d" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Ahora, en lugar de estar contenidos en bloques de tres filas: \n", "tensor([[ 1.1950, -1.6664],\n", " [ 1.1950, -1.6664],\n", " [ 1.1950, -1.6664]])\n", "Estarían contenidos en bloques de una fila (seis columnas):\n", "tensor([ 1.1950, -1.6664, 1.1950, -1.6664, 1.1950, -1.6664])\n" ] } ], "source": [ "metodo1 = torch.cat([emb[:, 0, :], emb[:, 1, :], emb[:, 2, :]], 1)\n", "print(f\"\"\"Ahora, en lugar de estar contenidos en bloques de tres filas: \n", "{emb[0]}\n", "Estarían contenidos en bloques de una fila (seis columnas):\n", "{metodo1[0]}\"\"\")" ] }, { "cell_type": "code", "execution_count": 298, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 37 }, "id": "NoRTuW6YaZox", "outputId": "b47cc42a-1797-4072-cd9f-3bb540a4f9ab" }, "outputs": [ { "data": { "application/vnd.google.colaboratory.intrinsic+json": { "type": "string" }, "text/plain": [ "'Aunque también es equivalente: tensor([ 1.1950, -1.6664, 1.1950, -1.6664, 1.1950, -1.6664])'" ] }, "execution_count": 298, "metadata": {}, "output_type": "execute_result" } ], "source": [ "metodo2 = torch.cat(torch.unbind(emb, 1), 1)\n", "f'Aunque también es equivalente: {metodo2[0]}'" ] }, { "cell_type": "markdown", "metadata": { "id": "BBMagWewbQ2-" }, "source": [ "Pero el método más eficiente[^1] y simple es `view`. Como primer argumento, colocaremos `-1` para que de esta forma PyTorch infiera el tamaño de la dimensión 0 que debería tener el tensor (sería, pues, equivalente a colocar `emb[0].shape`), y como segundo argumento `6` porque queremos que el tensor tenga las 6 columnas correspondientes a un bloque de tres *tokens*:" ] }, { "cell_type": "code", "execution_count": 299, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "PBCWB06samzE", "outputId": "67e761d7-b78b-4694-afc1-035b2bc5a023" }, "outputs": [ { "data": { "text/plain": [ "(tensor([ 1.1950, -1.6664, 1.1950, -1.6664, 1.1950, -1.6664]),\n", " torch.Size([16, 6]))" ] }, "execution_count": 299, "metadata": {}, "output_type": "execute_result" } ], "source": [ "emb.view(-1, 6)[0], emb.view(-1, 6).shape # esta es la variable x del paper" ] }, { "cell_type": "markdown", "metadata": { "id": "aQkp7vTli1RI" }, "source": [ "Ahora ya tenemos lo suficiente para definir más variables:\n", "\n", "> “Let $h$ be the number of hidden units[^2], and $m$ the number of features associated with each word. When no direct connections from word features to outputs are desired, the matrix $W$ is set to 0 . The free parameters of the model are the output biases $b$ (with $|V|$ elements), the hidden layer biases $d$ (with $h$ elements), the hidden-to-output weights $U$ (a $|V| \\times h$ matrix), the word features to output weights $W$ (a $|V| \\times(n-1) m$ matrix), the hidden layer weights $H$ (a $h \\times(n-1) m$ matrix), and the word features $C$(a $|V| \\times m$ matrix $)$: $\\theta=(b, d, W, U, H, C)$”." ] }, { "cell_type": "code", "execution_count": 320, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 37 }, "id": "wGjpIQCJTQHT", "outputId": "48fac1c7-c81f-4ccd-8323-cec4e7a8dcc3" }, "outputs": [ { "data": { "application/vnd.google.colaboratory.intrinsic+json": { "type": "string" }, "text/plain": [ "'Número de features (m), es decir, número de componentes de cada bloque: 2 | Número de elementos por bloque «(n-1)m»: 6 | Elementos de |V|: 27'" ] }, "execution_count": 320, "metadata": {}, "output_type": "execute_result" } ], "source": [ "f'Número de features (m), es decir, número de componentes de cada bloque: {C.size(dim=1)} | Número de elementos por bloque «(n-1)m»: {emb.view(-1, 6).size(dim=1)} | Elementos de |V|: {len(V)+1}'" ] }, { "cell_type": "markdown", "metadata": { "id": "YvTldl3y1cnp" }, "source": [ "El número de parámetros ($h$) depende del problema a tratar: generalmente, a mayor cantidad de datos, es mejor mayor cantidad de parámetros. En general, cuestiones técnicas como esta dependen de la evaluación experimental que hagamos de nuestro modelo: tras pruebas con diferentes números de parámetros, podemos elegir la que más efectiva y eficiente sea. En el *paper*, por ejemplo, probaron con 50 y 100 *hidden units*. Dado que por el momento solo estamos ejemplificando con tres nombres, $h = 50$ unidades serán suficientes.\n", "\n", "Por otra parte, fijar un valor de 0 a $W$ es igual que no utilizarla, de manera que omitiremos su definición porque no la necesitamos." ] }, { "cell_type": "code", "execution_count": 301, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "vn986Q_bRgr2", "outputId": "7905e35e-f4f1-42b7-dc7e-72037e798201" }, "outputs": [ { "data": { "text/plain": [ "torch.Size([16, 50])" ] }, "execution_count": 301, "metadata": {}, "output_type": "execute_result" } ], "source": [ "h = 50\n", "d = torch.randn((h))\n", "H = torch.randn((6, h))\n", "\n", "a = torch.tanh(emb.view(-1, 6) @ H + d)\n", "a.shape" ] }, { "cell_type": "markdown", "metadata": { "id": "CiZ4E0jsVs0F" }, "source": [ "Ahora, la capa oculta previa al *output*, es decir, la *hidden-to-output layer* se compone de $U$ y $b$, mientras que el resultado de esta capa son —el lector lo recordará— lo que llamamos *logits*, es decir, el resultado de la última capa de la red neuronal. Estos *logits* serán convertidos en probabilidades y, con ello, tendremos el *output* de toda la red. " ] }, { "cell_type": "code", "execution_count": 302, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "9ctI-j3zV2K0", "outputId": "87cc97c0-dc98-4d1d-c755-982d9782f021" }, "outputs": [ { "data": { "text/plain": [ "torch.Size([16, 27])" ] }, "execution_count": 302, "metadata": {}, "output_type": "execute_result" } ], "source": [ "U = torch.randn((h, 27))\n", "b = torch.randn(27)\n", "\n", "logits = a @ U + b\n", "logits.shape" ] }, { "cell_type": "markdown", "metadata": { "id": "vf6uqdGxf07U" }, "source": [ "Ahora, para convertir esto en probabilidades, haremos lo mismo que en la lección pasada:" ] }, { "cell_type": "code", "execution_count": 303, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "2UZCsFTOf4vc", "outputId": "fe61659c-7598-4cea-bc95-d09121fa3d77" }, "outputs": [ { "data": { "text/plain": [ "tensor(1.0000)" ] }, "execution_count": 303, "metadata": {}, "output_type": "execute_result" } ], "source": [ "counts = logits.exp()\n", "prob = counts / counts.sum(1, keepdims=True)\n", "prob[0].sum()" ] }, { "cell_type": "markdown", "metadata": { "id": "FOU_daFOf5_c" }, "source": [ "Para crear nuestra función de pérdida, necesitamos seleccionar nuestros objetivos (con base en el índice que nos dio `Y`):" ] }, { "cell_type": "code", "execution_count": 304, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "XesO8cnLgFsB", "outputId": "8dec22cf-4eba-4aa2-a488-2fbad6b7c2ea" }, "outputs": [ { "data": { "text/plain": [ "tensor([2.7201e-07, 1.4083e-02, 5.6987e-07, 3.5629e-07, 9.4318e-10, 4.6116e-08,\n", " 2.3890e-10, 9.0728e-04, 2.6708e-06, 2.7046e-05, 1.8723e-08, 2.6864e-07,\n", " 7.6290e-06, 8.3047e-06, 1.6912e-09, 1.4596e-08])" ] }, "execution_count": 304, "metadata": {}, "output_type": "execute_result" } ], "source": [ "prob[torch.arange(16), Y]" ] }, { "cell_type": "markdown", "metadata": { "id": "vAogwu906LYo" }, "source": [ "Ejemplifiquemos: si nuestro *input* es «mar» (`emb[3]`), nuestra probabilidad debe ser alta para que el número del *embedding* que represente la letra «i» de «María» sea un *output*:" ] }, { "cell_type": "code", "execution_count": 305, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "gzP5D6cn7C6-", "outputId": "7f8d6938-5562-4b40-d502-8bb24394500b" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "En un inicio, cada letra de «mar» correspondía a su índice en el vocabulario: tensor([13, 1, 18])\n", "Cuando pasamos estos índices a una matriz para que fueran representados por dos números, obtuvimos: tensor([[ 0.3673, -1.0746],\n", " [ 1.0195, -0.4103],\n", " [-1.4151, 0.7786]])\n", "Al mismo tiempo, la letra «i» fue guardada como objetivo en Y, siendo su índice: 9\n", "De manera que la probabilidad de nuestra red neuronal debe ser alta para el número que representa la letra «i» en el embedding: -3.5628877981253027e-07\n" ] } ], "source": [ "print(f\"\"\"En un inicio, cada letra de «mar» correspondía a su índice en el vocabulario: {X[3]}\n", "Cuando pasamos estos índices a una matriz para que fueran representados por dos números, obtuvimos: {emb[3]}\n", "Al mismo tiempo, la letra «i» fue guardada como objetivo en Y, siendo su índice: {Y[3]}\n", "De manera que la probabilidad de nuestra red neuronal debe ser alta para el número que representa la letra «i» en el embedding: {-prob[3, Y[3]]}\"\"\")" ] }, { "cell_type": "markdown", "metadata": { "id": "8_8s5YhMgrDD" }, "source": [ "Dado que no hemos entrenado la red, la probabilidad anterior es muy baja. Para poder entrenarla, formularemos la función de pérdida mediante el promedio del logaritmo natural de las probabilidades que la red neuronal asigna a cada objetivo, y finalmente hacemos de este un número positivo al multiplicarlo por $-1$, igual que en la lección pasada:" ] }, { "cell_type": "code", "execution_count": 306, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "t-V-YLiMg9Qi", "outputId": "d711c17f-9ba6-408c-8191-0661f1b86f43" }, "outputs": [ { "data": { "text/plain": [ "tensor(14.5898)" ] }, "execution_count": 306, "metadata": {}, "output_type": "execute_result" } ], "source": [ "perdida = -prob[torch.arange(16), Y].log().mean()\n", "perdida" ] }, { "cell_type": "markdown", "metadata": { "id": "MMDFftuZiZuJ" }, "source": [ "Usando PyTorch, podemos simplificar todo este proceso mediante el uso de `cross_entropy`:" ] }, { "cell_type": "code", "execution_count": 307, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "gHcV_mJPigMl", "outputId": "55c3a084-9acc-4439-b80c-6c34ee82ffcb" }, "outputs": [ { "data": { "text/plain": [ "tensor(14.5898)" ] }, "execution_count": 307, "metadata": {}, "output_type": "execute_result" } ], "source": [ "F.cross_entropy(logits, Y)" ] }, { "cell_type": "markdown", "metadata": { "id": "YccvWoeSutKG" }, "source": [ "Finalmente, agrupamos los parámetros —$\\theta$— en una variable:" ] }, { "cell_type": "code", "execution_count": 308, "metadata": { "id": "SozrJQzlu6Le" }, "outputs": [], "source": [ "parametros = [b, d, U, H, C]" ] }, { "cell_type": "markdown", "metadata": { "id": "5sMEdaOk9Syz" }, "source": [ "Indicamos a PyTorch que requeriremos gradientes para el entrenamiento de nuestros parámetros:" ] }, { "cell_type": "code", "execution_count": 309, "metadata": { "id": "zr_TdESFvm1p" }, "outputs": [], "source": [ "for p in parametros:\n", " p.requires_grad = True" ] }, { "cell_type": "markdown", "metadata": { "id": "jdrFZM0m9a7P" }, "source": [ "Finalmente, podemos entrenar la red:" ] }, { "cell_type": "code", "execution_count": 310, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "07Gi5EJpweFt", "outputId": "406185a2-86e6-417f-916d-c540323a7c99" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0.25268855690956116\n" ] } ], "source": [ "for i in range(100):\n", " # paso hacia delante\n", " emb = C[X]\n", " h = torch.tanh(emb.view(-1, 6) @ H + d)\n", " logits = h @ U + b\n", " perdida = F.cross_entropy(logits, Y)\n", " \n", " # propagación hacia atrás\n", " for p in parametros:\n", " p.grad = None\n", " perdida.backward()\n", " \n", " for p in parametros:\n", " p.data += -0.1 * p.grad\n", "\n", "print(perdida.item())" ] }, { "cell_type": "markdown", "metadata": { "id": "SrSZQ3lkEQLL" }, "source": [ "Bien, hemos conseguido un resultado decente en nuestro ejemplo. Ahora es momento de entrenar nuestra red con todos los nombres a la vez. \n", "\n", "### Optimización de modelos neuronales: conjuntos de datos, sobreajuste, tasa de aprendizaje y lotes\n", "\n", "Primero hacen falta algunos ajustes. Por una parte, evitaremos que nuestro modelo «memorice» o «sobreajuste» cada *output* correspondiente a cada *input* (a este sobreajuste se le llama *overfitting*), puesto que queremos nombres nuevos y originales y no una regurgitación de los que estamos utilizando. Para ello, se han desarrollado un número de técnicas en *deep learning*; pero de momento, utilizaremos una de las más elementales, y consiste en separar nuestros datos en tres partes: entrenamiento, validación y prueba. Entrenaremos nuestro modelo con una cantidad razonable de nombres (el 80 % de ellos), definimos nuestros parámetros —en rigor, hiperparámetros[^3]— con los datos de validación (10 % de nuestros nombres) y verificamos que el modelo sepa generalizar su aprendizaje con los datos destinados a las pruebas (último 10 % de nombres)." ] }, { "cell_type": "code", "execution_count": 402, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "N0zzO1IwdW5D", "outputId": "534a8dc0-99c5-4357-9f7e-bb5b9141e37f" }, "outputs": [ { "data": { "text/plain": [ "(torch.Size([165469, 3]),\n", " torch.Size([132418, 3]),\n", " torch.Size([16559, 3]),\n", " torch.Size([16492, 3]))" ] }, "execution_count": 402, "metadata": {}, "output_type": "execute_result" } ], "source": [ "import random\n", "random.shuffle(nombres)\n", "n1 = int(0.8*len(nombres))\n", "n2 = int(0.9*len(nombres))\n", "\n", "Xtr, Ytr = construir_dataset(nombres[:n1])\n", "Xdev, Ydev = construir_dataset(nombres[n1:n2])\n", "Xte, Yte = construir_dataset(nombres[n2:])\n", "X, Y = construir_dataset(nombres)\n", "\n", "X.shape, Xtr.shape, Xdev.shape, Xte.shape" ] }, { "cell_type": "markdown", "metadata": { "id": "HVvkgagZHBlO" }, "source": [ "Ahora definimos nuestros hiperparámetros, aunque esta vez utilizaremos $h = 100$:" ] }, { "cell_type": "code", "execution_count": 409, "metadata": { "id": "I0uqOeClM0bH" }, "outputs": [], "source": [ "C = torch.randn(27, 2)\n", "emb = C[Xtr]\n", "h = 100\n", "H = torch.randn((6, h))\n", "d = torch.randn(h)\n", "\n", "a = torch.tanh(emb.view(-1, 6) @ H + d)\n", "\n", "U = torch.randn(h, 27)\n", "b = torch.randn(27)\n", "\n", "logits = a @ U + b\n", "\n", "parametros = [C, H, d, U, b]" ] }, { "cell_type": "markdown", "metadata": { "id": "-7YQCEE9KIGl" }, "source": [ "Nuestro número total de parámetros resultantes es:" ] }, { "cell_type": "code", "execution_count": 404, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "MpijkcRINOUM", "outputId": "dc8b2199-dc89-4b76-d07a-37704e2303c6" }, "outputs": [ { "data": { "text/plain": [ "3481" ] }, "execution_count": 404, "metadata": {}, "output_type": "execute_result" } ], "source": [ "sum(p.numel() for p in parametros)" ] }, { "cell_type": "markdown", "metadata": { "id": "OyC-Cw1ILP6c" }, "source": [ "Por otro lado, podemos acelerar el entrenamiento de la red neuronal de la siguiente forma: en cada repetición del *loop* de aprendizaje, podemos seleccionar un «lote» (*batch*) o segmento de los datos para únicamente llevar a cabo el proceso de aprendizaje en ese mismo lote, de manera que el modelo no se entrene tomando siempre en consideración todos los datos a la vez, sino datos —en este caso, nombres— aleatorios en cada iteración. Aunque esto implique sacrificar en cierta medida el desempeño de la red neuronal, sin embargo ese sacrificio se compensa con la rapidez que podemos generar a cambio.\n", "\n", "Para crear estos lotes, podemos utilizar el siguiente código, el cual generará índices correspondientes a 32 nombres aleatorios de entre aquellos que pertenezcan a nuestros datos:" ] }, { "cell_type": "code", "execution_count": 391, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 37 }, "id": "8o2LeL14VhKw", "outputId": "74b4e7e5-2389-40ee-f38b-391f272ac2cd" }, "outputs": [ { "data": { "application/vnd.google.colaboratory.intrinsic+json": { "type": "string" }, "text/plain": [ "'Tres ejemplos: [123401 87687 70020]'" ] }, "execution_count": 391, "metadata": {}, "output_type": "execute_result" } ], "source": [ "ix = torch.randint(0, X.shape[0], (32,))\n", "f'Tres ejemplos: {ix[:3].numpy()}'" ] }, { "cell_type": "markdown", "metadata": { "id": "lIJn4uOiKLIm" }, "source": [ "Finalmente, nos falta tratar los detalles técnicos detrás de la *learning rate* («tasa de aprendizaje») del modelo. Recordemos que, cuando modificamos los parámetros en la dirección del gradiente, generalmente atenuamos al gradiente multiplicándolo por un número pequeño para así no excedernos en el ajuste, consiguiendo una pérdida cercana a 0 sin sobrepasarla.\n", "\n", "Para determinar una *learning rate* razonable, tenemos que averiguar empíricamente los «límites» de la misma:" ] }, { "cell_type": "code", "execution_count": 410, "metadata": { "id": "srB_AEmtMTQB" }, "outputs": [], "source": [ "for p in parametros:\n", " p.requires_grad = True" ] }, { "cell_type": "code", "execution_count": 393, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "ur8J9v32ZGRO", "outputId": "f4be0970-a36a-4116-febb-778f0ccca090" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "22.080612182617188\n", "18.37497329711914\n", "15.564812660217285\n", "15.621807098388672\n", "17.045852661132812\n", "18.507583618164062\n", "21.449209213256836\n", "21.56830596923828\n", "24.576093673706055\n", "15.103194236755371\n" ] } ], "source": [ "for _ in range(10):\n", " #minibatch («minilote»)\n", " ix = torch.randint(0, Xdev.shape[0], (32,))\n", "\n", " # propagación hacia delante\n", " emb = C[Xdev[ix]]\n", " a = torch.tanh(emb.view(-1, 6) @ H + d)\n", " logits = a @ U + b\n", " perdida = F.cross_entropy(logits, Ydev[ix])\n", " print(perdida.item())\n", " \n", " # propagación hacia atrás\n", " for p in parametros:\n", " p.grad = None\n", " perdida.backward()\n", "\n", " # actualización\n", " lr = -1 # intentaremos obtener el límite superior\n", " for p in parametros:\n", " p.data += lr * p.grad" ] }, { "cell_type": "markdown", "metadata": { "id": "VxEDRaeSCuy4" }, "source": [ "Como vemos, la pérdida disminuye con una tasa de aprendizaje de -1; pero al mismo tiempo indica que esta tasa es muy alta porque no es nada estable y se balancea hacia arriba y abajo. Este puede ser nuestro límite superior, busquemos el inferior:" ] }, { "cell_type": "code", "execution_count": 394, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "Dmlss8gdDGde", "outputId": "2adc40ed-146f-4357-c612-961d1384db4a" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "16.730724334716797\n", "19.113916397094727\n", "16.265771865844727\n", "16.343080520629883\n", "19.638389587402344\n", "17.050613403320312\n", "16.68904685974121\n", "23.818950653076172\n", "16.777978897094727\n", "20.498703002929688\n" ] } ], "source": [ "for _ in range(10):\n", " #minibatch («minilote»)\n", " ix = torch.randint(0, Xdev.shape[0], (32,))\n", "\n", " # propagación hacia delante\n", " emb = C[Xdev[ix]]\n", " a = torch.tanh(emb.view(-1, 6) @ H + d)\n", " logits = a @ U + b\n", " perdida = F.cross_entropy(logits, Ydev[ix])\n", " print(perdida.item())\n", " \n", " # propagación hacia atrás\n", " for p in parametros:\n", " p.grad = None\n", " perdida.backward()\n", "\n", " # actualización\n", " lr = -0.001 # intentaremos obtener el límite inferior\n", " for p in parametros:\n", " p.data += lr * p.grad" ] }, { "cell_type": "markdown", "metadata": { "id": "q1-XFmj8D-Rh" }, "source": [ "De igual forma, esta pérdida es subóptima porque es demasiado lenta para eficientar el aprendizaje, de manera que este puede ser nuestro límite inferior. Ahora, haremos una prueba de entrenamiento con tasas de aprendizaje que se encuentren dentro de estos límites; pero, para que nuestra tasa de aprendizaje no cambie lineal sino exponencialmente, podemos utilizar nuestros números como potencias de 10. Es decir, en teoría, nuestras tasas de aprendizaje serían mil números del 0.001 al 1:" ] }, { "cell_type": "code", "execution_count": 395, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 265 }, "id": "TFjsRBJDFHN9", "outputId": "93f0f1e9-5cd6-4201-86f5-234832a4f0ed" }, "outputs": [ { "data": { "image/png": "", "text/plain": [ "<Figure size 432x288 with 1 Axes>" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "lr = torch.linspace(0.001, 1, 1000)\n", "\n", "plt.plot(lr.numpy());" ] }, { "cell_type": "markdown", "metadata": { "id": "e4RzxflMGRlv" }, "source": [ "Pero $10^{-3} = 0.001$ y $10{^0} = 1$, de manera que utilizar este truco nos ayuda a obtener un cambio exponencial en nuestras tasas de aprendizaje. Ahora, nuestros 1000 números serán exponentes de 10 y lucirán así:" ] }, { "cell_type": "code", "execution_count": 396, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 265 }, "id": "BBz2E7b9R019", "outputId": "78a917e1-8925-4b1f-da75-837c6c5bdb6e" }, "outputs": [ { "data": { "image/png": "", "text/plain": [ "<Figure size 432x288 with 1 Axes>" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "lre = torch.linspace(-3, 0, 1000)\n", "lrs = 10**lre\n", "\n", "plt.plot(lrs.numpy());" ] }, { "cell_type": "markdown", "metadata": { "id": "hiOSxckvHGGr" }, "source": [ "Ahora, para elegir el número correcto en este rango, podemos registrar nuestras pérdidas correspondientes a cada tasa durante el entrenamiento:" ] }, { "cell_type": "code", "execution_count": 406, "metadata": { "id": "FZvwJ9N_KNN0" }, "outputs": [], "source": [ "lr_i = []\n", "perdidas_i = []\n", "\n", "for i in range(1000):\n", " #minibatch («minilote»)\n", " ix = torch.randint(0, Xdev.shape[0], (32,))\n", "\n", " # propagación hacia delante\n", " emb = C[Xdev[ix]]\n", " a = torch.tanh(emb.view(-1, 6) @ H + d)\n", " logits = a @ U + b\n", " perdida = F.cross_entropy(logits, Ydev[ix])\n", " #print(perdida.item())\n", " \n", " # propagación hacia atrás\n", " for p in parametros:\n", " p.grad = None\n", " perdida.backward()\n", "\n", " # actualización\n", " lr = lrs[i] # intentaremos obtener el límite inferior\n", " for p in parametros:\n", " p.data += -lr * p.grad\n", "\n", " # registrar estadísticas\n", " lr_i.append(lre[i])\n", " perdidas_i.append(perdida.item())" ] }, { "cell_type": "code", "execution_count": 407, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 265 }, "id": "NG28-zOEKOAS", "outputId": "4ff177dc-1a85-4927-ebf7-cac0e22f8baa" }, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXAAAAD4CAYAAAD1jb0+AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO2dd3wUdfrHP9/dbHpCIIRID1UIVYyFpiCICioW7OfhnfXEs54ep6Cc/rB7p57e2bDjHYrYACkiCCgtRCC0SAsQICS0FNK2fH9/7MzszOzM7mzNTvZ5v155ZWfmOzPf2fKZZ57v830exjkHQRAEYT4szd0BgiAIIjhIwAmCIEwKCThBEIRJIQEnCIIwKSTgBEEQJiUhmidr27Ytz8vLi+YpCYIgTM/GjRuPcc5z1OujKuB5eXkoLCyM5ikJgiBMD2Nsv9Z6cqEQBEGYFBJwgiAIk0ICThAEYVJIwAmCIEwKCThBEIRJIQEnCIIwKSTgBEEQJqXFCHhxWRW2lJ1q7m4QBEFEjahO5IkkV7yxGgBQ+vyEZu4JQRBEdGgxFjhBEES8QQJOEARhUkjACYIgTAoJOEEQhEkhAScIgjApJOAEQRAmhQScIAjCpJCAEwRBmBQScIIgCJNCAk4QBGFSSMAJgiBMCgk4QRCESSEBJwiCMCmmEfCqejsqaxqbuxsEQRAxg2kEfOhzy3DOzB+auxsEQRAxg2kEvK7JCQBwujhmr9sPu9MVtmOXlNfg4Im6sB2PIAgiGphGwEXmbDiIJ77aindX7Q3bMS95dSVGvrg8bMcjCIKIBqYT8OoGOwDgVJ1dc7sjjJY5QRBELGM6AWfCf8655vZXlv4Wvc4QBEE0I+YTcEHBdfQbxWVV0esMQRBEM2I+ARdscLl+Nzk8bhMOHWUnCIJoYZhOwLXoPe176bWLXOAEQcQJphNwfy4UssAJgogX/Ao4Y6wzY2w5Y2w7Y2wbY+wBYX0bxthSxtgu4X/ryHfXg55Q6wk7QRBES8OIBe4A8AjnPB/A+QCmMMbyAUwFsIxz3gvAMmE54lgEE1zfAicIgogP/Ao45/wI57xIeF0DYAeAjgAmAvhIaPYRgKsi1Uk5HheKngVOEk4QRHwQkA+cMZYH4CwA6wDkcs6PCJvKAeTq7HMXY6yQMVZYWVkZQleF4wn/RZlWCzbpN0EQ8YJhAWeMpQP4EsCDnPNq+TbuVlFN6eScv8M5L+CcF+Tk5ITUWaEfwnHdyy7VWV2k4ARBxAmGBJwxZoNbvGdzzucJq48yxtoL29sDqIhMF9V9cf8XBzHVgk3yTRBEvGAkCoUBmAVgB+f8H7JN3wKYLLyeDOCb8HdPoz/Cf48FTi4UgiDikwQDbYYDuBVAMWNsk7DucQDPA/icMXY7gP0Aro9MF1Uw5UxMtWCTfhMEES/4FXDO+Wp4DF81Y8LbHf8s23EUgEe4vQQ8QBPcpXaiA/i88CC+/vUQPrvz/KD6SBAEEQ2MWOAxxYoSMZJFxwceoAnu1NjhsblbgukaQRBEVDHdVHoRXR94gE4Up4YFThAEYQZagIBrrzcKhR0SBGFWTCvgImqfd6AGNVngBEGYFdMKuCcOXLm+ut6OZxfuMFz0mAScIAizYgoB14os+bywDL2f+B7lVQ2K9YdO1eOdlXvx3ebDho5NAk4QhFkxhYDP3Vimub7J6cK9szdqbnMYFGatKBQRrRBDgiCIWMEUAr7p4CndbafqtavT6wWuq/FVwYcGOAmCiGVMIeCNDn2VPVWnLeBG8WmBk34TBBHDmF7AQ8Xp9CXgnm1/nbsF1/7nFwDAkar6iPWHIAjCKKYQ8CaHM+zHPFrdAM45mnxEq8gFfE7hQWzcfxI//VaJoc/9iCXbysPeJ4IgiEAwhYCH2wLffrga5z27DJ+uOwCHDye4lgtl+2F3KvSiA/p+eYIgiGhgDgG3By7gYuEHLfYdOw0A+GX3MdgdHpVudDhx6asrpWWtQcwEi/u4Tl+jnwRBEFHAFMmsGsPsQhE0GC6VC6WiuhE7y2ukZZeL45O1+/Hy4hJpXYLVvbPdh++cIAgiGphCwBMTQntQWLr9KJwujkv7nwEAsEhWNLC3slZqpza4XRyY/vVWxboEq0XYlwScIIjmxRQulCfG5we8j9yBcufHhbjnU8+EH6vgXjnd6MCjstSxpcdPK47hy4Xiy3dOEAQRDUwh4JYQevnc9zt0j1fX5FCs//376xXLvgScXCgEQTQ35hBwHwOSeoi7vP3TXq9tf/2yGID/6fbnzlzmtc5GLhSCIGKEFivgx2ubMHDGYsW6X/YcAwBU1jQCCE6Exa4YzXZIEAQRKUwh4NYgerl273FUNyhdJDe/u06xHIyAi24VB7lQCIJoZkwh4L5iuvVYtrPCbxujGQvliIZ3MPsSBEGEE1MIeDAuFCOIE3oCgSbwEAQRK5hCwK0REvBgEC1wrSITBEEQ0cQUAm5Uv7PTEv22+d/6AyH1xVf6WX/MXrcfm33kNicIgggEUwi4OHPSH2lJ/ieWTp1XHFJfnIIJHoyMP/HVVkx88+eQzk8QBCFiCgE36kLpkJUc4Z4AYvCJPxfKvKIyVOlUCyIIgggHphBwgwY4bj6va2Q7As8gpi/53llejYc/34xHv9gc8f4QBBG/mELAjYYRJoWY9MoIUhihk2P/ce0olloh/ryytlFaR4OeBEGEG1MIuNWgCW6zRj5aRZzIs3r3MVz40gpUVDd4tREnCCXI+h1o3PifPt2IBVuOhNBTgiBaOqYQcKMulASLBe1bRdYPfqquSbH81LfbpNd/m7cFeVMXSAJutTC4XBwPz9mEjftPBnSe77eWY8pnRaF3mCCIFospBNyXCyU10Sq9TrAyLHrggoj25d1V+xTL328tlwT7v+sPAvCEGiZYLKisbcS8Xw/htg+UmQ7lfP3rIZxudOhuJwiC0MIUAu7LhfL2rWcjK9XmbscY0pOjX6PC7nQp8qqI7hKLhUlulAadsnAb95/Eg3M2KSx5giAII5hCwH25UCyMoXduBgB3BR2rheG1GwdHqWdu7E4XVu8+Ji07nd4+cDWn6prQYHeipsEdanhUw5dOEAThC5MIuL4QMnjixMUBxomDO0ajWxL1dqciR4pYrcdqYbozNwc/vRSX/2u1FI4odxO5KFEWQRAGMEVNTJ/JrJinwo5WBZ1ocO7MZWib7pnGL7pLrIx51dmUs7uiVgool19hKNP1CYKIH0xigfvaxpBic9+HoqV7GRpT9o/VeqJTHpyzCQBgtTLMKzrk81hcUHD5NTbXjYggCHNhegucAXj2mv7otjIVw3u2jUp/kmxW1BiIGkmwMLywaKdinfpmJHpelC6UkLtIEEQcYA4LXKV6bWRZBxljaJeRjCcm5Bue8BMq8tBFXyzXKCqh7qNoa8tXkwuFIAgj+BVwxtj7jLEKxthW2boZjLFDjLFNwt/4yHZTyTdThkuvo6TZChINTtlXl3QDvJ8mPO4SBs45Zq3eh/IqikghCMI/RlwoHwJ4A8DHqvX/5Jy/HPYeGSDJZkFGcgJqGhyGc4WHk8wQYs0ZAz4vPCgti/ptYe5BzWfmb8cXZ2SE2kWCIOIAv6Yk53wlgBNR6ItPpl+er1hmGq+MwFjoSa86tk4Naf/HZTnJxSRX+4/X4Tsh98mpOkpDSxCEf0JRsvsYY1sEF0vrsPVIh9tHdEPb9CRpWfSLB+pCufncLiH35e9X9gtpf7mPW3xVcrQGry/bBaB53EIEQZiPYAX8PwB6ABgM4AiAV/QaMsbuYowVMsYKKysrgzydxnE9xw983xAFso2B0m2+kI9RaoUMBnNNBEHEH0EJOOf8KOfcyTl3AXgXwLk+2r7DOS/gnBfk5OQE20/VQT0iF25rdXDnrPAeUAVTuXwo4IQgiGAJSsAZY+1li1cD2KrXNpzMmlyAq8/qiLbpSZJwqwVRRM+IZUx/n5vO7RIWF0sg1NudXuvIACcIwghGwgj/C2ANgDMZY2WMsdsBvMgYK2aMbQEwGsBDEe4nAGBQ5yz884bBgv+bCf3T6beP4+jt8+zV/ZGaZCzGO1jU5/7ol1KfbXaWV+PE6SavNgRBEH7j4TjnN2msnhWBvgSEKHL6ljbT9E/oWd8/PHwBGGOGCygHS12T0uKubvCOOJH38dJXVwEASp+fENF+EQRhPkwxE1MLvy4UH/tqbevZLryx130MxnIfPFEf8rkqahrwjyUllMWQIOIM0wo48+dC8aHgF+fnRqBHSowKuBZODSHmnINzjrV7j8PhVCZLeWzuFrz+424U6pRtW7DlCAr+bynsTkqyQhAtCfMKuCDQeomufA1uvjhpENb+bUykugYASLAG/9Y2OryF9vJ/rUa3vy3Eje+sleLFRUS3jJbwA8CM77bhWG0TTpIvnSBaFKYVcFG49Sztzm1SdPdNTLDgjFbJ+OHhyNXP9FWNxx+NDu/IlG2Hq6XXeypPa+6n916IXaEkWQTRsjCtgIvoyeR/7zwfZ3f1niAqbx+M3zvRoGVtC8EC75GTbrjt9W+vwfp97kwHevosDszqWegEQZgT0wq4JwpFW8LbZSZjXBC+bl++8wX3j8DPUy8CAMz/8wifxwklta1f6122WRRvX4hpB5o0XDMEQZgX0wq4PxcK4C5yDAC9cz0Wrb9p6r68DB1apSAnw52PpVWKzedxQkmY5W+wMZBbw8+7j6HspDvSpYkGMQmiRWFaAZcscB9txDwjVkt4LjPB6jmbP5E1mjNci81lVT63z99yRNNPzuF993nrpz3S60a77z43OVzYLvO1EwQR25hXwA204ZKAe9ZdMahD0OdMkN0I8rLTcMeIbhh1pnZ+F6O+8mB5b9U+Q+3kvnh/Fvgz87dj/OurcPBEXUh9IwgiOpiiJqYWogvF17CcqFeiBT6yV1uvgc2v7h1meHBPboFbLAzTLs/HtK+LNduKrpZI8cqSEry0uMRvO7k/3Z8PfKMQR15Vb0fn0LpHEEQUMK2AiyY49+G0Fl0oiVZ9e/2sLkpBH9GrLfp1yFSE7YloDS7qxaFPGNgeVgvDo3O36J47FIwGlCgscD8CTjEqBGEuTO9C8TXoKIr70B5tcduwPLw4aaDf42Yk27Dg/pHa59QQa71bQ1KCFdcVNL8da5PdvLQmCMkR3y+9mxJBELGFaS1wIy4U0Uq1WRhmhFhFRw+9qBabD6s/Ymi8GQkB+MBFSL8JwhyY1wIXREaroo0aSxAx2TcYtJ6H92yrud5XuKLNyvDajYMxspdy379d1sd4Bw0id6E4Xf4scPd/EnCCMAfmFXDBeeFLv++6sDtuKOiMycPyAj7+C5MGYulD/qfaX5yfi+IZ4wIuszZxcEev2ZpXDg4+QkYP+ZOAPwNcvBnq5ZEhCCK2MK0LhUmDmPptMpNteMGA31v/HMaELCPZ96QeoySEGK+u9VbIj+kv3SwNYhKEuTCvBS6IqxEXSrCInpf2rZIjUlBBHUETauy41lthS5BZ4H7eK7E/WhOCCIKIPUwr4G/efBZuOrcL+rbPjPi5jMyq1LPV5/95BD65Xbvmc6ZqOn5CiAOfb6/c47UuxeYpEfe3ecWaJdxERH2npFcEYQ5MK+Ddc9Lx3DUDQkoa5Q+7U4wjD+xtuufCHtLr/h1bYWQv7dmaT0/srxi4DFXAV+065pXzO9mmrPH51LfbdPcXZZuyzhKEOTCtgEcDceKLIQtcpr092xlLB9sqxYa7ZWJvC0POFrVLKRAXk+hCmblgB6rqvGt1EgQRW5CA+0AU5TMykw3v8/5tBbh2SMegzhdMuKM/Xlzkf7q9iCj1a/Yex8yF28PeF4IgwgsJuA/6dcjEMxP74ZXrB/ltO67fGQCA87plG45eEZn/5xGYGqYYcNF9vWpXJWobHQHtKzfW/c3aJAii+TFtGGE0YIzh1qF5hto+fWU/PDi2F9KStN/SXu3SsauiVnNb/46t0L9jq2C7qWD9vhPo0z4Dt85aH3DxZnn0CY1jEkTsQxZ4mEiwWtAuQ9/V8sU9QzFrckHE+zHlsyLUC0WON+pUqR/10nLN9fKJmpEMzyQIIjyQgEeJrNREDOyUFZVziYOuJ3Sq0JceN5Dvm/SbIGIeEvAoEsmQRzlGsglqxXrLJxaRBU4QsQ8JeBSxGJj+P6xHdsjnMSK+PR5f6DW1Xr5EAk4QsQ8JeBQxEib4zu8L8N19vivei+TrzELVqtepdWqHWsBli4u3HcWE11cZ6gdBEM0DCXgUMeLaSE9KwIBOnoiU2Xecp9t21Jk5GNvXO9Lkgf9tMnRuu9OFRz7fjF8PuAc71Va3VlUigiBiBxLwKGINItG2Xr5xwF31R2uW/26NcEWtU0//eiu+LCrD1f/+BQCNWxKE2SABjyLhLpQQSO4UrRzf8349pFgmtzdBmAsS8CgSaq1JdVZDm5UZzxxo4NS+CkQTBBF7kIBHETGMMNjKOyN75WDDE2Nx7ZBOANzFGtQDkXr4q0jfYHeSC4UgTAZNpY8iVgvDpicvRrrOdHsj5GQkIdnmvu/arAwOZ3hkt8/0RWE5DkEQ0YMEPMpkpQZWO1MLUbQTrBbNkEGCIOIDcqGYBHllHbuQtCTBEoAPnCCIFgdZ4Cbg2/uGI1eWk1y0wG1WC+wk4AQRt5CAmwB1EiyHaIFbGRzkQiGIuIVcKCbkkXFnYkiXLFzYOydsg5jBsO/YaZRXNTTb+Qki3vEr4Iyx9xljFYyxrbJ1bRhjSxlju4T/rSPbTUJOj5x0zLt3ODKSbUhOtOq2+99d50e0H6NfXoHzn1sW0XMQBKGPEQv8QwCXqtZNBbCMc94LwDJhmWgGOmbpF5HIyUgK+/k4515ZDAmCaB78CjjnfCWAE6rVEwF8JLz+CMBVYe4XYZDHLumDIV20C0XIc69MOrtTWM73ly+2oPvjC8NyLIIgQiNYH3gu5/yI8LocgG7xRcbYXYyxQsZYYWVlZZCniz9uG5aHQZ39V/DJa5uGefcO19wmt5Nbp9oAeBeV6JGT5vP4y0sq8OgXm6XlL4vKAICscMK01DTY0WB3Nnc3wkLIg5jcnUBD99fMOX+Hc17AOS/IyckJ9XRxw4wr++GbKdrCrEWrFJvXOnl6WCZY4+q4cX8y/IcPNuCLjWVe62tkFe9///56w/0kiOZmwIwlGP9ay8h1H6yAH2WMtQcA4X9F+LpEBEPR9Iu9kl3Jk1OFmghRPJbolamut0vbVv5GT1aEudh77HRzdyEsBCvg3wKYLLyeDOCb8HSHCBarhSHZpoxIyZRb5XoKbtATIhru6YnuqQOPyNwq4aDJ4UJdk8N/Q4IgJPxO5GGM/RfAKABtGWNlAJ4C8DyAzxljtwPYD+D6SHaSMMbgzlm4oaAzLu1/BnrlpqNdRjJ+ePhCVDfYsWTbUc19jHqyHS4XrBYrkmwW1DQC6/epx7VD4+p//4xth6tR+vyEsB6XIFoyfgWcc36TzqYxYe4LESI2qwUvTBqoWNezXToASAI+YWB71DU6MOrMdsjvkInH5m4xdOxw5FzZeqgK5VUNGJvvPeZN5dsIInBoKn2cIPqu89tnYsrontJ6o0UcHC4OzjmO1TZpbt9ZXo1vNx3Go5ecCcYYNh88hfwOmbDJar5d/q/VAEBWNkGECRLwOEF0gQdbdcfp5Fi165ju9uvfWoPqBge+3XwYo89sh0/W7gcAbH/6EqQm0teMICIB5UKJE0QLXK3fWnKel53qtc7h4jhZp219A4BdyMlSdrJeEm8AeGlxScB9JYhYxuF04eHPN2F3RU1zd4UEPF7QKmoMeAv6azcOhpa72+niUiy5Fi4dy76iptFwHwnCDOwsr8G8okOY8PpqHKtt3u83CXicIFngqvVctebC3jk4cKLOa3+70+UzllzPM3O6kUIDiZZFYoJbNhsdLox6aUWz9oUEPE7w+MCV69XLepa62wLXP76eBV7bQAJOxA7BjgHJSZQNzNc2s4FCAh5nqC1uNUznG+HwE0aot1XvC/7z7mPIm7oAO8spfJCIHpEsQdjocKK6we6/YRghAY8TRP+1PwPEojKzrzmrIwD3F9/Xd1/PAtf7wczfchgAUFh60neHCCKMOMNggesd49b31mPgjCUhHz8QSMDjBF0fuGqFhXl8fAAwpKu7Vse/ftyFJod++Ta934XWl51zjiaHe738XIGwaGs5Fm094r8h0aL5eE0pnvxmq992IuGwwPXcMOtL3bOT7aoyh0erG3DytH4EVyhQgG684ccCsTCGJQ9egA2lJ3Dl4A74ebc79nv+liOYvyVwwdRKO/vqD7vQ6HCn80xSCfi7K/fijpHdfEa8AMA9n24EQJOC4p0nv9kGAHh6Yn9D7UMV8HlFZfjq10OKdZ+sKUWD3SPaR6sb0Km1JxT3vGeXwWZl2DVzfEjn1oIEPE4QByf9fX0Zc+cYz2vrzhNutYT2kCb6zuU/nNeW7UIvYYq/fEAIAGYu3IHRfXLQs11GSOclCC1CFfCHP/dO4jZduImInDxtRydVkUl7hGrXkgslTtCdyKNaofaBJ1hCS0RbdrIeThf3SqDfKLhjEhMsOKF6vAyDm5IgNPE3GB8OmpxOHDxRh1W7Ip9mmQQ8TjCaTVYt4OoKPsGwoPiIl4A7BD9h6fE6DHlmqWKbP/cJQQRLNCpJNTpcuOiVFbh1VuQLnZCAxxn+wgjVeq22wG89v2vA53S6XGhQDYA2CY+UuytqvdqH46ZBEFpEwwJvdLgi5jJRQwIeJ1gs2mGEXhN5VNavukjE2V1Vzj0DfLf5CMpUszsdLrega1lEeyu9RZ0gwkEk48BFfEVrhRsS8DihTVqi4r9RMpOVtTbVUSNG+HFnBW7/qFCxzilYKFoWkbotQYQLuYDruVPeW7UXRQdOYtfRGuRNXYCfAiwZKBdwMYorUlAUSpxwQ0Fn2KwWXDW4g2J967RElFc36O6nLpacZAvunq+ekdko+MCdruhZKwQhNxjsLheSLFavNv+3YIf7/1Xu0MRFW8txYW/jBdnlAi4vmFLTYEdGsnfx8VAgCzxOsFgYJp3dCQmqsL0PbjtH+qJqkZ6svMcnJ3h/4YNBnOxgxFX48uKSgK0ggtBCnlzN4efLJ84utgaokk1ObaNk4/7wzzomAY9zzmiVjN/5GJhUDyjagpw5qUb0vRuxwN9YvhuT34/8iD7R8pGHrPoTcNHdYg0wKqpRFnF16FS99DoSg/Mk4IRfeuemS6/lUSmpiVZMvzw/pGPLZ7Bpb3f63E4QgPHwwONyAfdjPIgCbglQePUscBJwolkY1qOt9Fpe49JqYSH7sOub9AW69Nhp9Jm+SFpeu/c4Nh88FdL5iJaJ0SRVJ057CjBoDaDLJ7ZJLhQdC7xAJyJLzygJ1JI3Agk44Rf5lzrB6vkSWi0s5Ljaqnr99JtbD1cplm98Zy0mvvlzSOcjWiZGwwMbZeKqTjqlPo743bZatYX34Yt7a64vOqDt607QOU4okIATfpH/NBIsFuS3zwQA9D0jUwoH1OKGgs5+j739iH4+8Dof1jlByDEq4HZZO619HBphhnqWc2aKDX2F34Kc8irtqK5Q8wppQQJO+EWe69tmZZj/5xH47I7z8NatZ/t8dL16SMeQzuvLvSL1LQoTM4jYx+iToNzq1potqYgTF16K6SUWFiuzcVoYQ7XGE6TeRJ5IuFAoDpzwi/y3kWC1wGJhGNbT7Rf3NZIfaiKs003+y1U5XByJNPU+7jFqgTtkAq41iCk3SOSDmBtKT+De2UWKthYLUKfxHW3UE3AaxCSaA66ywOX4snwCHb1XU2Ognqa/SAIiPjD6PZBb3VrGh9wlKAp4goWhqs7b0rYypunmE3Pde7UnASeaA7mXxKby44lRKAM6tvLaL5RHxhOnm/CfFXs0tx2VzRyNRnIiIjaRu0OM3sflQq/13ZGvc0oTebS/x4wxTWu7US8KhQScaA7G9cuVXqtH0sXfkHyqsVgmLZAv7LQJfRXL6hSzcp6Zv1167W8yBtFy+eiXUum1Pwu8rskBu9Ol+L44NKJQ5OM94viKhTEEYovouVBCdSlqQQJO+OWiPh4Bt1m1LfAM2ZT7124YjGSbBZ1apxg+xx0juxtuq5gOTS6UuOWUzK3hzwee/+Ri3DprncKFojWIqYhCEcScMegIuKdtiixrJ03kIaJOssEkVWorQgzLSk30fIEvG9AeO5+5DGlJ3mPk5+Tpp6N95bpBhvpwWuZ3JAs8fpGPsRhxpa3de0LhdnG4XOCcKyfvaBzH6eJSSUI58qbtMpP8np8EnIgYqx67CD88fIHfduovoTgbLb+Ddzyslg98yuieusdun5Xs9/yA8hE1GvmdidhE/v0yHIUie2JrcrjwzPwd6Pa3hbLt3sfRC1WVjw0ZSfIWCQGnMEICAJCTkYScDP9WhLrgwzVDOmFoj2y0b+XtLhEtpDtGdMN7q/cB8HbBKNobdDTaZD8Erdl0RHwg/yr5EnC5hS13m3xZVIaFxeUAgIMn6tC5TaoiNURFjXva/dGaBvywrMLruC7O8cfh3bC57JQU+51otZALhTAXcvFunarMd1z6/ARMkyW8CoeAywdS1+87YbSbRAuDGbTA5YLqcLqQJrj7RPEGgJEvLheO49lv/hb3xJ1P1x7QzMGTk5GEJ6/Ix5d/GiYN3LdO08/3TblQiJhm9V9HY/lfRvlsI8aRJ2oIudpA0aselCALZZw6r1g33FCPkvIavLdqb0D7ELGH1aAPXD4z0uHiSNUYm/FsN+aeu+W8Lmib7nliFbvSOlW/4pVeTpVQIAEnwkan1qnI8vEFBjwhhimyQc97R/UA4O2e6dkuHVqoDZkXFu1EdYN+Uiw1E99cjf9bsIOm4ZscpQ9c35UmHzNZteuYZIFrYdSXrhZq8QaSlapvgVMYIWF6RBeKPGrl6rPcOVPU3++87FTNY2jlmhg4Ywl2aCTGWlFSgW82HVKsE9N96sXrErHB099tx5vLd+tuV0Sh+IhGUrs/UhO1LfAPft6HK98wlu3SO5zWfX5fFrhRF2Eg0CAmEVXE8aSURCsKp43F4VP16JWbAcD7Cy5/RJWzTsfvfd9nRVj04AWKH9dtH2wAAHTNTsPgzlkA3JaQw8XRYHcqngSI2OL9n3Ga3ZIAABcxSURBVN0D33qRS3KPhJNz2J0u/LizAuPycxVPc+oi2ak6n/nfv9uuuV4LW4IqpYRTtMD1BZwscML0iBV2UhOtaJuehIGdsqRtagPl0v5nYMKA9oaPvafyNHo98T0++qXUK8nQVbI84uIgaINOzgoieI7VNuLN5bsVkR/h5uCJOjTYnQofuNPF8eHPpbj7k41YUHwENQ12/HXuFuRNXeC1vy8fuFHUYzgeC9zHICYJOGF2erZLR05GEh6/rK/Pdr9MvQgDO2XhzVuG4LZheQGd46lvt+HOjwt1y7GJ+Vz8lXMjAuevc7fgpcUl+LLokP/GQeBycYx8cTmmzC5S3PEdLo4aYRzkt6O1mL3uAOYUHtQ8RorBSWu+ULtQ6oXvmt5TI+A9xhMOQroSxlgpY6yYMbaJMVbofw8i3klLSsCGJ8ZK6Wj1SJZNTQ7m0fPn3cc1/acVNQ2oEabiU73N8FMrvLd/+WKzbpuS8pqgJ2DZhcHKZTsrFFb+7R9uQJPgxjhW24gkH8W3fYWyGkV9DLFYcre2aV5txTGeSBAOC3w053ww57wgDMciYpQJA9pjUOcs/w3DhHxqf7CGi9ag5p0yfygJePjxN1D364GTuOTVlfhA8G9r4XJxTdcHoBysVBdfeOunPUIbF9JVbpIRPbXrugaLOq2yuJSb6T2b+OXrBmHH05eGfE4tyIVCGOLNW4bgmynDg95//IAz/LaRu02TZFOTg51s+cMO79lz+0/USa9DdaGcbnRE1NdrRvz5eTcJESF7j53WbaM3kxFQCrjeoKOFMUVWQQCKxGo2K8Pndw/12U9/nN89W7E85+6heOqKfHTM8p6RbLWwiA2WhyrgHMASxthGxthdWg0YY3cxxgoZY4WVlZUhno4wK/+6aQh2PmPcCpELAUd4RNLl4ooMdqEMYpYeO41+Ty3GnA3aftZ4xd/T0vFat6shx4evWCufdmHpCWwoPSG5UHxhsTCvm3Mr2eBigtWCc7u1wcd/PNfvsbTY+cyl6NxGGeKa3yETfxjeDa1Sbdj33PigjhsMoQr4CM75EACXAZjCGPPKhsQ5f4dzXsA5L8jJyfE+AhEXWC1M4df2xcBOyuIQcmPqk9uD+9EB3hV+GkNwoeyprAUALN5W7qdlfCG/8f5nxR6v6jTidl+35Eancp9dR2sw6a01uO6tNYayTzbYnZJPWqRVikfAxVw6F/TOwbNXD/B7PDX+njIiMVipR0gCzjk/JPyvAPAVgOB/XUTco/fTlD8OZyR7fogpNqs0i9MI9SrBrqxV/siPVjfgvVV7DblFxN8oOVCUyH3gLyzaiXmqaJRFW903PK3JWJxzfLJ2P77cqNzn4n+ulF6rJ2VpMa/oEF5btguAZywlK8UTn50QhA9c7hqJRE6TYAk6IJIxlgbAwjmvEV6PA/B02HpGxC3qn4dcwOURKRf1aYf0ZONf4bs/3ahYnv71VszZcAAAMP/PIzFldhEK959EeVWDIgGXdh8FS5IUXIF6EFM+mHikqh4lR2sAaNeN3Lj/JKZ/vdXn8Z/7fqfhviQmWKTPKS1JFtUURE6Sm8/rgpcWlwAIvdZrOAnFAs8FsJoxthnAegALOOeLwtMtgvAgjziTC8TpJodXjU5faGWU23qoGlsPuaNVTta5LXIx9a1I0YGTqKhpUO5IFrgmauP2y6Iy6YlG7pfepzGIGW7XQ1qiVbr5J9us+JPwtCb/zhgdXzm7q34hkuYkaAHnnO/lnA8S/vpxzmeGs2MEISJ3acgHo+oanUFZU1o02J3YU+kRlecW7sDw53/Esh1Hcc2/f8H411Yp2os3kqL9JxVFln2xZFs5DsqiYFoiagt8RUklVvzmDl6Qf44rSioVNS2B8E81b52WKMlzis0qPdnJvzP57b0LkagpnDYW53fPxrAe2X7bqtkyY1zA+wQChRESMYOe71kMPJg8tCs6ZqVI4Yx1dkdQ/kwtxBhikbdX7sWhU/V46tttAIBjKn+5KAG1jQ5c+upKqNlTWYvyKqWw3/XJRlzxxuqw9DcSOJwuzPh2G45U1Qd9DC0juq7R7S5Rf7rieyudP8z1TbPTEiV/dbLNKp1ffqM4q0trbJw21udxxNmV7992DtY/PiagPmQm60+tDwck4ETM0EUIzbrx3C6K9eJjsFi2TUxGVNfkDNuAkjpqQUQvVlx+2pN13qlsx7zyE85/bpm0LFYOOqXR1gifrt2PvKkLpOnikWDt3hP48JdSPD6vOOhjaEWJMOYetPxcZ2q7SLizQ+6pPC1NuEm2WaTxCrWrJlsjpFGrOlWyzYp2GhN19OhrwLoPFRJwImbITk9C6fMTcJOXgLv/iz88MSSsXUaSImnVpLM7BX3uWlWIocix2kbN9VpC9dm6A7jknyu9EmkB7puNL8a/tgqfrCnV3f7Oyr1Cf7RvNOFAtIBDqROtN0X+7Z/24O2fvItoyNtrVYk3Qu9c7bzxQ7pkSbMuU2xW6QlPa7aoWrBDdecUzxiHr+4dFtIxjEACTsQ84kCT+MNrl5mMf98yBG/ePATV9W6L9PdDuyLXQGVwPQ4bcBtMfGM1pswugsvF8YcPN3htn7V6L0qO1qC4rEpaN2V2EeqaHH6n7W8/Uo3p32zT3e6SxMdvN4NGtFDl5+CcY9vhKlTV2/HjzqOa+y3ZVo4FQvmx1hpVlBg8cfNqxNwpACQLfXCAKRsWP3gBnrw8Hz89OgqDZHMIJg/Lk/zdSQlWaYaneho8ANysMhpCzd2dkWwzPO8hFEjAiZhHjADokeNJFDR+QHtkpyehWrCcu2anKUL65FOnjbC7Qn9qt8jmsiosKD6CU/XabgyxKos83nxB8REs2XZUssBtVoaqOju2HqrSPMaXG8sUy4WlJ+B0cal6ULBWKuAO3fNVhUi8Ucqla2FxOSa8vhqD/r4Ef/ywEBXVDZi7sQxvC2MG931WhLs+2YgpnxXhwpeWY66q/wB8uk5qGuz4eE0pftl9TLoJTL88H/eP6WXomv5+ZT8wxvDHEd3QNTtNUawh2WZFmmxZvIlqTWt/cGwvrP7raNwxohvm3HV+2AbHIw0JOBHz3HxuF6x8dDTO6uIdyjWylztJ0dDu2YqY8Keu6IfCaWMx8+r+hs5xrLYRHbNSsMJPTU8AePIb71hll4vDLvhw1dZ2ss0quVXsTo5BTy/B5f9ajee+34GH5mxSuBEekWXxKyw9gUlvrcEbP+6Wbg5aE2CMcua0RXh07hbNbTUNdunmILc+D55URs00Olz4yxebpXhssfAvAOw/7m4rn/UIAMtLKlGlc9NbWHwET36zDTe/t05al5Vqw8MX95Zya18xqIPuNU1WpRo+ftrj8kpOsOLdyQW4Y0Q3dGqdgnrhJpqiYRkzxtCpdSqmXZ6P87pnS2Mrix4cqXvuWIAEnIh5GGPoolNebUzfXOyaeRnyO2TijhHdPfvAHT0wSFYwYtOTF+NrHwm5+nfMRJ5GOlA1ctESufm9tTgsRJ3c82mRYpvVwiTxkPP2T3vx1a+HUFJeo3meQ6fcbp1dFTWSC6W20QFHsNm94I7L1mLAjCX482e/AvCMNfx2tAbJqrSs8v21JuMAnrqncvSeWsqrvMcYxGIJ4o3tkn65mvtqIb/BpSRa0CMnHdMuz4fFwqQnIy0BVyNO1omlWZdakIATpkccqEpMsOB357t9maI13is3HUO6ZGHuPUORlZro8wfZJi14H/ravdpl3gBgzoYDmPTWGt3t419f5bWuvsmJ5Tvd2RStFiaJ2fVvr8GdHxdiRUkFft59zHD/5L7mG95W9kV0q4g+YsaAw6fqMe6fKzFDlfHvuGwQVe+atQYA9SxwrdBB8QYgPpjIp8H7442bh0iv5RktAU9EkRHf9Iwr+iEvO9UraVWsQQJOtCimTcjHazcOxnnd2gBw/4jn3TscBXnuZV+JiNqkuR/ZF94/0mdllUDRSmvrC845pn29FV9vOgzAbQXKQxWXl1Titg824Jb31uHRLzajrsmBES/8iLV7jyuOc/cnhch/chF2HKlG/6cWS+vX7TsBzjlKhdmQ6qyMFgbdyUly37DeDURrALCyWjuaRyvKR7wBiDct0SWjZdmr6d+xlTQIqxZq8aaemeI/NntEr7ZY8ejoqAxEhgIJONGiSLZZMXFwR91p2b4Gp8SK4vkdMqWY8+agwe5SuCp85cf+YmMZSsprUHayHs8u3KHYtlgYPF2z57jXfv9esQejXl6BNXuOe7l3GJhuTPb3xZ7si1oFM/SoadQO06zQEHZxcpZTcBt1bZuKQZ1aYdbkAgzo2MqrvRpxIFMt+DOv6o9nJvbDkC7RK0wSaUjACUIgO93zqP7KdYMCKqgcTspV1q+e+0FEtJblselTPvP44Z+e7134QEzMdNO7a3FUJaKLtpVjYbG3n1/dNy3xBdy+++1PX4Kxfdv57DcAFO4/qVj+6t5hksXdWYgkSk6w4pv7RmBkrxx8fvdQFE2/2Ocxp03oi0SrBWmqaJOs1ETcOjQvquleIw0JOBFXaA0miogWOOCe2PHmLUMwLt/4AFq4OHRSGZPuT8DFQdPjpxtRUl6DJodLCskzglzsRT5es9/nPolWi3eCLxmpiQn4z+/OlpazUm24/6KefvsijzT67M7z8dbvzlZY0imJVrRJS8R53drgsv7aVZ5uPLcLfpt5WdjSLMQyLf8KCUKGOOPuOtmsTdFn2r2t94y+PlGYDq3md7PWKZb9CbjI0epGXPLqStz2wfqAzqeVGdAfORlJmikE5NisFtw32i3ap+rseHBs74DOkZuZjEt1RHrO3UMVN4h4hQSciCs6ZKWgaPrFeHHSQGndHSPd4Yed23hP/pEXVwaAPmdkIFtjtuGsyQW4qI9/l0EwiPHVRvlFw+cdbuTuprsv7K7bTv6e6uXRnnGF79zrhD4k4ETc0SYtEYwxtBVE6PHxfbHvufGavtE/DOumWP77lf2QJDzSf/knT2HcMX1z8f5t5xg6v9aNwmzIJ+uow/zuGOF5z64v6Ky5//onPFn9LtGxsgn/BF2RhyDMzsrHRkszHPUGtlISrWidapPcBamJCUgSQssSAigm8fj4Pnh2oXv24qzJ52DcP71T0EabYT2yDVnrX907DKfq7FhRUoGPBN+4vNKOXMw3PzUOmbIZseL7KmaQfGBML9isTDHFPTkhtkP1YhkScCJukefN8IXc12u1MMkCt1oY0pMSFJNk9Ljrgh7YW3kaRQdOonduhjvr4jtrsUYVu136/AR89WsZHpqz2esY5+a1wfpS/QlDWuyaeRlsVgtueW8tft6tPJd6yruamVf3x0V92qF9K/cTw+g+7ZDbKhm/7D6umNAjT2GQnpTgdTNc//gYabLVQxe7/eBijPe9o3po5iYhjEEuFILwwwvXeiqXWyyQBNzh4vjp0VH48ZELdfcd1iMb3YTp+c9fOxBLHvK0zUxxC5+od9/dNwIAcPVZ3mlx27dKxqzbCvD9A75zc/Rsl46rBntyh8jTqarxJ+AX982VxFvk3lE98ekd5ymyN8qPrTVRql1msleWQquFYd9z4/HoJWdK7ycROGSBE4QfbjinC3IykvDQnM3o2iZNCmtrtDuRnZ6kKAjAmDst64uTBqKyphFTRuuHzj13zUAM73kYF/bOQUl5DQZ08p6k8sPDF2DsP1bird+djYxkG/q2t6F9q2QcqWrABb1zsPK3Stw/phdeF6qwz77jPLRKsaG20aHI6CefUdjnjAzsLK+RxB0AHr3kTCk2/IVrB2Dp9gqfxQtevm4QbnxnLQDPDW1Ez7b6b6IGckv98oHtcaWPpFWENiTgBGGAi/rkYvNT7vqGt4/ohg2lJ9GjnXfY4Zm5bnHs1yET/Tr4njXYJi0Rvx+aB8CdDlfOtAl9UVnTiJ7t3O4WOT8+MgoOlws2qwWnGx3ITk+SBDzZZkWyzYr3JisHVEUf9PPXDEBdkxNPz9+usJbvHNldEvAbzumCG85R5sdWc373bFw5qAO+3XwYuYLQ99IprGAEeQ4Twjgk4AQRIJf2b+8lqiLvTS7AGz/uRu/cjJDOIYY2auH2GbsFWZ2rQy/Tnri+we6UFYfwCHhiggXnd28DBuOzFF+9YTD+cf0gJFgtmHvPUM0nCCKykIATRBjp1DoVz1870H/DMPPe7wswe91+zWozAPDA2N44VW/HpILOmCsUWEhJdGdvTLS6xf1/dw3V3FcPi4XBIgi+mCyMiC5MrxJ4JCgoKOCFhYVROx9BEN402J34x9Lf8MCYXkhLIhvODDDGNnLOC9Tr6dMjiDgj2WbF4+P7Nnc3iDBA8TsEQRAmhQScIAjCpJCAEwRBmBQScIIgCJNCAk4QBGFSSMAJgiBMCgk4QRCESSEBJwiCMClRnYnJGKsE4Ltaqj5tARwLY3eaE7qW2KOlXAdA1xKrhHItXTnnOeqVURXwUGCMFWpNJTUjdC2xR0u5DoCuJVaJxLWQC4UgCMKkkIATBEGYFDMJ+DvN3YEwQtcSe7SU6wDoWmKVsF+LaXzgBEEQhBIzWeAEQRCEDBJwgiAIkxKzAs4Ye4YxtoUxtokxtoQxplmymjE2mTG2S/ibHO1+GoEx9hJjbKdwPV8xxrJ02pUyxoqFa47J0kUBXMuljLESxthuxtjUaPfTH4yx6xhj2xhjLsaYbmiXST4To9cS058JADDG2jDGlgq/56WMsdY67ZzCZ7KJMfZttPuph7/3mDGWxBibI2xfxxjLC+mEnPOY/AOQKXt9P4C3NNq0AbBX+N9aeN26ufuu0c9xABKE1y8AeEGnXSmAts3d31CvBe6Ku3sAdAeQCGAzgPzm7ruqj30BnAlgBYACH+3M8Jn4vRYzfCZCP18EMFV4PdXHb6W2ufsazHsM4F5RywDcCGBOKOeMWQucc14tW0wDoDXaegmApZzzE5zzkwCWArg0Gv0LBM75Es65Q1hcC6BTc/YnFAxey7kAdnPO93LOmwD8D8DEaPXRCJzzHZzzkubuRzgweC0x/5kITATwkfD6IwBXNWNfAsXIeyy/vrkAxjDGtCtRGyBmBRwAGGMzGWMHAdwC4EmNJh0BHJQtlwnrYpk/AvheZxsHsIQxtpExdlcU+xQsetdixs9FD7N9JnqY5TPJ5ZwfEV6XA8jVaZfMGCtkjK1ljMWKyBt5j6U2giFUBSA72BM2a1FjxtgPAM7Q2PQE5/wbzvkTAJ5gjP0NwH0AnopqBwPA37UIbZ4A4AAwW+cwIzjnhxhj7QAsZYzt5JyvjEyP9QnTtTQ7Rq7DAKb5TMyCr2uRL3DOOWNML865q/C5dAfwI2OsmHO+J9x9jXWaVcA552MNNp0NYCG8BfwQgFGy5U5w+wGjjr9rYYzdBuByAGO44ADTOMYh4X8FY+wruB/Joi4WYbiWQwA6y5Y7CeuiSgDfL1/HMMVnYoCY+EwA39fCGDvKGGvPOT/CGGsPoELnGOLnspcxtgLAWXD7n5sTI++x2KaMMZYAoBWA48GeMGZdKIyxXrLFiQB2ajRbDGAcY6y1MFo9TlgXUzDGLgXwGIArOed1Om3SGGMZ4mu4r2Vr9HppDCPXAmADgF6MsW6MsUS4B2tiJlLAKGb5TAxils/kWwBiNNlkAF5PF8LvPUl43RbAcADbo9ZDfYy8x/LrmwTgRz2DzhDNPXLrY0T3S7h/LFsAfAego7C+AMB7snZ/BLBb+PtDc/db51p2w+332iT8iaPQHQAsFF53h3vUejOAbXA/Gjd734O5FmF5PIDf4LaKYu5aAFwNt4+yEcBRAItN/Jn4vRYzfCZCH7MBLAOwC8APANoI66XfPYBhAIqFz6UYwO3N3W9f7zGAp+E2eAAgGcAXwu9oPYDuoZyPptITBEGYlJh1oRAEQRC+IQEnCIIwKSTgBEEQJoUEnCAIwqSQgBMEQZgUEnCCIAiTQgJOEARhUv4f13tgyV/NtVwAAAAASUVORK5CYII=", "text/plain": [ "<Figure size 432x288 with 1 Axes>" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.plot(lr_i, perdidas_i);" ] }, { "cell_type": "markdown", "metadata": { "id": "WfGI0APWPD1F" }, "source": [ "En el gráfico podemos apreciar que nuestra tasa de aprendizaje óptima —es decir, la que mejor minimiza la pérdida— se encuentra alrededor de $10^{-1}$ (es decir, $0.1$), de manera que podemos utilizar esta tasa con mayor confianza para entrenar todos nuestros parámetros con los datos de `Xtr`." ] }, { "cell_type": "code", "execution_count": 411, "metadata": { "id": "qUhPiHU9SIDF" }, "outputs": [], "source": [ "paso_i = []\n", "perdidas_i = []\n", "\n", "for i in range(1000):\n", " #minibatch («minilote»)\n", " ix = torch.randint(0, Xtr.shape[0], (32,))\n", "\n", " # propagación hacia delante\n", " emb = C[Xtr[ix]]\n", " a = torch.tanh(emb.view(-1, 6) @ H + d)\n", " logits = a @ U + b\n", " perdida = F.cross_entropy(logits, Ytr[ix])\n", " \n", " # propagación hacia atrás\n", " for p in parametros:\n", " p.grad = None\n", " perdida.backward()\n", "\n", " # actualización\n", " lr = 0.1 # nueva tasa\n", " for p in parametros:\n", " p.data += -lr * p.grad\n", "\n", " # registrar estadísticas\n", " paso_i.append(i)\n", " perdidas_i.append(perdida.item())" ] }, { "cell_type": "code", "execution_count": 413, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 265 }, "id": "GW2pHmdef7qi", "outputId": "cb4b2fdc-dc7a-4c69-dfb6-fc6c99cba399" }, "outputs": [ { "data": { "image/png": "", "text/plain": [ "<Figure size 432x288 with 1 Axes>" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.plot(paso_i, perdidas_i);" ] }, { "cell_type": "markdown", "metadata": { "id": "gTxEGBDQSwo7" }, "source": [ "Debido a que entrenamos nuestros parámetros en lotes, la función de pérdida tiene algo de ruido cuando se acerca a su valor mínimo. Comprobemos ahora la pérdida que tenemos en `Xdev`:" ] }, { "cell_type": "code", "execution_count": 414, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "SlcEcHzPSu9q", "outputId": "97eac106-8da5-4a67-eb1f-84541b52068c" }, "outputs": [ { "data": { "text/plain": [ "tensor(2.4327, grad_fn=<NllLossBackward0>)" ] }, "execution_count": 414, "metadata": {}, "output_type": "execute_result" } ], "source": [ "emb = C[Xdev]\n", "a = torch.tanh(emb.view(-1, 6) @ H + d)\n", "logits = a @ U + b\n", "perdida = F.cross_entropy(logits, Ydev)\n", "perdida" ] }, { "cell_type": "markdown", "metadata": { "id": "o_NQDww9TZ1c" }, "source": [ "Finalmente, podemos visualizar cómo luce nuestro *embedding* ahora que ha sido entrenado:" ] }, { "cell_type": "code", "execution_count": 428, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 483 }, "id": "8EANrk6BTrlM", "outputId": "7d03f486-7325-4402-cd02-6405698f38d6" }, "outputs": [ { "data": { "image/png": "", "text/plain": [ "<Figure size 576x576 with 1 Axes>" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.figure(figsize=(8,8))\n", "plt.scatter(C[:,0].data, C[:,1].data, s=200)\n", "for i in range(C.shape[0]):\n", " plt.text(C[i,0].item(), C[i,1].item(), fap[i], ha='center', va='center', color='white')\n", "plt.grid('minor');" ] }, { "cell_type": "markdown", "metadata": { "id": "PTpjDaqmVrBB" }, "source": [ "Como vemos, las vocales —junto con la «y», aunque sin la «i»— aparecen agrupadas entre sí: esto quiere decir que nuestro modelo las interpreta como letras similares. Lo mismo aplica para las consonantes.\n", "\n", "Hasta el momento, no hemos conseguido mejorar nuestro modelo anterior. En la práctica, la optimización de modelos se hace con un número de pruebas que contengan hiperparámetros distintos. Podemos, por ejemplo, aumentar nuestros parámetros, nuestro *embedding*, nuestras capas, probar nuevas tasas de aprendizaje, entrenar el modelo por más tiempo, etcétera. Intentemos hacer un poco de todo para finalizar esta lección:\n", "\n", "### Ensayo de un modelo con hiperparámetros óptimos" ] }, { "cell_type": "code", "execution_count": 445, "metadata": { "id": "mJea2Woegj5H" }, "outputs": [], "source": [ "random.shuffle(nombres)\n", "n1 = int(0.8*len(nombres))\n", "n2 = int(0.9*len(nombres))\n", "\n", "Xtr, Ytr = construir_dataset(nombres[:n1])\n", "Xdev, Ydev = construir_dataset(nombres[n1:n2])\n", "Xte, Yte = construir_dataset(nombres[n2:])\n", "X, Y = construir_dataset(nombres)\n", "\n", "C = torch.randn(27, 10) # un embedding de 10 dimensiones\n", "h = 200 # aumentamos las unidades ocultas a 200\n", "H = torch.randn((30, h)) # recordemos: 10 * 3 = 30\n", "d = torch.randn(h)\n", "U = torch.randn(h, 27)\n", "b = torch.randn(27)\n", "\n", "parametros = [C, H, d, U, b]" ] }, { "cell_type": "code", "execution_count": 446, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "WcrQYS_Lg-m-", "outputId": "189c674b-fad4-4ca1-d3d6-caf7e85129fa" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "1.7781141996383667\n" ] } ], "source": [ "for p in parametros:\n", " p.requires_grad = True\n", "\n", "for i in range(15000):\n", " #minibatch («minilote»)\n", " ix = torch.randint(0, Xtr.shape[0], (32,))\n", "\n", " # propagación hacia delante\n", " emb = C[Xtr[ix]]\n", " a = torch.tanh(emb.view(-1, 30) @ H + d)\n", " logits = a @ U + b\n", " perdida = F.cross_entropy(logits, Ytr[ix])\n", " \n", " # propagación hacia atrás\n", " for p in parametros:\n", " p.grad = None\n", " perdida.backward()\n", "\n", " # actualización\n", " lr = 0.1 if i < 14000 else 0.01 # nuestra tasa de aprendizaje disminuirá hacia el final del entrenamiento\n", " for p in parametros:\n", " p.data += -lr * p.grad\n", "\n", "print(perdida.item())" ] }, { "cell_type": "markdown", "metadata": { "id": "vFEC-VhliHVW" }, "source": [ "Finalmente hemos superado al modelo anterior con fuerza bruta. Aunque podríamos seguir ajustándolo, me parece que esto será suficiente para obtener mejores muestras de nombres. Revisemos la pérdida de nuestros `Xdev` y `Xte` para cerciorarnos de que nuestro modelo haya generalizado sus aprendizajes, en vez de memorizarlos:" ] }, { "cell_type": "code", "execution_count": 448, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "VJcK54eTPpTo", "outputId": "70af0d4e-cab5-4cce-a2f1-31dcfa00656e" }, "outputs": [ { "data": { "text/plain": [ "tensor(1.9739, grad_fn=<NllLossBackward0>)" ] }, "execution_count": 448, "metadata": {}, "output_type": "execute_result" } ], "source": [ "emb = C[Xdev]\n", "a = torch.tanh(emb.view(-1, 30) @ H + d)\n", "logits = a @ U + b\n", "perdida = F.cross_entropy(logits, Ydev)\n", "perdida" ] }, { "cell_type": "code", "execution_count": 449, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "B6qHnZwVkDqn", "outputId": "f68ffdc3-23c7-4f48-b00a-c13c4e102b33" }, "outputs": [ { "data": { "text/plain": [ "tensor(1.9782, grad_fn=<NllLossBackward0>)" ] }, "execution_count": 449, "metadata": {}, "output_type": "execute_result" } ], "source": [ "emb = C[Xte]\n", "a = torch.tanh(emb.view(-1, 30) @ H + d)\n", "logits = a @ U + b\n", "perdida = F.cross_entropy(logits, Yte)\n", "perdida" ] }, { "cell_type": "markdown", "metadata": { "id": "P9gJFQCBkJcp" }, "source": [ "Tenemos también pérdidas razonables para ambos conjuntos de datos. Conforme la pérdida del entrenamiento difiera más de las otras dos (`Xdev` y `Xte`), esto indicaría que nuestros parámetros están memorizando los datos, no generalizándolos. En ese sentido, debemos ser cuidados de no sobreentrenar, ni tampoco sobredimensionar el modelo, puesto que si nos excedemos, terminará memorizando todos nuestros datos.\n", "\n", "Para finalizar, obtengamos algunas muestras de nombres generados por nuestro modelo:" ] }, { "cell_type": "code", "execution_count": 455, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "vS8h0tWHQLCH", "outputId": "e53669c7-8d2b-4a81-e5d1-a61434fe4cc2" }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "cedelzorena.\n", "carixto.\n", "leiscasiria.\n", "jovino.\n", "renta.\n", "marizio.\n", "alfidela.\n", "alsa.\n", "paulogia.\n", "taw.\n", "migdina.\n", "duboa.\n", "secahmidio.\n", "sihorgel.\n", "floreta.\n", "remenicia.\n", "penoyda.\n", "filiano.\n", "frinda.\n", "geria.\n" ] } ], "source": [ "block_size = 3\n", "for _ in range(20):\n", " out = []\n", " context = [0] * block_size\n", " while True:\n", " emb = C[torch.tensor([context])]\n", " a = torch.tanh(emb.view(1, -1) @ H + d)\n", " logits = a @ U + b\n", " probs = F.softmax(logits, dim=1)\n", " ix = torch.multinomial(probs, num_samples=1).item()\n", " context = context[1:] + [ix]\n", " out.append(ix)\n", " if ix == 0:\n", " break\n", "\n", " print(''.join(fap[i] for i in out))" ] }, { "cell_type": "markdown", "metadata": { "id": "uZgbBCm9nThf" }, "source": [ "Indudablemente, estos nombres son más respetables." ] }, { "cell_type": "markdown", "metadata": { "id": "rbHyRZ9gbY3P" }, "source": [ "[^1]: El método `view` es eficiente porque [no requiere de nuevo espacio](http://blog.ezyang.com/2019/05/pytorch-internals/) en la memoria de nuestra computadora, sino que utiliza el mismo tensor para reacomodarlo de manera distinta. Conforme nuestros programas se vuelvan más complejos, debemos procurar eficientar al máximo nuestros recursos computacionales. Para un acercamiento más general al tema, véase el [artículo de Horace He](https://horace.io/brrr_intro.html).\n", "\n", "[^2]: En *deep learning*, el término *hidden* («oculto») se utiliza para referirse a componentes de una red neuronal que no son «visibles» ni como entradas ni como salidas de la red. Se trata de entradas o salidas que se procesan internamente por la red neuronal antes de arrojar un resultado final. La *hidden unit*, en ese sentido, se refiere a cada unidad o componente de una capa oculta (*hidden layer*) en la red. Podemos entenderla como sinónimo de «nodo» o «neurona».\n", "\n", "[^3]: Se denominan «parámetros» a los números o coeficientes que la red neuronal aprende y determina durante el entrenamiento (por ejemplo, los números de los pesos y los sesgos). Por otra parte, los «hiperparámetros» son aquellos que nosotros definimos manualmente según la naturaleza de cada problema, y que optimizamos mediante pruebas con distintos valores (por ejemplo, nuestras unidades ocultas $h$)." ] } ], "metadata": { "colab": { "collapsed_sections": [], "provenance": [] }, "kernelspec": { "display_name": "Python 3", "name": "python3" }, "language_info": { "name": "python" } }, "nbformat": 4, "nbformat_minor": 0 }