Upload New File

d5218714 · ashepley · 4e493f8e · d5218714
Commit d5218714 authored 4 years ago by ashepley
--- a/topic_32/AdaBoost.ipynb
+++ b/topic_32/AdaBoost.ipynb
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## AdaBoost"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "AdaBoost, or adaptive boosting is an ensemble learning method that uses iteration to learn from the errors of weak classifiers to develop strong classifiers. It is based on the concept that a single weak classifier may not be able to accurately predict the class of an object (slightly better than a guess), but when multiple weak classifiers are combined, a strong classifier can be created. \n",
+    "* AdaBoost is not a model, it is applied on top other types of classifiers, e.g. logistic regression or decision trees, to learn from their limitations and suggest an improved model. \n",
+    "* AdaBoost is sequential. Firstly, a model is built based on training data. This model is evaluated, then another model is trained to specifically correct the errors of the first model by increasing the weights of the misclassifed examples and decreasing the weights of the correctly classified examples. \n",
+    "* This process is repeated iteratively until the model cannot be improved or a predefined limit of iterations is reached.\n",
+    "* Error is reduced very rapidly, meaning AdaBoost has a high convergence rate\n",
+    "* Predictions are made by calculating the weighted majority vote or weighted average of the weak classifiers"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import pandas as pd\n",
+    "from sklearn.ensemble import AdaBoostClassifier\n",
+    "from sklearn.model_selection import GridSearchCV\n",
+    "from sklearn.model_selection import train_test_split\n",
+    "from sklearn.metrics import confusion_matrix\n",
+    "from sklearn.metrics import accuracy_score"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 35,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "data = pd.read_csv(\"./datasets/heart_failure_clinical_records_dataset.csv\")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 36,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>age</th>\n",
+       "      <th>anaemia</th>\n",
+       "      <th>creatinine_phosphokinase</th>\n",
+       "      <th>diabetes</th>\n",
+       "      <th>ejection_fraction</th>\n",
+       "      <th>high_blood_pressure</th>\n",
+       "      <th>platelets</th>\n",
+       "      <th>serum_creatinine</th>\n",
+       "      <th>serum_sodium</th>\n",
+       "      <th>sex</th>\n",
+       "      <th>smoking</th>\n",
+       "      <th>time</th>\n",
+       "      <th>DEATH_EVENT</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>75.0</td>\n",
+       "      <td>0</td>\n",
+       "      <td>582</td>\n",
+       "      <td>0</td>\n",
+       "      <td>20</td>\n",
+       "      <td>1</td>\n",
+       "      <td>265000.00</td>\n",
+       "      <td>1.9</td>\n",
+       "      <td>130</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0</td>\n",
+       "      <td>4</td>\n",
+       "      <td>1</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>55.0</td>\n",
+       "      <td>0</td>\n",
+       "      <td>7861</td>\n",
+       "      <td>0</td>\n",
+       "      <td>38</td>\n",
+       "      <td>0</td>\n",
+       "      <td>263358.03</td>\n",
+       "      <td>1.1</td>\n",
+       "      <td>136</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0</td>\n",
+       "      <td>6</td>\n",
+       "      <td>1</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>65.0</td>\n",
+       "      <td>0</td>\n",
+       "      <td>146</td>\n",
+       "      <td>0</td>\n",
+       "      <td>20</td>\n",
+       "      <td>0</td>\n",
+       "      <td>162000.00</td>\n",
+       "      <td>1.3</td>\n",
+       "      <td>129</td>\n",
+       "      <td>1</td>\n",
+       "      <td>1</td>\n",
+       "      <td>7</td>\n",
+       "      <td>1</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>50.0</td>\n",
+       "      <td>1</td>\n",
+       "      <td>111</td>\n",
+       "      <td>0</td>\n",
+       "      <td>20</td>\n",
+       "      <td>0</td>\n",
+       "      <td>210000.00</td>\n",
+       "      <td>1.9</td>\n",
+       "      <td>137</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0</td>\n",
+       "      <td>7</td>\n",
+       "      <td>1</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>65.0</td>\n",
+       "      <td>1</td>\n",
+       "      <td>160</td>\n",
+       "      <td>1</td>\n",
+       "      <td>20</td>\n",
+       "      <td>0</td>\n",
+       "      <td>327000.00</td>\n",
+       "      <td>2.7</td>\n",
+       "      <td>116</td>\n",
+       "      <td>0</td>\n",
+       "      <td>0</td>\n",
+       "      <td>8</td>\n",
+       "      <td>1</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    age  anaemia  creatinine_phosphokinase  diabetes  ejection_fraction  \\\n",
+       "0  75.0        0                       582         0                 20   \n",
+       "1  55.0        0                      7861         0                 38   \n",
+       "2  65.0        0                       146         0                 20   \n",
+       "3  50.0        1                       111         0                 20   \n",
+       "4  65.0        1                       160         1                 20   \n",
+       "\n",
+       "   high_blood_pressure  platelets  serum_creatinine  serum_sodium  sex  \\\n",
+       "0                    1  265000.00               1.9           130    1   \n",
+       "1                    0  263358.03               1.1           136    1   \n",
+       "2                    0  162000.00               1.3           129    1   \n",
+       "3                    0  210000.00               1.9           137    1   \n",
+       "4                    0  327000.00               2.7           116    0   \n",
+       "\n",
+       "   smoking  time  DEATH_EVENT  \n",
+       "0        0     4            1  \n",
+       "1        0     6            1  \n",
+       "2        1     7            1  \n",
+       "3        0     7            1  \n",
+       "4        0     8            1  "
+      ]
+     },
+     "execution_count": 36,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "data.head()"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 56,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "Index(['age', 'anaemia', 'creatinine_phosphokinase', 'diabetes',\n",
+       "       'ejection_fraction', 'high_blood_pressure', 'platelets',\n",
+       "       'serum_creatinine', 'serum_sodium', 'sex', 'smoking', 'time',\n",
+       "       'DEATH_EVENT'],\n",
+       "      dtype='object')"
+      ]
+     },
+     "execution_count": 56,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "data.columns"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 79,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "data.features = data[['age', 'anaemia', 'creatinine_phosphokinase', 'diabetes',\n",
+    "       'ejection_fraction', 'high_blood_pressure', 'platelets',\n",
+    "       'serum_creatinine', 'serum_sodium', 'sex', 'smoking', 'time']]\n",
+    "data.target = data.DEATH_EVENT"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 80,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "x_train, x_test, y_train, y_test = train_test_split(data.features,data.target, test_size=0.2)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 81,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "[[36  8]\n",
+      " [ 7  9]]\n",
+      "Accuracy: 75.00%\n"
+     ]
+    }
+   ],
+   "source": [
+    "classifier = AdaBoostClassifier(n_estimators=100, learning_rate=0.1)\n",
+    "classifier.fit(x_train, y_train)\n",
+    "predictions = classifier.predict(x_test)\n",
+    "print(confusion_matrix(y_test, predictions))\n",
+    "print(\"Accuracy: {:0.2f}%\".format(accuracy_score(y_test, predictions)*100))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Improving the Model via Grid Search\n",
+    "This method chooses the best parameters for training, but takes a bit longer!"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 83,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "param_dist = {'n_estimators': [50,100,200],'learning_rate' : [0.01,0.05,0.1,0.3,1],}"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 61,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "C:\\Users\\Andreas Shepley\\Anaconda3\\lib\\site-packages\\sklearn\\model_selection\\_search.py:841: DeprecationWarning: The default of the `iid` parameter will change from True to False in version 0.22 and will be removed in 0.24. This will change numeric results when test-set sizes are unequal.\n",
+      "  DeprecationWarning)\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "GridSearchCV(cv=10, error_score='raise-deprecating',\n",
+       "       estimator=AdaBoostClassifier(algorithm='SAMME.R', base_estimator=None,\n",
+       "          learning_rate=1.0, n_estimators=50, random_state=None),\n",
+       "       fit_params=None, iid='warn', n_jobs=None,\n",
+       "       param_grid={'n_estimators': [50, 100, 200], 'learning_rate': [0.01, 0.05, 0.1, 0.3, 1]},\n",
+       "       pre_dispatch='2*n_jobs', refit=True, return_train_score='warn',\n",
+       "       scoring=None, verbose=0)"
+      ]
+     },
+     "execution_count": 61,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "grid_search = GridSearchCV(estimator=AdaBoostClassifier(), param_grid=param_dist, cv=10)\n",
+    "grid_search.fit(x_train, y_train)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 62,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "predictions = grid_search.predict(x_test)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 63,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "[[34  0]\n",
+      " [ 8 18]]\n",
+      "Accuracy: 86.67%\n"
+     ]
+    }
+   ],
+   "source": [
+    "print(confusion_matrix(y_test, predictions))\n",
+    "print(\"Accuracy: {:0.2f}%\".format(accuracy_score(y_test, predictions)*100))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Visualisation"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 82,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "No handles with labels found to put in legend.\n"
+     ]
+    },
+    {
+     "data": {
+      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAfgAAAEWCAYAAACKZoWNAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4yLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvOIA7rQAAIABJREFUeJzt3Xm8VWW9x/HPl0FRQBAk0wwRh8wR5WDiiFdzSjMTI7OS9EpaqdU1b6V5vZbTxdtgpoZeQ9PMsDRnnHEWDsqYUwIWYYagjIoIv/vHeo4sNvucs89hb/Y5m+/79dqvs/aznvWs31pn+O3nWeusRxGBmZmZ1ZYO1Q7AzMzMys8J3szMrAY5wZuZmdUgJ3gzM7Ma5ARvZmZWg5zgzczMapATvFkNkHSNpB9VeB+PSfr3tHyipAdK2OY+SSdVMi4zK84J3qyNkzRW0oVFyo+R9E9JnSLitIj48bqKKSJujohDS6h3RETcUO79SxoiaXa5220NSf0khaROZWqv2WOTNFrS+5IW517DyrDvkLTd2rZjbYMTvFnbNxr4iiQVlH8FuDkiPlj3IRlAuZJ6K/1PRHTLvW6tYiwASOpY7RhsFSd4s7bvDqAXsH9DgaRNgaOAG9P70ZJ+kpY3k3S3pHckzZf0hKQOad1qPbSC7TZN282V9HZa3qpYQJKGS3oyLZ9T0JNcLml0Wpcf1h8u6UlJl6f2Z0o6ItfmNpIel7RI0kOSfiXpplJOUNrPTyQ9nWK4S1JvSTdLWihpgqR+ufoh6UxJMyS9JWlk7hx1kHSepNcl/UvSjZJ6pHUNvfVTJP0NeAR4PDX7Ttr3YEnbSnpE0rzU/s2Seub2P0vS2ZKmSFog6VZJXSR1Be4Dtsydzy1LOQe5treU9Mf0fZwp6czcur0kPZN+Nt6QdKWkDdK6huOY3DAikP8+F5y77dLyaElXS7pX0hLgIEkbpu/x3yS9qezy0UapfqM/m1Z+PrFmbVxEvAv8AfhqrvgLwEsRMbnIJv8BzAb6AJsDPwRKeSZ1B+A3wNZAX+Bd4MoS4vuwJwl8Epib4i3mU8DLwGbA/wD/lxuZ+B0wHugNXEA2QtESX0zbfAzYFngmHU8v4EXgvwrqHwvUAXsCxwAnp/Lh6XUQ0B/oxprn4UCyYz0MOCCV9Uzn4RlAwCXAlqnex9Mx5X0BOBzYBtgNGB4RS4AjgDm5nvmcUk9ASpZ3AZPTeTgY+Lakw1KVFcB3yM7/4LT+GwAR0XAcu7dwROBLwEVAd+BJ4DJgB2AAsF2K4/xUt7U/m9YKTvBm7cMNwPENPSGyZN/Yte3lwBbA1hGxPCKeiBImnYiIeRHxx4hYGhGLyP5oH1hqgCm2O4BfRMS9jVR7PSKujYgVKf4tgM0l9QUGAedHxPsR8SRwZ6n7Tn4TEa9FxAKyXvBrEfFQuoQxBtijoP5lETE/Iv4G/Bw4IZWfCPw0ImZExGLgB8AXtfpw/AURsSR9+FpDRPw1Ih6MiGURMRf4KWueyysiYk5EzCdLygNaeLxnp57wO5LeSmWDgD4RcWE6jzOAa8k+/BAREyPi2Yj4ICJmAb8uEldL/TkinoqIlcAy4FTgO+ncLgIubtg/rfzZtNZxgjdrB1LCmwscI6k/2R/y3zVSfSTwV+CBNAT9/VL2IWljSb9OQ9MLyYaee6r066r/B7wcEZc1UeefDQsRsTQtdiPr6c7PlQH8vcT9Nngzt/xukffdCurn2389xUD6+nrBuk5kPc6SYpP0EUm/l/SPdC5vIus15/0zt7y0SHzNuTwieqZXQ9tbkw3vNyT+d8h6yZunuHZIQ+T/THFdXCSulsqfiz7AxsDE3P7vT+XQyp9Nax0neLP240aynvtXgAci4s1ilSJiUUT8R0T0B44Gvivp4LR6Kdkf4AYfzS3/B/AJ4FMRsQmrhp4Lb+5bQ/pD/QnglBYcT94bQC9J+dg+3sq2SpVvvy/QMBQ+hyxR5td9wOofGKKR5QaXpPLd0rn8MiWcxybaK9XfgZm5xN8zIrpHxJFp/dXAS8D2Ka4fNhPXEnI/L5I+WqROPt63yD5M7Zzbf490+aa5n00rMyd4s/bjRuAQsiHQRv/1TNJRkrZL17YXkl13XZFWTwK+JKmjpMNZfXi2O9kf53ck9WLNa9aN7e8I4Ezgc40NWTcnIl4H6oELJG0gaTBZAqik7ym7sfDjwFlAwzXnW4DvKLvprxtZL/fWJv5bYS6wkux6fYPuwGKyc/kx4HstiOtNoHfDjX0tNB5YKOk/JW2Uvs+7SBqUi2shsFjSjsDpRfadP47JwM6SBkjqwpr3EawmDdNfC/xM0kcAJH2s4R6AZn42rcyc4M3aiXTN9GmgK01fn94eeIgswTwDXBURj6V1Z5ElznfIrjXfkdvu58BGZL2wZ8mGVksxjGwI9sXcnd/XlLht3olkN37NA35ClnCXtaKdUv0ZmEj2oecesksMANcDvyW7RDETeA84o7FG0mWFi4Cn0rD03sB/k928tyC1/adSg4qIl8g+ZMxI7ZV8F326t+Fosuv5M8m+l9cBDR8Wzia7KW4RWSIuvJHuAuCGtN8vRMQrwIVkP0+vkt1E15z/JBuGfzZdBniIbHQHmv7ZtDKT728ws7ZI0q1k/ylQ0khCC9sOsmHqv5a7bbO2wj14M2sTJA1S9v/jHdLlg2NYfYTBzFqgmk9hMjPL+yjZUHZvsv+VPj0iXqhuSGbtl4fozczMapCH6M3MzGqQh+itajbbbLPo169ftcMwM2s3Jk6c+FZE9Gm+phO8VVG/fv2or6+vdhhmZu2GpNebr5Vxgreq+WDufOZeXdJkYWZmNaHP6V9eZ/vyNXgzM7Ma5ARvZmZWgzxEb2ZmVgXLly9n9uzZvPfee2us69KlC1tttRWdO3dudftO8IaknsCXIuKq9NzrKyJiaLXjMjOrZbNnz6Z79+7069ePbP6dTEQwb948Zs+ezTbbbNPq9j1EbwA9gW8ARMQcJ3czs8p777336N2792rJHUASvXv3Ltqzbwn34A3gUmBbSZPIZoz6ZETsImk48DmgI7AL8L/ABmTzkS8DjoyI+ZK2BX5FNqPYUuDUNCOWmZk1oTC5N1feEu7BG8D3gdciYgBrzlu9C9n0knuRTYm5NCL2IJvq8aupzijgjIgYSDYd5VWN7UjSCEn1kurnLV5Y5sMwM7MG7sFbcx6NiEXAIkkLgLtS+VRgN0ndgH2AMblPnBs21lhEjCL7QMCArft7IgQzswpxgrfmLMstr8y9X0n289MBeCf1/s3MrAUiouhwfDkmgvMQvQEsArq3ZsOIWAjMlHQ8gDK7lzM4M7Na1KVLF+bNm7dGMm+4i75Lly5r1b578EZEzJP0lKRpwIutaOJE4GpJ5wGdgd8Dk8sZo5lZrdlqq62YPXs2c+fOXWNdw//Brw0neAMgIr5UpGw0MDr3vl+xdRExEzi8shGamdWWzp07r9X/uTfHQ/RmZmY1yAnezMysBnmI3qqmU59e63TqRDOz9Yl78GZmZjXICd7MzKwGeYjequb9f73G367wvDbrk75n3lbtEMzWG+7Bm5mZ1SAneDMzsxrkBG9mZlaDnODNzMxqkBP8ekTScElb5t5fJ2mnZrY5TdJXm6pjZmZtj++iXwuSOkXEB1XYrwBFxMoWbjocmAbMAYiIf29ug4i4psUBmplZ1bkHD0jqKukeSZMlTZM0TNJASeMkTZQ0VtIWqe5jki6WNA44S9JoSUNzbS1OX4ek7f8g6RVJl0o6UdJ4SVMlbdtEPJtLuj3FM1nSPpL6SXpR0lXA88DHJR0q6RlJz0saI6lb2v58SRPSsYxKU7gOBeqAmyVNkrRROpa6hrglXZT296ykzVP5BZLOzh37ZekYXpG0fyrvKGlk2ucUSV+vwLfJzMxawAk+czgwJyJ2j4hdgPuBXwJDI2IgcD1wUa5+z4g4MCL+t5l2dwfOAnYFvgLsEBF7AdcBZzSx3RXAuIjYHdgTmJ7KPwHcGBF7AEuA84BDImJPoB74bqp3ZUQMSseyEXBURNyW6pwYEQMi4t2CfXYFnk37fBw4tZHYOqVj+DbwX6nsFGBBRAwCBgGnSio6RZKkEZLqJdXPX7ysiVNgZmZrw0P0manA5ZIuA+4G3gZ2AR7MRsPpCLyRq39rie1OiIg3ACS9BjyQ299BTWz3b8BXASJiBbBA0qbA6xHxbKqzN7AT8FSKcQPgmbTuIEnnABsDvcg+INzVTKzvkx07wETg043U+1OuTr+0fCiwW24kowewPTCzcOOIGAWMAtit76bRTExmZtZKTvBARLwiaSBwJHAJ8CAwPSIGN7LJktzyB6SRkHRtfIPcunwXdWXu/Upad+7z+xXwYESckK8gqQtwFVAXEX+XdAHQpYS2l0dEQ8Jd0UR8y4rUEXBGRIwtYT9mZrYOeIgeSHeWL42Im4DLgU8BfSQNTus7S9q5kc1nAQPT8jFA5zKE9DBwetp3R0mbFKnzLLCvpO1SvY0l7cCqZP5WuiaffxbsIqB7GeIrNBY4XVLnFMsOkrpWYD9mZlYi9+AzuwIjJa0ElpMl1w+AKyT1IDtPP2fVtfC8a4E/SxpPlpiXFKnTUmcBoySdQtZTPp3VLxEQEXMlDQdukbRhKj4vjUZcS3YZYBYwIbfZaOAaSe8CjY1OtMZ1ZMP1z6dRjLnA58rYvpmZtZBWjcqarVu79d007j774GqHYeuQJ5sxWzuSJkZEXSl1PURvZmZWgzxEX0WSzgWOLygeExEXFatfazb4yLbu0ZmZVYgTfBWlRL5eJHMzM1u3PERvZmZWg9yDt6pZ+NarjP2/I6sdhpXRYafcW+0QzCxxD97MzKwGOcGbmZnVICd4MzOzGuQEb2ZmVoOc4M3MzGqQE7w1StIdkiZKmi5pRCo7RdIrkh6TdK2kK1N5H0l/lDQhvfatbvRmZus3/5ucNeXkiJgvaSNggqR7gB8Be5LNTPcIMDnV/QXws4h4UlJfshnmPlmNoM3MzAnemnampGPT8seBrwDjImI+gKQxwA5p/SHATtlkcgBsIql7RCzKN5hGAkYAfKRXKdPUm5lZazjBW1GShpAl7cERsVTSY8DLNN4r75DqvttUuxExChgFsEO/Hp7K0MysQnwN3hrTA3g7Jfcdgb2BjYEDJW0qqRNwXK7+A8C3Gt5IGrBOozUzs9U4wVtj7gc6SZoC/Bh4FvgHcDHwHPAQ8BdgQap/JlAnaYqkvwCnrfuQzcysgYforaiIWAYcUVguqT4iRqUe/O1kPXci4i1g2LqN0szMGuMevLXUBZImAdOAmcAdVY7HzMyKcA/eWiQizq52DGZm1jwneKuaTTbb3tOLmplViIfozczMapATvJmZWQ1ygjczM6tBvgZvVTN33qv8+reHVTsMa4Gvf2VstUMwsxK5B29mZlaDnODNzMxqkBO8mZlZDXKCNzMzq0FO8C0g6V5JPVux3RBJ++Tenybpq2WO7ZY00ct3ytDWDwveP722bZqZ2brlu+hbICKObOWmQ4DFwNOpnWvKFROApI8C+0TE1kXWdYqID1rY5A/JZo0DICL2aaKumZm1Qe7BN0LSlyWNlzRJ0q8ldZQ0S9Jmja1P5YdLel7SZEkPS+pHNnXqd1Ld/SVdIOnsVH+ApGdT7/t2SZum8sckXZb28Yqk/ZsI9wHgI7n2H5N0saRxwFmSjpb0nKQXJD0kafO0j26SfiNpatr/cZIuBTZKbd2c6i1OXyVppKRpaZthqXxI2udtkl6SdLMkNXJeR0iql1S/eNH7a/ttMjOzRjjBFyHpk2RTn+4bEQOAFcCJza2X1Ae4FjguInYHjo+IWcA1wM8iYkBEPFGwuxuB/4yI3YCpwH/l1nWKiL2AbxeUF/os8FpB+z0j4sCI+F/gSWDviNgD+D1wTqrzI2BBROya9v9IRHwfeDe1dWLBfj4PDAB2Bw4BRkraIq3bI8W5E9Af2LdYoBExKiLqIqKuW/cNmjgkMzNbGx6iL+5gYCAwIXVENwL+VcL6vYHHI2ImQETMb2onknqQJeJxqegGYEyuyp/S14lAvxYew6255a2AW1My3oBsmlfIkvQXGypFxNvNtLkfcEtErADeTCMEg4CFwPiImJ2Oa1KK98kWxmxmZmXiHnxxAm5IvdgBEfGJiLighPUCooxxLEtfV9DyD2NLcsu/BK6MiF2BrwNdUnlL4y067J4syy23Jl4zMysjJ/jiHgaGSvoIgKRekrYuYf0zwIGStmkoT/UXAd0LdxIRC4C3c9fXvwKMK6xXBj2Af6Tlk3LlDwDfanjTcP0fWC6pc5F2HgeGpfsR+gAHAOMrEK+Zma0lJ/giIuIvwHnAA5KmAA8CW6xaXXx9RMwFRgB/kjSZVcPkdwHHNtwEV7C7k8iuZU8hu759YQUO6QJgjKQngLdy5T8BNk03zU0GDkrlo4ApDTfZ5dwOTAEmA48A50TEPysQr5mZrSVFlHNEuXalu+T/BXw0IpZXO55asPU2PeKHF+5d7TCsBTzZjFl1SZoYEXWl1PV10tJNB65zci+fPr23d8IwM6sQJ/gSRcSO1Y5B0mHAZQXFMyPi2GrEY2ZmbZcTfDsSEWMBd3nNzKxZvsnOzMysBrkHb1Uz651X+drth1c7jJrwm2Pvr3YIZtbGuAdvZmZWg5zgzczMapATvJmZWQ1ygq8hacrWJh+AIOnbkjZel22Zmdm65wS//vk2UK6kXM62zMysjJzg2yFJ/SS9JOkGSVMk3VbYk5Z0taR6SdMl/XcqOxPYEnhU0qOp7FBJz0h6XtIYSd2K7G+NOoVtpQloRqfn2k+V9J3KnwkzM2uME3z79QlgVETsRjYf+zcK1p+bnle8G9kMd7tFxBXAHOCgiDhI0mZkk+YcEhF7AvXAd/ONNFansC2yiXI+FhG7pGlpf1MsaEkj0geP+vcWvl+WE2FmZmvy/8G3X3+PiKfS8k3AmQXrvyBpBNn3eAtgJ7KZ4PL2TuVPSQLYgGzK25bWAZgB9Jf0S+Aesqlo1xARo8hmq2Oz7Xp4piMzswpxgm+/CpPjh+/TfPRnA4Mi4m1Jo4EuRdoQ8GBEnNDEfkqpQ9rP7sBhwDeBLwAnN3sUZmZWER6ib7/6Shqclk8Ansyt2wRYAiyQtDlwRG7dIqB7Wn4W2FfSdgCSNpa0Q8F+mqrzYVtpKL9DRPwR+BGwZxmO0czMWskJvv16EThJ0hSgF3B1w4qImAy8QDbF7fXAU7ntRgH3SXo0IuYCw4FbUjvPAqvNmtdMnQ/bAj4GPCZpEjAa+EE5D9bMzFpGEb4M2t5I6gfcHRG7VDmUtbLZdj3i6JGDm69ozfKz6M3WD5Imphuom+UevJmZWQ3yTXbtUETMAtp17x2gX8/t3fM0M6uQFvfgJW0qabdKBGNmZmblUVKCT88l30RSL2Ay8BtJP61saGZmZtZapfbge0TEQuDzwG8iYiBwSOXCMjMzs7VR6jX4TpK2IHt4ybkVjMfWI6++808+c/vIaodRcfcc+71qh2Bm66FSe/AXAmOB1yJigqT+wKuVC8vMzMzWRkk9+IgYA4zJvZ8BHFepoMzMzGztlHqT3Q6SHpY0Lb3fTdJ5lQ3NzMzMWqvUIfpryR49uhwgIqYAX6xUUGZmZrZ2Sk3wG0fE+IKyD8odjFVP+lfIurR8r6Se1Y7JzMxar9S76N+StC1pSlJJQ4E3KhZVjZPUKSLa7AekiDiy2jGYmdnaKbUH/03g18COkv4BfBs4rWJRtROSukq6R9JkSdMkDZM0UNI4SRMljU3/XtjQQ75Y0jjgLEmj0welhrYWp69D0vZ/kPSKpEslnShpvKSp6YNWY/Ecn+KYLOnxVNZF0m/Sti9IOiiVbyTp95KmSLoV2CjXzixJm0nq13DfRSo/W9IFueP5maTHJb0oaZCkP0l6VdJPmohxhKR6SfXvL1zSyjNvZmbNabYHL6kDUBcRh0jqSjbn96LKh9YuHA7MiYjPAEjqAdwHHBMRcyUNAy4CTk71e0bEganu6Cba3R34JDAfmAFcFxF7SToLOIPsA1Yx5wOHRcQ/ckPs3wSIiF0l7Qg8kOZzPx1YGhG7pUcPP9+K438/Ig5Icf0ZGJhifk3SzyJiXuEGETGKbJpZemy3lacyNDOrkGZ78BGxEvhWWl7i5L6aqcAhki6TtD/wcbJJYB5M86KfB2yVq39rie1OiIg3ImIZ8BrwQG5//ZrY7ilgtKRTgY6pbD/gtwAR8RLwOrADcABwUyqfAkwpMba8O3NxTc/FPIPsXJiZWZWUeg3+QUlnkyWoD8dVI2J+RaJqJyLiFUkDgSOBS4AHyRJdY5Oc58ekPyB9wJIkYIPcumW55ZW59ytp4nsWEadJ+hTwGWCSpAGAmjqEJtatFmPSpWB9Pq7CmD1ToZlZFZV6Df5ksqHex4GJ6VVfqaDaC0lbkg1z3wRcDnwK6CNpcFrfWdLOjWw+i2xIG+AYoHMZ4tk2Ip6LiPOBt8h60Y8DJ6b1OwB9gZcLyncBis0Q+CbwEUm9JW0IHLW2MZqZ2bpR6pPstql0IO3UrsBISSvJnhFwOlmv94p0Pb4T8HNgepFtrwX+LGk88DCr9+5ba6Sk7cl67Q+Tzfz3EnCNpKkptuERsUzS1WSzAk4BJgGF/wZJRCyXdCHwHDAztWVmZu2AIpq/z0nSV4uVR8SNZY/I1hs9ttsq9ht5VrXDqDhPNmNm5SJpYkTUlVK31Oukg3LLXYCDye66doK3Vtu+50ed/MzMKqTUIfoz8u/T8PNvKxKRNUvSucDxBcVjIuKiasRjZmZtT2vvdF4KbF/OQKx0KZE7mZuZWaNKSvCS7mLVv1R1AHYiN32smZmZtS2l9uAvzy1/ALweEbMrEI+tR/769nyOuu3miu7j7qEnVrR9M7O2qtT/gz8yIsal11MRMVvSZRWNzMzMzFqt1AT/6SJlR5QzEDMzMyufJofoJZ0OfAPonx6I0qA72XPPzczMrA1q7hr878hmR7sE+H6ufNH6/hx6MzOztqzJIfqIWBARsyLihIh4HXiX7G76bpL6rpMIc9L85F/Kva+TdEUJ2z1d2cg+3M8FaVKeSrW/2hzyJdQfIunuIuWflfT9YtuYmVltKOkavKSjJb1K9jzycWQTpdy3NjuW1Jr/we8HfJjgI6I+Is5sbqOI2KcV+6pZEXFnRFxa7TjMzKxySr3J7ifA3sAraeKZgynhGrykr0qaImmypN+mHuhPJT0KXCapq6TrJU2Q9IKkY9J2/SQ9Ien59GpI0JcC+0uaJOk7+R5q6j1fL+kxSTMknZmLY3H6OiStv03SS5JuTlO1ImmgpHGSJkoaK2mLJo7rMUk/l/S0pGmS9sqt3qmRGL6b6k6T9O1U1lXSPen8TJM0LJXPSnPMj0+v7XLtH5D2O6OhN6/MyNTG1IZ2CmIelM5xf0nDJV2ZykdLuqJIm90kPZzO/9Tc96axmEs6f5JGSKqXVP/+woWNnWIzM1tLpfail0fEPEkdJHWIiEeb+zc5ZdOkngvsGxFvSeoF/BTYATgkIlZIuhh4JCJOltQTGC/pIeBfwKcj4j1ls6PdAtSR3QdwdkQclfYxpGC3OwIHkd0E+LKkqyNieUGdPYCdgTlkH1L2lfQc8EvgmIiYm5LWRWTT5Dama0TsI+kA4Hpgl8ZiIJuK9Wtk08kKeE7SOKA/MCciPpOOp0eu/YURsZeyiX5+zqqpWrcA9kv7uRO4Dfg8MADYHdgMmCDp8dz3Yp/c8f0txZxXrM33gGMjYqGkzYBnJd0JHF4Ys6TOpZ6/iBgFjALouW3/5mc6MjOzVik1wb8jqRvwBHCzpH+RPfCmKf8G3BYRbwFExPzUWR4TEStSnUOBz2rVdesuZPOVzwGulDQAWEH2oaAU90TEMmBZinFzoPCBPOMbHtIjaRLZsP87ZAn6wRRjR+CNZvZ1SzquxyVtkj6gNBbDfsDtEbEk7fdPwP7A/cDl6cPS3RHxRGH76evPcuV3RMRK4C+SNk9l+wG3pPP6ZvrwMAhYCHySLKEeGhFzGjmWYm0KuDh9GFgJfCwdy9TCmJXNJ9/S82dmZhVUaoI/huwGu28DJwI9gAub2Uaserxt3pKCOsdFxMurbShdALxJ1iPtQNabLMWy3PIKih9fsToCpkfE4BL3A2seW8P7xtpfs4GIVyQNBI4ELpH0QEQ0nNd8+/nlfPsq+FrMG2QfnPYg++BUTLE2TwT6AAPTvPCzgC7FYgZup+Xnz8zMKqika/Cp5/lxYEhE3ABcB7zfzGYPA1+Q1BsgDdEXGguckbsOvkcq7wG8kXqVXyHrEQIsIhv6LreXgT6SBqc4OqdLDE1puPa8H7AgIhY0Ufdx4HOSNpbUFTgWeELSlsDSiLiJ7HHAexa2n74+00wsjwPDJHWU1Ac4ABif1r0DfIasNz6kmXbyegD/Ssn9IGBrgEZibs35MzOzCip1splTgRFAL2BbsuHaa8hutisqIqZLuggYJ2kF8EKRaj8mu748JSX5WWTXmq8C/ijpeOBRVvX6pwAfSJoMjG6kzRaLiPfTzWVXpOvgnVJc05vY7G1l/363CU1fqycinpc0mlVJ97qIeEHSYcBISSuB5cDpuc02TPcGdABOaOYQbgcGA5PJevvnRMQ/Je2Y9v+mpKOB+yQ1GWvOzcBdkuqBScBLqXzXwphbef7MzKyCFNH8fU7pWvVewHMRsUcqmxoRu1Y4vjZJ0mNkN/vVV6j9WUBdw/0Ltarntv1jv8t+XNF9eLIZM6slkiZGRF0pdUu9Br8s9dIadtCJ4tfXzUq23aa9nIDNzCqk1AQ/TtIPgY0kfZrs+fR3VS6stkHSr4B9C4p/ERFDKrnfiOhXyfbNzKz2lZrgvw+cQvYvUl8H7iW70a6mRcQ3qx2DmZlZazQ3m1zfiPhbupv92vQyMzOzNq65f5O7o2FB0h8rHIuZmZmVSXMJPv8Alf6VDMTMzMzKp7kE39jT1MzMzKwNa+4mu90lLSTryW+UlknvIyI2qWh0ZmZm1ipN9uAjomNEbBIR3SOiU1pueO/kXkOUm3q3oPyzkr5fjZjMzKz1Sv03OVtPRcSdZFPImplZO1LSZDPW9kjqKukeSZMlTZM0TNIsSRdLekZSvaRnQct0AAAUzElEQVQ9JY2V9Jqk09J2kjQybTM1zd1e2PYgSS9I6i9puKQrU/loSVdIelrSjPT8eSR1kHSVpOmS7pZ0b8M6MzOrDif49utwYE5E7B4Ru5DNLQ/w9zRt6xNkE/IMBfZm1fS+nwcGkE3FewjZxDFbNDQqaR+yiYSOiYgZRfa7Bdn880cBl+ba7Ec2Ec2/k018U5SkEenDR/3cuXNbesxmZlYiJ/j2aypwiKTLJO2fm672ztz65yJiUUTMBd6T1JMsOd8SESsi4k1gHDAobfNJYBRwdET8rZH93hERKyPiL8DmqWw/YEwq/yfZDIBFRcSoiKiLiLo+ffq08tDNzKw5TvDtVES8AgwkS+SXSDo/rVqWvq7MLTe878TqzzYo9AbwHrBHE3Xybargq5mZtRFO8O2UpC2BpRFxE3A5sGeJmz4ODJPUUVIf4ABWzVP/DvAZ4GJJQ1oQzpPAcela/OZAS7Y1M7MK8F307deuZNfPVwLLgdOB20rY7naya+STyR5edE5E/FPSjgAR8aako4H7JJ1cYix/BA4GpgGvAM8BC5rcwszMKkoRfkCdrT1J3SJisaTeZCMC+6br8Y2qq6uL+vr6dROgmVkNkDQxIupKqesevJXL3ekmvg2AHzeX3M3MrLKc4K0sImJItWMwM7NVfJOdmZlZDXKCNzMzq0FO8GZmZjXICd7MzKwGOcGbmZnVICd4MzOzGuQEb2ZmVoOc4M3MzGqQE7yZmVkNcoK3RknqKukeSZMlTZM0TNJASeMkTZQ0VtIWkjpJmtAwA52kSyRdVOXwzczWa35UrTXlcGBORHwGQFIP4D7gmIiYK2kYcFFEnCxpOHCbpDPTdp8q1qCkEcAIgL59+66DQzAzWz85wVtTpgKXS7oMuBt4G9gFeFASQEfgDYCImC7pt8BdwOCIeL9YgxExChgF2WxyFT8CM7P1lBO8NSoiXpE0EDgSuAR4EJgeEYMb2WRX4B1g83UUopmZNcLX4K1RkrYElkbETcDlZMPufSQNTus7S9o5LX8e6A0cAFyRpo41M7MqcQ/emrIrMFLSSmA5cDrwAVkC70H28/NzSW8ClwIHR8TfJV0J/AI4qUpxm5mt95zgrVERMRYYW2TVAUXKdshtd0XFgjIzs5J4iN7MzKwGOcGbmZnVICd4MzOzGuQEb2ZmVoOc4M3MzGqQE7yZmVkNcoI3MzOrQU7wZmZmNcgJ3szMrAY5wZuZmdWgmkjwkvpJmlak/EJJhzSz7QWSzl6b/aR1j0mqKy3iJvcxPD3L3czMrNVq+ln0EXF+tWOoBkmdIuKDdbSvjhGxYl3sy8zMSlcTPfiko6RrJU2X9ICkjSSNljQUQNKRkl6S9KSkKyTdndt2p9QDnyHpzGb200nSDZKmSLpN0saFFSSdIGmqpGmSLiuh/GuSXpE0Dti3qZ2nY7pG0hNpm6NS+XBJYyTdBTyQyr4naUKK9b9TWVdJ90ianOIYlsovlfSXVPfy3L6G5va9OH0dIulRSb8DpqayL0saL2mSpF9L6tjMeTQzswqqpR789sAJEXGqpD8AxzWskNQF+DVwQETMlHRLwbY7AgcB3YGXJV0dEcsb2c8ngFMi4ilJ1wPfIJsrvWFfWwKXAQOBt4EHJH0OGN9I+XPAf6fyBcCjwAvNHGs/4EBgW+BRSdul8sHAbhExX9Kh6ZzsBQi4U9IBQB9gTkR8JsXbQ1Iv4Fhgx4iIEudy3wvYJZ3PTwLDgH0jYrmkq4ATgRsLN5I0AhgB0Ldv3xJ2Y2ZmrVFLPfiZETEpLU8kS4INdgRmRMTM9L4wwd8TEcsi4i3gX8DmTezn7xHxVFq+CdivYP0g4LGImJuGyW8mm161sfJP5crfB24t4Vj/EBErI+JVYEY6PoAHI2J+Wj40vV4Ank91tifrcR8i6TJJ+0fEAmAh8B5wnaTPA0tLiGF87nweTPYBZYKkSel9/2IbRcSoiKiLiLo+ffqUsBszM2uNWurBL8strwA2yr1XC7dt6rxEM+8b21dTMRS20ZzGYlhSsL9LIuLXawQiDQSOBC6R9EBEXChpL7LE/EXgW8C/AR+QPgRKErBBrpnCfd0QET9o4XGYmVmF1FIPvikvAf0l9Uvvh61FW30lDU7LJwBPFqx/DjhQ0mbpOvQJwLhmyodI6i2pM3B8CTEcL6mDpG3JesovF6kzFjhZUjcASR+T9JF0CWFpRNxEdmlhz1SnR0TcC3wbGJDamEXWMwc4BujcSDwPA0MlfSTtq5ekrUs4DjMzq5Ba6sE3KiLelfQN4H5Jb5FdD2+tF4GTJP0aeBW4umBfb0j6Adm1dAH3RsSfAZoovwB4BniDbDi9uRvUXib7cLA5cFpEvJd1sFeL44F0bfyZtG4x8GVgO2CkpJXAcuB0snsP/pzuVRDwndTMtal8PFkSX0IREfEXSeeR3VfQIbX7TeD1Zo7DzMwqRBEtHR1unyR1i4jFaaj5V8CrEfGzasfVUpJGA3dHxG3VjmVt1dXVRX19fbXDMDNrNyRNjIiSnrmyvgzRA5yabgCbDvQgu6vezMysJq0XQ/QAqbdeUo9dUm+yIelCB0fEvLIG1ngM57Lm9fgxETF8XezfzMzat/UmwbdESuIDmq1Y2RguAi6qZgxmZtZ+rU9D9GZmZusNJ3gzM7Ma5ARvZmZWg5zgzczMapATvJmZWQ3yXfQ1ID0JbzGwCfB4RDzURN3HgLMjoqQnzEgaAGyZHmNrZmbthBN8DYmI8yvQ7ACgDnCCNzNrRzxE305JOlfSy5IeIpujHkmjJQ1Ny+dLmiBpmqRRWv1h9V+W9HRat1eq31XS9WmbFyQdI2kD4EJgmKRJkoYVq5e231nS+FRviqTt1+0ZMTOzPCf4dihN9/pFYA/g82RzzRe6MiIGRcQuZFPnHpVb1zUi9gG+AVyfys4FHomIQcBBwEiy2ePOB26NiAERcWuxepK6AqcBv4iIhh7/7LIetJmZtYiH6Nun/YHbI2IpgKQ7i9Q5SNI5wMZAL7Jn8N+V1t0CEBGPS9pEUk/gUOCzks5OdboAfYu021i9Z4BzJW0F/CkiXi0WuKQRwAiAvn2LNW9mZuXgBN9+NToNYJr29SqgLiL+nm7C69LEtkE2TexxEbHa3PKSPlXYfLF6wIuSngM+A4yV9O8R8cgaQUeMAkZBNptcY8dgZmZrx0P07dPjwLGSNpLUHTi6YH1DMn9LUjdgaMH6YQCS9gMWRMQCYCxwRsO1ekl7pLqLyOaLb1C0nqT+wIyIuAK4E9ht7Q/TzMxaywm+HYqI54FbgUnAH4EnCta/A1wLTAXuACYUNPG2pKeBa4BTUtmPya65T5E0Lb0HeBTYqeEmuybqDQOmpSl5dwRuLNPhmplZKyjCo6RWHXV1dVFfX9K/45uZGSBpYkTUlVLXPXgzM7Ma5ARvZmZWg5zgzczMapATvJmZWQ1ygjczM6tBTvBmZmY1yAnezMysBjnBm5mZ1SAneDMzsxrkBG9mZlaDnOCt1SRdKOmQasdhZmZr8nSx1moRcX61YzAzs+Lcg2+nJN0haaKk6ZJGpLLFki6SNFnSs5I2T+VHS3pO0guSHsqVd5V0vaQJad0xqXx4av8uSTMlfUvSd1OdZyX1SvVGSxqals9P7UyTNKphOlkzM6sOJ/j26+SIGAjUAWdK6g10BZ6NiN3J5ow/NdV9Etg7IvYAfg+ck8rPBR6JiEHAQcBISV3Tul2ALwF7ARcBS9P2zwBfLRLPlRExKCJ2ATYCjioWtKQRkuol1c+dO3dtjt/MzJrgIfr260xJx6bljwPbA+8Dd6eyicCn0/JWwK2StgA2AGam8kOBz0o6O73vAvRNy49GxCJgkaQFwF2pfCqwW5F4DpJ0DrAx0AuYntvmQxExChgF2XSxLTpiMzMrmXvw7ZCkIcAhwODUW3+BLDkvj4iGpLmCVR/gfknWw94V+HqqCyDguIgYkF59I+LFtG5Zbpcrc+9XUvDBUFIX4CpgaNrHtbl9mJlZFTjBt089gLcjYqmkHYG9S6j/j7R8Uq58LHBGw/VySXu0Mp6GZP6WpG7A0Fa2Y2ZmZeIE3z7dD3SSNAX4MfBsM/UvAMZIegJ4K1f+Y6AzMEXStPS+xSLiHbJe+1TgDmBCa9oxM7Py0aoRXbN1q66uLurr66sdhplZuyFpYkTUlVLXPXgzM7Ma5ARvZmZWg5zgzczMapCvwVvVSFoEvFztOEqwGavfnNgWtYcYwXGWm+Msr/YQ59YR0aeUin7QjVXTy6XeLFJNkurbepztIUZwnOXmOMurvcRZKg/Rm5mZ1SAneDMzsxrkBG/VNKraAZSoPcTZHmIEx1lujrO82kucJfFNdmZmZjXIPXgzM7Ma5ARvZmZWg5zgrewkHS7pZUl/lfT9Ius3lHRrWv+cpH65dT9I5S9LOqwtximpn6R3JU1Kr2uqHOcBkp6X9IGkoQXrTpL0anqdVLhtG4pzRe583lnlOL8r6S+Spkh6WNLWuXVt6Xw2FWdbOp+nSZqaYnlS0k65dW3p971onOv6972sIsIvv8r2AjoCrwH9gQ2AycBOBXW+AVyTlr8I3JqWd0r1NwS2Se10bINx9gOmtaHz2Q/YDbgRGJor7wXMSF83TcubtrU407rFbeh8HgRsnJZPz33f29r5LBpnGzyfm+SWPwvcn5bb2u97Y3Gus9/3cr/cg7dy2wv4a0TMiIj3gd8DxxTUOQa4IS3fBhyc5qQ/Bvh9RCyLiJnAX1N7bS3OdanZOCNiVkRMAVYWbHsY8GBEzI+It4EHgcPbYJzrUilxPhoRS9PbZ4Gt0nJbO5+NxbkulRLnwtzbrkDDnd1t6ve9iTjbLSd4K7ePAX/PvZ+dyorWiYgPgAVA7xK3bQtxAmwj6QVJ4yTtX6EYS42zEtu21Nruq4ukeknPSvpceUNbTUvjPAW4r5Xbro21iRPa2PmU9E1JrwH/A5zZkm3bQJyw7n7fy8qPqrVyK9bDLfwk3FidUrYtl7WJ8w2gb0TMkzQQuEPSzgU9gHJZm3PS1s5nU/pGxBxJ/YFHJE2NiNfKFFteyXFK+jJQBxzY0m3LYG3ihDZ2PiPiV8CvJH0JOA84qdRty2Rt4lyXv+9l5R68ldts4OO591sBcxqrI6kT0AOYX+K2VY8zDSnOA4iIiWTX9naoYpyV2Lal1mpfETEnfZ0BPAbsUc7gckqKU9IhwLnAZyNiWUu2bQNxtrnzmfN7oGFEoc2dz5wP41zHv+/lVe2bAPyqrRfZqNAMsptmGm5m2bmgzjdZ/ea1P6TlnVn9ppsZVO6mm7WJs09DXGQ37fwD6FWtOHN1R7PmTXYzyW4I2zQtt8U4NwU2TMubAa9ScAPUOv6+70H2R3z7gvI2dT6biLOtnc/tc8tHA/Vpua39vjcW5zr7fS/7cVc7AL9q7wUcCbyS/vicm8ouJOtlAHQBxpDdVDMe6J/b9ty03cvAEW0xTuA4YHr6I/E8cHSV4xxE1kNZAswDpue2PTnF/1fga20xTmAfYGo6n1OBU6oc50PAm8Ck9LqzjZ7PonG2wfP5i/T7Mgl4lFxibWO/70XjXNe/7+V8+VG1ZmZmNcjX4M3MzGqQE7yZmVkNcoI3MzOrQU7wZmZmNcgJ3szMrAY5wZvZGgpmI5uk3Ix/LWijp6RvlD+6D9sfLunKSrXfyD4/l58NbR3ve3NJd0uanGaRu7cacVj74QRvZsW8GxEDcq9ZrWijJ9mMfC0iqWMr9lVx6WmGnyObBa0aLiSb7Gb3iNgJWGPK05ZKx2Q1ygnezEoiqaOkkZImpDnIv57Ku6X5yJ9P82k3zNJ1KbBtGgEYKWmIpLtz7V0paXhaniXpfElPAsdL2lbS/ZImSnpC0o7NxDZa0tWSHpU0Q9KBkq6X9KKk0bl6iyX9b4r1YUl9UvmANDHLFEm3S9o0lT8m6WJJ44D/JJtGdGQ6pm0lnZrOx2RJf5S0cS6eKyQ9neIZmovhnHSeJku6NJWVcrxbkD0oCIDIZuZrqs1SjuksSX1S7BPSa9+mzrW1I9V+0o5ffvnV9l7AClY9Ie32VDYCOC8tbwjUkz36sxNpLm2yR6P+lWxyj37k5tEGhgB3595fCQxPy7OAc3LrHiY9OhT4FPBIkRiHA1em5dFkzw9vmHZ4IbArWSdmIjAg1QvgxLR8fm77KcCBaflC4Odp+THgqtw+R7P6Y3Z755Z/ApyRqzcm7X8nsqlKAY4AnmbVPO69WnC8hwHvkD1l7Vxgy2baLPWYfgfsl5b7Ai9W++fPr/K8PDxjZsW8GxEDCsoOBXbL9UZ7ANuT9SovlnQA2VzvHwM2b8U+b4VsRIDscatjpA8nAduwhO3vioiQNBV4MyKmpvamk33YmJTiuzXVvwn4k6QeQM+IGJfKbyBLzqvF1YhdJP2E7HJEN2Bsbt0dEbES+IukhvNxCPCbSPO4R8T8Uo83Isam2eEOJ0vqL0japZE2W3JMhwA75fa9iaTuEbGoieO2dsAJ3sxKJbIe6tjVCrNh9j7AwIhYLmkW2XP8C33A6pcFC+ssSV87AO8U+YDRnIbZ1FbmlhveN/a3rpRndS9pYt1o4HMRMTmdhyFF4oFV05WqyD5LPt6ImE/W4/5dutxxQCNtNid/TB2AwRHxbgvbsDbO1+DNrFRjgdMldQaQtIOkrmQ9+X+l5H4QsHWqvwjontv+dbKe4oaph3lwsZ1ENs/2TEnHp/1I0u5lOoYOQMMIxJeAJyNiAfC2pP1T+VeAccU2Zs1j6g68kc7JiSXs/wHg5Ny1+l6lHq+kf8tt1x3YFvhbI2225JgeAL6V209LP1hZG+UevJmV6jqyoe7nlY3nziW7q/xm4C5J9WTD4C8BRMQ8SU9JmgbcFxHfk/QHsmvDrwIvNLGvE4GrJZ0HdCa7vj65DMewBNhZ0kRgATAslZ8EXJOS5Azga41s/3vgWklnkn1Q+BHwHNmHl6msnvzXEBH3pwRaL+l94F7gh5R2vAOBKyU1jIRcFxET4MOkXNhmqcd0JvArSVPIcsLjwGlNHYe1D55NzszWG5IWR0S3asdhti54iN7MzKwGuQdvZmZWg9yDNzMzq0FO8GZmZjXICd7MzKwGOcGbmZnVICd4MzOzGvT/HrcQU/zodsoAAAAASUVORK5CYII=\n",
+      "text/plain": [
+       "<Figure size 432x288 with 1 Axes>"
+      ]
+     },
+     "metadata": {
+      "needs_background": "light"
+     },
+     "output_type": "display_data"
+    }
+   ],
+   "source": [
+    "import matplotlib.pyplot as plt\n",
+    "import seaborn as sns\n",
+    "%matplotlib inline\n",
+    "\n",
+    "feature_imp = pd.Series(classifier.feature_importances_,index=x_train.columns).sort_values(ascending=False)\n",
+    "\n",
+    "# Creating a bar plot\n",
+    "sns.barplot(x=feature_imp, y=feature_imp.index)\n",
+    "# Add labels to your graph\n",
+    "plt.xlabel('Feature Importance Score')\n",
+    "plt.ylabel('Features')\n",
+    "plt.title(\"Visualizing Important Features\")\n",
+    "plt.legend()\n",
+    "plt.show()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Exercise 1: \n",
+    "Use Adaboost to predict the incidence of diabetes amongst heart patients represented by this dataset."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.7.1"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
+%% Cell type:markdown id: tags:
+
+## AdaBoost
+
+%% Cell type:markdown id: tags:
+
+AdaBoost, or adaptive boosting is an ensemble learning method that uses iteration to learn from the errors of weak classifiers to develop strong classifiers. It is based on the concept that a single weak classifier may not be able to accurately predict the class of an object (slightly better than a guess), but when multiple weak classifiers are combined, a strong classifier can be created.
+* AdaBoost is not a model, it is applied on top other types of classifiers, e.g. logistic regression or decision trees, to learn from their limitations and suggest an improved model.
+* AdaBoost is sequential. Firstly, a model is built based on training data. This model is evaluated, then another model is trained to specifically correct the errors of the first model by increasing the weights of the misclassifed examples and decreasing the weights of the correctly classified examples.
+* This process is repeated iteratively until the model cannot be improved or a predefined limit of iterations is reached.
+* Error is reduced very rapidly, meaning AdaBoost has a high convergence rate
+* Predictions are made by calculating the weighted majority vote or weighted average of the weak classifiers
+
+%% Cell type:code id: tags:
+
+``` python
+import pandas as pd
+from sklearn.ensemble import AdaBoostClassifier
+from sklearn.model_selection import GridSearchCV
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import confusion_matrix
+from sklearn.metrics import accuracy_score
+```
+
+%% Cell type:code id: tags:
+
+``` python
+data = pd.read_csv("./datasets/heart_failure_clinical_records_dataset.csv")
+```
+
+%% Cell type:code id: tags:
+
+``` python
+data.head()
+```
+
+%% Output
+
+        age  anaemia  creatinine_phosphokinase  diabetes  ejection_fraction  \
+    0  75.0        0                       582         0                 20
+    1  55.0        0                      7861         0                 38
+    2  65.0        0                       146         0                 20
+    3  50.0        1                       111         0                 20
+    4  65.0        1                       160         1                 20
+    
+       high_blood_pressure  platelets  serum_creatinine  serum_sodium  sex  \
+    0                    1  265000.00               1.9           130    1
+    1                    0  263358.03               1.1           136    1
+    2                    0  162000.00               1.3           129    1
+    3                    0  210000.00               1.9           137    1
+    4                    0  327000.00               2.7           116    0
+    
+       smoking  time  DEATH_EVENT
+    0        0     4            1
+    1        0     6            1
+    2        1     7            1
+    3        0     7            1
+    4        0     8            1
+
+%% Cell type:code id: tags:
+
+``` python
+data.columns
+```
+
+%% Output
+
+    Index(['age', 'anaemia', 'creatinine_phosphokinase', 'diabetes',
+           'ejection_fraction', 'high_blood_pressure', 'platelets',
+           'serum_creatinine', 'serum_sodium', 'sex', 'smoking', 'time',
+           'DEATH_EVENT'],
+          dtype='object')
+
+%% Cell type:code id: tags:
+
+``` python
+data.features = data[['age', 'anaemia', 'creatinine_phosphokinase', 'diabetes',
+       'ejection_fraction', 'high_blood_pressure', 'platelets',
+       'serum_creatinine', 'serum_sodium', 'sex', 'smoking', 'time']]
+data.target = data.DEATH_EVENT
+```
+
+%% Cell type:code id: tags:
+
+``` python
+x_train, x_test, y_train, y_test = train_test_split(data.features,data.target, test_size=0.2)
+```
+
+%% Cell type:code id: tags:
+
+``` python
+classifier = AdaBoostClassifier(n_estimators=100, learning_rate=0.1)
+classifier.fit(x_train, y_train)
+predictions = classifier.predict(x_test)
+print(confusion_matrix(y_test, predictions))
+print("Accuracy: {:0.2f}%".format(accuracy_score(y_test, predictions)*100))
+```
+
+%% Output
+
+    [[36  8]
+     [ 7  9]]
+    Accuracy: 75.00%
+
+%% Cell type:markdown id: tags:
+
+### Improving the Model via Grid Search
+This method chooses the best parameters for training, but takes a bit longer!
+
+%% Cell type:code id: tags:
+
+``` python
+param_dist = {'n_estimators': [50,100,200],'learning_rate' : [0.01,0.05,0.1,0.3,1],}
+```
+
+%% Cell type:code id: tags:
+
+``` python
+grid_search = GridSearchCV(estimator=AdaBoostClassifier(), param_grid=param_dist, cv=10)
+grid_search.fit(x_train, y_train)
+```
+
+%% Output
+
+    C:\Users\Andreas Shepley\Anaconda3\lib\site-packages\sklearn\model_selection\_search.py:841: DeprecationWarning: The default of the `iid` parameter will change from True to False in version 0.22 and will be removed in 0.24. This will change numeric results when test-set sizes are unequal.
+      DeprecationWarning)
+
+    GridSearchCV(cv=10, error_score='raise-deprecating',
+           estimator=AdaBoostClassifier(algorithm='SAMME.R', base_estimator=None,
+              learning_rate=1.0, n_estimators=50, random_state=None),
+           fit_params=None, iid='warn', n_jobs=None,
+           param_grid={'n_estimators': [50, 100, 200], 'learning_rate': [0.01, 0.05, 0.1, 0.3, 1]},
+           pre_dispatch='2*n_jobs', refit=True, return_train_score='warn',
+           scoring=None, verbose=0)
+
+%% Cell type:code id: tags:
+
+``` python
+predictions = grid_search.predict(x_test)
+```
+
+%% Cell type:code id: tags:
+
+``` python
+print(confusion_matrix(y_test, predictions))
+print("Accuracy: {:0.2f}%".format(accuracy_score(y_test, predictions)*100))
+```
+
+%% Output
+
+    [[34  0]
+     [ 8 18]]
+    Accuracy: 86.67%
+
+%% Cell type:markdown id: tags:
+
+### Visualisation
+
+%% Cell type:code id: tags:
+
+``` python
+import matplotlib.pyplot as plt
+import seaborn as sns
+%matplotlib inline
+
+feature_imp = pd.Series(classifier.feature_importances_,index=x_train.columns).sort_values(ascending=False)
+
+# Creating a bar plot
+sns.barplot(x=feature_imp, y=feature_imp.index)
+# Add labels to your graph
+plt.xlabel('Feature Importance Score')
+plt.ylabel('Features')
+plt.title("Visualizing Important Features")
+plt.legend()
+plt.show()
+```
+
+%% Output
+
+    No handles with labels found to put in legend.
+
+
+
+%% Cell type:markdown id: tags:
+
+### Exercise 1:
+Use Adaboost to predict the incidence of diabetes amongst heart patients represented by this dataset.
+
+%% Cell type:code id: tags:
+
+``` python
+```