More fixes

mattdangerw · mattdangerw · commit a253729a11e0 · 2025-04-26T18:29:24.000-07:00
diff --git a/chapter12_object-detection.ipynb b/chapter12_object-detection.ipynb
@@ -585,7 +585,7 @@
    "outputs": [],
    "source": [
     "url = (\n",
-    "    \"https://upload.wikimedia.org/wikipedia/commons/thumb/7/7d/\"\n",
+    "    \"https://upload.wikimedia.org/wikipedia/commons/7/7d/\"\n",
     "    \"A_Sunday_on_La_Grande_Jatte%2C_Georges_Seurat%2C_1884.jpg\"\n",
     ")\n",
     "path = keras.utils.get_file(origin=url)\n",
diff --git a/chapter18_best-practices-for-the-real-world.ipynb b/chapter18_best-practices-for-the-real-world.ipynb
@@ -142,7 +142,7 @@
     "tuner = kt.BayesianOptimization(\n",
     "    build_model,\n",
     "    objective=\"val_accuracy\",\n",
-    "    max_trials=100,\n",
+    "    max_trials=20,\n",
     "    executions_per_trial=2,\n",
     "    directory=\"mnist_kt_test\",\n",
     "    overwrite=True,\n",
@@ -241,6 +241,7 @@
    "source": [
     "def get_best_trained_model(hp):\n",
     "    best_epoch = get_best_epoch(hp)\n",
+    "    model = build_model(hp)\n",
     "    model.fit(\n",
     "        x_train_full, y_train_full, batch_size=128, epochs=int(best_epoch * 1.2)\n",
     "    )\n",
@@ -327,44 +328,6 @@
     "##### Model parallelism: split your model across multiple GPUs"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "model = keras.Sequential(\n",
-    "    [\n",
-    "        keras.layers.Input(shape=(16000,)),\n",
-    "        keras.layers.Dense(64000, activation=\"relu\"),\n",
-    "        keras.layers.Dense(8000, activation=\"sigmoid\"),\n",
-    "    ]\n",
-    ")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "half_kernel_0 = kernel[:, :32000]\n",
-    "half_bias_0 = bias[:32000]\n",
-    "\n",
-    "half_kernel_1 = kernel[:, 32000:]\n",
-    "half_bias_1 = bias[32000:]\n",
-    "\n",
-    "with keras.device(\"gpu:0\"):\n",
-    "    half_output_0 = keras.ops.matmul(inputs, half_kernel_0) + half_bias_0\n",
-    "\n",
-    "with keras.device(\"gpu:1\"):\n",
-    "    half_output_1 = keras.ops.matmul(inputs, half_kernel_1) + half_bias_1"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {
@@ -392,41 +355,6 @@
     "###### Using data parallelism with JAX"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "keras.distribution.set_distribution(keras.distribution.DataParallel())"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "keras.distribution.list_devices()"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "keras.distribution.set_distribution(\n",
-    "    keras.distribution.DataParallel([\"gpu:0\", \"gpu:1\"])\n",
-    ")"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {
@@ -436,117 +364,6 @@
     "###### Using model parallelism with JAX"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "mesh = keras.distribution.DeviceMesh(\n",
-    "    shape=(2, 4),\n",
-    "    axis_names=[\"data\", \"model\"],\n",
-    ")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "devices = [f\"gpu:{i}\" for i in range(8)]\n",
-    "mesh = keras.distribution.DeviceMesh(\n",
-    "    shape=(2, 4),\n",
-    "    axis_names=[\"data\", \"model\"],\n",
-    "    devices=devices,\n",
-    ")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "for v in model.variables:\n",
-    "    print(v.path)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "sequential/dense/kernel\n",
-    "sequential/dense/bias\n",
-    "sequential/dense_1/kernel\n",
-    "sequential/dense_1/bias"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "layout_map = keras.distribution.LayoutMap(device_mesh)\n",
-    "layout_map[\"sequential/dense/kernel\"] = (None, \"model\")\n",
-    "layout_map[\"sequential/dense/bias\"] = (\"model\",)\n",
-    "layout_map[\"sequential/dense_1/kernel\"] = (None, \"model\")\n",
-    "layout_map[\"sequential/dense_1/bias\"] = (\"model\",)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "model_parallel = keras.distribution.ModelParallel(\n",
-    "    layout_map=layout_map,\n",
-    "    batch_dim_name=\"data\",\n",
-    ")\n",
-    "keras.distribution.set_distribution(model_parallel)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "model.layers[0].kernel.value.sharding"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "import jax\n",
-    "\n",
-    "value = model.layers[0].kernel.value\n",
-    "jax.debug.visualize_sharding(value.shape, value.sharding)"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {
@@ -592,19 +409,6 @@
     "##### Float16 inference"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "import keras\n",
-    "\n",
-    "keras.config.set_dtype_policy(\"float16\")"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {
@@ -614,19 +418,6 @@
     "##### Mixed-precision training"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "import keras\n",
-    "\n",
-    "keras.config.set_dtype_policy(\"mixed_float16\")"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {
@@ -636,30 +427,6 @@
     "##### Using loss scaling with mixed precision"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "optimizer = keras.optimizers.Adam(learning_rate=1e-3, loss_scale_factor=10)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "optimizer = keras.optimizers.LossScaleOptimizer(\n",
-    "    keras.optimizers.Adam(learning_rate=1e-3)\n",
-    ")"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {
@@ -746,19 +513,6 @@
     "ops.matmul(x, kernel)"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": 0,
-   "metadata": {
-    "colab_type": "code"
-   },
-   "outputs": [],
-   "source": [
-    "model = ...\n",
-    "model.quantize(\"int8\")\n",
-    "predictions = model.predict(...)"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {