Training in progress, step 3900, checkpoint

Files changed (4) hide show

last-checkpoint/optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:89d76af87c627c8a530615d241fa48d9349e7cd99fb14a2d28c7b767fce70718
+size 3096956278

last-checkpoint/rng_state.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1cdddd1ad7d41a694f625986332e4a3934616b6a0a8ad0bd646e4d5afacb56b6
+size 14244

last-checkpoint/scheduler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5eb997ec8b3e1b3a4c09f26de1f56eaaf33d1b7ee43d985d4da13efffe0d547
+size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 71.37931034482759,
-  "best_model_checkpoint": "./whisper-large-v3-cv17-dv/checkpoint-2700",
-  "epoch": 10.88599348534202,
   "eval_steps": 300,
-  "global_step": 3600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -367,6 +367,36 @@
       "eval_steps_per_second": 0.02,
       "eval_wer": 71.72413793103448,
       "step": 3600
     }
   ],
   "logging_steps": 100,
@@ -386,7 +416,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.954580775763968e+20,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 71.03448275862068,
+  "best_model_checkpoint": "./whisper-large-v3-cv17-dv/checkpoint-3900",
+  "epoch": 11.863192182410424,
   "eval_steps": 300,
+  "global_step": 3900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.02,
       "eval_wer": 71.72413793103448,
       "step": 3600
+    },
+    {
+      "epoch": 11.211726384364821,
+      "grad_norm": 0.03168971464037895,
+      "learning_rate": 8.714285714285716e-07,
+      "loss": 0.0005,
+      "step": 3700
+    },
+    {
+      "epoch": 11.537459283387623,
+      "grad_norm": 0.020701788365840912,
+      "learning_rate": 5.857142857142857e-07,
+      "loss": 0.0003,
+      "step": 3800
+    },
+    {
+      "epoch": 11.863192182410424,
+      "grad_norm": 0.05785975977778435,
+      "learning_rate": 3.0000000000000004e-07,
+      "loss": 0.0003,
+      "step": 3900
+    },
+    {
+      "epoch": 11.863192182410424,
+      "eval_loss": 0.4610276520252228,
+      "eval_runtime": 143.56,
+      "eval_samples_per_second": 0.697,
+      "eval_steps_per_second": 0.021,
+      "eval_wer": 71.03448275862068,
+      "step": 3900
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 2.117320944648192e+20,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null