End of training

Files changed (6) hide show

README.md CHANGED Viewed

@@ -3,6 +3,9 @@ library_name: transformers
 license: cc-by-nc-4.0
 base_model: csikasote/mms-1b-all-swagen-combined-m50f50-dnn-42-0.04
 tags:
 - generated_from_trainer
 model-index:
 - name: mms-1b-all-swagen-combined-m50f50-dnn-42-0.04
@@ -14,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # mms-1b-all-swagen-combined-m50f50-dnn-42-0.04
-This model is a fine-tuned version of [csikasote/mms-1b-all-swagen-combined-m50f50-dnn-42-0.04](https://huggingface.co/csikasote/mms-1b-all-swagen-combined-m50f50-dnn-42-0.04) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.2920
 - Cer: 0.0722

 license: cc-by-nc-4.0
 base_model: csikasote/mms-1b-all-swagen-combined-m50f50-dnn-42-0.04
 tags:
+- automatic-speech-recognition
+- swagen
+- mms
 - generated_from_trainer
 model-index:
 - name: mms-1b-all-swagen-combined-m50f50-dnn-42-0.04
 # mms-1b-all-swagen-combined-m50f50-dnn-42-0.04
+This model is a fine-tuned version of [csikasote/mms-1b-all-swagen-combined-m50f50-dnn-42-0.04](https://huggingface.co/csikasote/mms-1b-all-swagen-combined-m50f50-dnn-42-0.04) on the SWAGEN - AFA dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.2920
 - Cer: 0.0722

adapter.afa.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:237b86653d252e4d201062f9fa4936e2099bc2ceb5ada42e75dbbd7a89c5023d
+size 339945692

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 6.300395256916996,
-    "eval_cer": 0.16455469082916546,
-    "eval_loss": 0.5985782742500305,
-    "eval_runtime": 49.3519,
     "eval_samples": 693,
-    "eval_samples_per_second": 14.042,
-    "eval_steps_per_second": 3.526,
-    "total_flos": 8.426850447091405e+18,
-    "train_loss": 0.687478952407837,
-    "train_runtime": 1856.1791,
     "train_samples": 2020,
-    "train_samples_per_second": 32.648,
-    "train_steps_per_second": 2.053
 }

 {
+    "epoch": 3.150197628458498,
+    "eval_cer": 0.07215107542557248,
+    "eval_loss": 0.2919570505619049,
+    "eval_runtime": 57.5043,
     "eval_samples": 693,
+    "eval_samples_per_second": 12.051,
+    "eval_steps_per_second": 3.026,
+    "total_flos": 4.226925921384762e+18,
+    "train_loss": 0.27302908420562744,
+    "train_runtime": 1065.0597,
     "train_samples": 2020,
+    "train_samples_per_second": 56.898,
+    "train_steps_per_second": 3.577
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 6.300395256916996,
-    "eval_cer": 0.16455469082916546,
-    "eval_loss": 0.5985782742500305,
-    "eval_runtime": 49.3519,
     "eval_samples": 693,
-    "eval_samples_per_second": 14.042,
-    "eval_steps_per_second": 3.526
 }

 {
+    "epoch": 3.150197628458498,
+    "eval_cer": 0.07215107542557248,
+    "eval_loss": 0.2919570505619049,
+    "eval_runtime": 57.5043,
     "eval_samples": 693,
+    "eval_samples_per_second": 12.051,
+    "eval_steps_per_second": 3.026
 }

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 6.300395256916996,
-    "total_flos": 8.426850447091405e+18,
-    "train_loss": 0.687478952407837,
-    "train_runtime": 1856.1791,
     "train_samples": 2020,
-    "train_samples_per_second": 32.648,
-    "train_steps_per_second": 2.053
 }

 {
+    "epoch": 3.150197628458498,
+    "total_flos": 4.226925921384762e+18,
+    "train_loss": 0.27302908420562744,
+    "train_runtime": 1065.0597,
     "train_samples": 2020,
+    "train_samples_per_second": 56.898,
+    "train_steps_per_second": 3.577
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff