raffelm
/

bloomz-simulmask-en-fr

PyTorch

bloom

Model card Files Files and versions

xet

Community

raffelm commited on Oct 27, 2024

Commit

8f00ea1

verified ·

1 Parent(s): f754e5c

Upload 10 files

Browse files

Files changed (3) hide show

pytorch_model.bin +1 -1
trainer_state.json +35 -35
training_args.bin +1 -1

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3a736720d95ba8bd0a30613ae46c36a84cd21335d44c6ebd7ec5bbad305e4de
 size 1118121246

 version https://git-lfs.github.com/spec/v1
+oid sha256:c66a7a5ac362812ec8bf77fac363f364326766289cf1db92c1078e4313a8329a
 size 1118121246

trainer_state.json CHANGED Viewed

@@ -11,99 +11,99 @@
     {
       "epoch": 0.27,
       "learning_rate": 0.00011454256850621083,
-      "loss": 1.5582,
       "step": 1000
     },
     {
       "epoch": 0.27,
-      "eval_loss": 2.1084280014038086,
-      "eval_runtime": 3.7072,
-      "eval_samples_per_second": 240.072,
-      "eval_steps_per_second": 30.211,
       "step": 1000
     },
     {
       "epoch": 0.55,
       "learning_rate": 8.099382692526634e-05,
-      "loss": 1.2078,
       "step": 2000
     },
     {
       "epoch": 0.55,
-      "eval_loss": 1.7273415327072144,
-      "eval_runtime": 3.6878,
-      "eval_samples_per_second": 241.334,
-      "eval_steps_per_second": 30.37,
       "step": 2000
     },
     {
       "epoch": 0.82,
       "learning_rate": 6.613118276073197e-05,
-      "loss": 1.0718,
       "step": 3000
     },
     {
       "epoch": 0.82,
-      "eval_loss": 1.6304664611816406,
-      "eval_runtime": 3.687,
-      "eval_samples_per_second": 241.39,
-      "eval_steps_per_second": 30.377,
       "step": 3000
     },
     {
       "epoch": 1.1,
       "learning_rate": 5.7271284253105416e-05,
-      "loss": 0.9125,
       "step": 4000
     },
     {
       "epoch": 1.1,
-      "eval_loss": 1.5620102882385254,
-      "eval_runtime": 3.6964,
-      "eval_samples_per_second": 240.774,
-      "eval_steps_per_second": 30.3,
       "step": 4000
     },
     {
       "epoch": 1.37,
       "learning_rate": 5.1224993899462795e-05,
-      "loss": 0.7192,
       "step": 5000
     },
     {
       "epoch": 1.37,
-      "eval_loss": 1.5576059818267822,
-      "eval_runtime": 3.6938,
-      "eval_samples_per_second": 240.945,
-      "eval_steps_per_second": 30.321,
       "step": 5000
     },
     {
       "epoch": 1.65,
       "learning_rate": 4.676180777800049e-05,
-      "loss": 0.7183,
       "step": 6000
     },
     {
       "epoch": 1.65,
-      "eval_loss": 1.5256845951080322,
-      "eval_runtime": 3.6978,
-      "eval_samples_per_second": 240.681,
-      "eval_steps_per_second": 30.288,
       "step": 6000
     },
     {
       "epoch": 1.92,
       "learning_rate": 4.329302154257329e-05,
-      "loss": 0.716,
       "step": 7000
     },
     {
       "epoch": 1.92,
-      "eval_loss": 1.530071496963501,
-      "eval_runtime": 3.6992,
-      "eval_samples_per_second": 240.591,
-      "eval_steps_per_second": 30.277,
       "step": 7000
     }
   ],

     {
       "epoch": 0.27,
       "learning_rate": 0.00011454256850621083,
+      "loss": 1.5046,
       "step": 1000
     },
     {
       "epoch": 0.27,
+      "eval_loss": 2.7397329807281494,
+      "eval_runtime": 3.8318,
+      "eval_samples_per_second": 232.268,
+      "eval_steps_per_second": 29.229,
       "step": 1000
     },
     {
       "epoch": 0.55,
       "learning_rate": 8.099382692526634e-05,
+      "loss": 1.1958,
       "step": 2000
     },
     {
       "epoch": 0.55,
+      "eval_loss": 2.4763500690460205,
+      "eval_runtime": 3.7761,
+      "eval_samples_per_second": 235.692,
+      "eval_steps_per_second": 29.66,
       "step": 2000
     },
     {
       "epoch": 0.82,
       "learning_rate": 6.613118276073197e-05,
+      "loss": 1.0733,
       "step": 3000
     },
     {
       "epoch": 0.82,
+      "eval_loss": 2.391991138458252,
+      "eval_runtime": 3.7954,
+      "eval_samples_per_second": 234.495,
+      "eval_steps_per_second": 29.51,
       "step": 3000
     },
     {
       "epoch": 1.1,
       "learning_rate": 5.7271284253105416e-05,
+      "loss": 0.9219,
       "step": 4000
     },
     {
       "epoch": 1.1,
+      "eval_loss": 2.3582706451416016,
+      "eval_runtime": 3.7454,
+      "eval_samples_per_second": 237.627,
+      "eval_steps_per_second": 29.904,
       "step": 4000
     },
     {
       "epoch": 1.37,
       "learning_rate": 5.1224993899462795e-05,
+      "loss": 0.7324,
       "step": 5000
     },
     {
       "epoch": 1.37,
+      "eval_loss": 2.3552770614624023,
+      "eval_runtime": 3.775,
+      "eval_samples_per_second": 235.76,
+      "eval_steps_per_second": 29.669,
       "step": 5000
     },
     {
       "epoch": 1.65,
       "learning_rate": 4.676180777800049e-05,
+      "loss": 0.7311,
       "step": 6000
     },
     {
       "epoch": 1.65,
+      "eval_loss": 2.318331003189087,
+      "eval_runtime": 3.7693,
+      "eval_samples_per_second": 236.117,
+      "eval_steps_per_second": 29.714,
       "step": 6000
     },
     {
       "epoch": 1.92,
       "learning_rate": 4.329302154257329e-05,
+      "loss": 0.7289,
       "step": 7000
     },
     {
       "epoch": 1.92,
+      "eval_loss": 2.3413245677948,
+      "eval_runtime": 3.7689,
+      "eval_samples_per_second": 236.14,
+      "eval_steps_per_second": 29.717,
       "step": 7000
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84a305c08093b6e784a8914dca2025b0771beaeb7f5a9755194979837345471f
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:96c3dd11f8c11339c2aea1f3d87d9c4f9426241acd4630ac2b3063a1841d5949
 size 4600