Upload 7 files

Browse files

Files changed (7) hide show

config.json +37 -0
model.safetensors +3 -0
optimizer.pt +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +85 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "_name_or_path": "google-bert/bert-large-uncased",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4da13378a059986d121cd3bb5d8319bccb628d0e3f282fa29c1e14d45a7a5e3e
+size 1340626860

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8b3edb7f3139d674468b069ed5557e70ea0e95ceea496dd00b06144e9f52be24
+size 2681390906

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4b336c534258819cf324eff43e4acecf1273efc3efdf5ba5a1374e7f0d223b7
+size 14244

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd6143a69576aeac9362ce4b277ee7cec45027efcc1769efeb32ee500b52865e
+size 1000

trainer_state.json ADDED Viewed

	@@ -0,0 +1,85 @@

+{
+  "best_metric": 0.9201655011655012,
+  "best_model_checkpoint": "./FINAL_MODEL/results/google-bert_bert-large-uncased\\checkpoint-900",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 900,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.855,
+      "eval_f1": 0.8542790811339199,
+      "eval_loss": 0.4566820561885834,
+      "eval_precision": 0.8639506969003538,
+      "eval_recall": 0.855,
+      "eval_runtime": 2.6091,
+      "eval_samples_per_second": 76.656,
+      "eval_steps_per_second": 9.582,
+      "step": 300
+    },
+    {
+      "epoch": 1.6666666666666665,
+      "grad_norm": 0.20497265458106995,
+      "learning_rate": 9.826732673267328e-06,
+      "loss": 0.64,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.895,
+      "eval_f1": 0.8950875947754062,
+      "eval_loss": 0.31654176115989685,
+      "eval_precision": 0.9020870357712463,
+      "eval_recall": 0.895,
+      "eval_runtime": 2.7281,
+      "eval_samples_per_second": 73.312,
+      "eval_steps_per_second": 9.164,
+      "step": 600
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.92,
+      "eval_f1": 0.9201655011655012,
+      "eval_loss": 0.4490419030189514,
+      "eval_precision": 0.9214505597014926,
+      "eval_recall": 0.92,
+      "eval_runtime": 2.6499,
+      "eval_samples_per_second": 75.475,
+      "eval_steps_per_second": 9.434,
+      "step": 900
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 900,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 1,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 942535267203456.0,
+  "train_batch_size": 6,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b21d236746cb3f4085518713a4792bbbeac0d2a5542e4eee2c07e4cbb0256fa1
+size 5368