upload 4m intermediate checkpoints

Browse files

Files changed (6) hide show

sit-xl-1-dinov2-b-enc8-invae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/args.json +59 -0
sit-xl-1-dinov2-b-enc8-invae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/checkpoints/1040000.pt +3 -0
sit-xl-1-dinov2-b-enc8-vavae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/args.json +59 -0
sit-xl-1-dinov2-b-enc8-vavae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/checkpoints/1700000.pt +3 -0
sit-xl-dinov2-b-enc8-sdvae-officialstats-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/args.json +59 -0
sit-xl-dinov2-b-enc8-sdvae-officialstats-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/checkpoints/1320000.pt +3 -0

sit-xl-1-dinov2-b-enc8-invae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/args.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+    "output_dir": "exps",
+    "exp_name": "sit-xl-1-dinov2-b-enc8-invae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m",
+    "logging_dir": "logs",
+    "report_to": "wandb",
+    "sampling_steps": 9999999999,
+    "resume_step": 400000,
+    "continue_train_exp_dir": "pretrained_models/sit-xl-1-dinov2-b-enc8-invae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-unfreezedecoder-compile-400k",
+    "wandb_history_path": null,
+    "model": "SiT-XL/1",
+    "num_classes": 1000,
+    "encoder_depth": 8,
+    "qk_norm": false,
+    "bn_momentum": 0.1,
+    "compile": true,
+    "fused_attn": true,
+    "use_swiglu": true,
+    "use_rope": true,
+    "use_rmsnorm": true,
+    "wo_shift": false,
+    "data_dir": "data/imagenet-latents",
+    "resolution": 256,
+    "batch_size": 256,
+    "allow_tf32": true,
+    "mixed_precision": "fp16",
+    "epochs": 1400,
+    "max_train_steps": 4000000,
+    "checkpointing_steps": 20000,
+    "gradient_accumulation_steps": 1,
+    "learning_rate": 0.0001,
+    "adam_beta1": 0.9,
+    "adam_beta2": 0.999,
+    "adam_weight_decay": 0.0,
+    "adam_epsilon": 1e-08,
+    "max_grad_norm": 1.0,
+    "seed": 0,
+    "num_workers": 4,
+    "freeze_bn": false,
+    "path_type": "linear",
+    "prediction": "v",
+    "cfg_prob": 0.1,
+    "enc_type": "dinov2-vit-b",
+    "proj_coeff": 0.5,
+    "weighting": "uniform",
+    "cos_loss": false,
+    "legacy": false,
+    "vae": "f16d32",
+    "vae_ckpt": "pretrained_models/invae-f16d32.pt",
+    "use_sd_vae_stats": false,
+    "imagenette_stats": 0,
+    "disc_pretrained_ckpt": "pretrained_models/invae-discriminator-ckpt.pt",
+    "loss_cfg_path": "configs/loss_cfg/l1_lpips_kl_gan.yaml",
+    "vae_learning_rate": 0.0001,
+    "disc_learning_rate": 0.0001,
+    "vae_train_freq": 1,
+    "vae_align": true,
+    "vae_align_proj_coeff": 1.5,
+    "vae_align_weighting": "uniform"
+}

sit-xl-1-dinov2-b-enc8-invae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/checkpoints/1040000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57fa074be2cce6b090622bd3b0dadbc593a3cfda63400fa6c2ed3e3f4d90824b
+size 11804662737

sit-xl-1-dinov2-b-enc8-vavae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/args.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+    "output_dir": "exps",
+    "exp_name": "sit-xl-1-dinov2-b-enc8-vavae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m",
+    "logging_dir": "logs",
+    "report_to": "wandb",
+    "sampling_steps": 9999999999,
+    "resume_step": 400000,
+    "continue_train_exp_dir": "pretrained_models/sit-xl-1-dinov2-b-enc8-vavae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-400k",
+    "wandb_history_path": null,
+    "model": "SiT-XL/1",
+    "num_classes": 1000,
+    "encoder_depth": 8,
+    "qk_norm": false,
+    "bn_momentum": 0.1,
+    "compile": true,
+    "fused_attn": true,
+    "use_swiglu": true,
+    "use_rope": true,
+    "use_rmsnorm": true,
+    "wo_shift": false,
+    "data_dir": "data/imagenet-latents",
+    "resolution": 256,
+    "batch_size": 256,
+    "allow_tf32": true,
+    "mixed_precision": "fp16",
+    "epochs": 1400,
+    "max_train_steps": 4000000,
+    "checkpointing_steps": 20000,
+    "gradient_accumulation_steps": 1,
+    "learning_rate": 0.0001,
+    "adam_beta1": 0.9,
+    "adam_beta2": 0.999,
+    "adam_weight_decay": 0.0,
+    "adam_epsilon": 1e-08,
+    "max_grad_norm": 1.0,
+    "seed": 0,
+    "num_workers": 4,
+    "freeze_bn": false,
+    "path_type": "linear",
+    "prediction": "v",
+    "cfg_prob": 0.1,
+    "enc_type": "dinov2-vit-b",
+    "proj_coeff": 0.5,
+    "weighting": "uniform",
+    "cos_loss": false,
+    "legacy": false,
+    "vae": "f16d32",
+    "vae_ckpt": "pretrained_models/vavae-f16d32.pt",
+    "use_sd_vae_stats": false,
+    "imagenette_stats": 0,
+    "disc_pretrained_ckpt": "pretrained_models/vavae-discriminator-ckpt.pt",
+    "loss_cfg_path": "configs/loss_cfg/l1_lpips_kl_gan.yaml",
+    "vae_learning_rate": 0.0001,
+    "disc_learning_rate": 0.0001,
+    "vae_train_freq": 1,
+    "vae_align": true,
+    "vae_align_proj_coeff": 1.5,
+    "vae_align_weighting": "uniform"
+}

sit-xl-1-dinov2-b-enc8-vavae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/checkpoints/1700000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0daaeba42aeb36711991480427459f77aa7a3912e40977a9a1c5f9ced5bf2fad
+size 11804662673

sit-xl-dinov2-b-enc8-sdvae-officialstats-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/args.json ADDED Viewed

	@@ -0,0 +1,59 @@

+{
+    "output_dir": "exps",
+    "exp_name": "sit-xl-dinov2-b-enc8-sdvae-officialstats-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m",
+    "logging_dir": "logs",
+    "report_to": "wandb",
+    "sampling_steps": 9999999999,
+    "resume_step": 400000,
+    "continue_train_exp_dir": "pretrained_models/sit-xl-dinov2-b-enc8-sdvae-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-400k",
+    "wandb_history_path": null,
+    "model": "SiT-XL/2",
+    "num_classes": 1000,
+    "encoder_depth": 8,
+    "qk_norm": false,
+    "bn_momentum": 0.1,
+    "compile": true,
+    "fused_attn": true,
+    "use_swiglu": true,
+    "use_rope": true,
+    "use_rmsnorm": true,
+    "wo_shift": false,
+    "data_dir": "data/imagenet-latents",
+    "resolution": 256,
+    "batch_size": 256,
+    "allow_tf32": true,
+    "mixed_precision": "fp16",
+    "epochs": 1400,
+    "max_train_steps": 4000000,
+    "checkpointing_steps": 20000,
+    "gradient_accumulation_steps": 1,
+    "learning_rate": 0.0001,
+    "adam_beta1": 0.9,
+    "adam_beta2": 0.999,
+    "adam_weight_decay": 0.0,
+    "adam_epsilon": 1e-08,
+    "max_grad_norm": 1.0,
+    "seed": 0,
+    "num_workers": 4,
+    "freeze_bn": false,
+    "path_type": "linear",
+    "prediction": "v",
+    "cfg_prob": 0.1,
+    "enc_type": "dinov2-vit-b",
+    "proj_coeff": 0.5,
+    "weighting": "uniform",
+    "cos_loss": false,
+    "legacy": false,
+    "vae": "f8d4",
+    "vae_ckpt": "pretrained_models/sdvae-ft-mse-f8d4.pt",
+    "use_sd_vae_stats": true,
+    "imagenette_stats": 0,
+    "disc_pretrained_ckpt": "pretrained_models/sdvae-original-discriminator-ckpt.pt",
+    "loss_cfg_path": "configs/loss_cfg/l1_lpips_kl_gan.yaml",
+    "vae_learning_rate": 0.0001,
+    "disc_learning_rate": 0.0001,
+    "vae_train_freq": 1,
+    "vae_align": true,
+    "vae_align_proj_coeff": 1.5,
+    "vae_align_weighting": "uniform"
+}

sit-xl-dinov2-b-enc8-sdvae-officialstats-freq1-lr1e-4-momentum0.1-l1-lpips-kl-gan-vaealign1.5-4m/checkpoints/1320000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4694265274047266f15728271821be0af91b0cf630fe4c7eee084a8e28501c7
+size 11969765773