LeanQuant commited on Jun 25

Commit

a5747bf

verified ·

1 Parent(s): 2532805

Add files using upload-large-folder tool

Browse files

Files changed (41) hide show

README.md +43 -0
config.json +51 -0
context_refiner_0.safetensors +3 -0
context_refiner_1.safetensors +3 -0
diffusion_pytorch_model.safetensors +3 -0
layers_0.safetensors +3 -0
layers_1.safetensors +3 -0
layers_10.safetensors +3 -0
layers_11.safetensors +3 -0
layers_12.safetensors +3 -0
layers_13.safetensors +3 -0
layers_14.safetensors +3 -0
layers_15.safetensors +3 -0
layers_16.safetensors +3 -0
layers_17.safetensors +3 -0
layers_18.safetensors +3 -0
layers_19.safetensors +3 -0
layers_2.safetensors +3 -0
layers_20.safetensors +3 -0
layers_21.safetensors +3 -0
layers_22.safetensors +3 -0
layers_23.safetensors +3 -0
layers_24.safetensors +3 -0
layers_25.safetensors +3 -0
layers_26.safetensors +3 -0
layers_27.safetensors +3 -0
layers_28.safetensors +3 -0
layers_29.safetensors +3 -0
layers_3.safetensors +3 -0
layers_30.safetensors +3 -0
layers_31.safetensors +3 -0
layers_4.safetensors +3 -0
layers_5.safetensors +3 -0
layers_6.safetensors +3 -0
layers_7.safetensors +3 -0
layers_8.safetensors +3 -0
layers_9.safetensors +3 -0
noise_refiner_0.safetensors +3 -0
noise_refiner_1.safetensors +3 -0
ref_image_refiner_0.safetensors +3 -0
ref_image_refiner_1.safetensors +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,43 @@

+---
+base_model:
+  - OmniGen2/OmniGen2
+base_model_relation: quantized
+pipeline_tag: any-to-any
+tags:
+- dfloat11
+- df11
+- lossless compression
+- 70% size, 100% accuracy
+---
+# DFloat11 Compressed Model: `OmniGen2/OmniGen2` Transformer
+This is a **DFloat11 losslessly compressed** version of the original `OmniGen2/OmniGen2` model. It reduces model size by **32%** compared to the original BFloat16 model, while maintaining **bit-identical outputs** and supporting **efficient GPU inference**.
+### 📊 Performance Comparison
+| Metric                                          | OmniGen2 (BFloat16) | OmniGen2 (DFloat11) |
+| ----------------------------------------------- | ------------------- | ------------------- |
+| Model Size                                      | 16.23 GB            | 11.11 GB            |
+| Peak GPU Memory<br>(1024×1024 image generation) | 18.41 GB            | 14.36 GB            |
+| Generation Time<br>(A100 GPU)                   | 25 seconds          | 27 seconds          |
+### 🔧 How to Use
+A complete usage guide is available in our GitHub repository (forked from the official OmniGen2 repository).
+👉 [https://github.com/LeanModels/OmniGen2-DFloat11](https://github.com/LeanModels/OmniGen2-DFloat11) 👈
+### 🔍 How It Works
+We apply **Huffman coding** to losslessly compress the exponent bits of BFloat16 model weights, which are highly compressible (their 8 bits carry only ~2.6 bits of actual information). To enable fast inference, we implement a highly efficient CUDA kernel that performs on-the-fly weight decompression directly on the GPU.
+The result is a model that is **~32% smaller**, delivers **bit-identical outputs**, and achieves performance **comparable to the original** BFloat16 model.
+Learn more in our [research paper](https://arxiv.org/abs/2504.11651).
+### 📄 Learn More
+* **Paper**: [70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float](https://arxiv.org/abs/2504.11651)
+* **GitHub**: [https://github.com/LeanModels/DFloat11](https://github.com/LeanModels/DFloat11)
+* **HuggingFace**: [https://huggingface.co/DFloat11](https://huggingface.co/DFloat11)

config.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "dfloat11_config": {
+    "bytes_per_thread": 8,
+    "pattern_dict": {
+      "noise_refiner\\.\\d+": [
+            "attn.to_q",
+            "attn.to_k",
+            "attn.to_v",
+            "attn.to_out.0",
+            "feed_forward.linear_1",
+            "feed_forward.linear_2",
+            "feed_forward.linear_3",
+            "norm1.linear"
+        ],
+        "ref_image_refiner\\.\\d+": [
+            "attn.to_q",
+            "attn.to_k",
+            "attn.to_v",
+            "attn.to_out.0",
+            "feed_forward.linear_1",
+            "feed_forward.linear_2",
+            "feed_forward.linear_3",
+            "norm1.linear"
+        ],
+        "context_refiner\\.\\d+": [
+            "attn.to_q",
+            "attn.to_k",
+            "attn.to_v",
+            "attn.to_out.0",
+            "feed_forward.linear_1",
+            "feed_forward.linear_2",
+            "feed_forward.linear_3"
+        ],
+        "layers\\.\\d+": [
+            "attn.to_q",
+            "attn.to_k",
+            "attn.to_v",
+            "attn.to_out.0",
+            "feed_forward.linear_1",
+            "feed_forward.linear_2",
+            "feed_forward.linear_3",
+            "norm1.linear"
+        ]
+    },
+    "threads_per_block": [
+      512
+    ],
+    "version": "0.2.0"
+  },
+  "model_type": "qwen2_5_vl"
+}

context_refiner_0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6dd224665cdc0a3c09711881f117767adfbeb40173b1acc80ed5df64e9d8ab5f
+size 127419527

context_refiner_1.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3e0dc953d4a1a2318a35f7153a5d1f19d4103f2f8f903beddb982fa5f871f221
+size 127447903

diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:831a7da82e68b23a8ee03309eb990666928d06ac69784599a057fe902b546c98
+size 19127376

layers_0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e36a751c0172e8a235ef245e5762fdb5470a9f05e9e1a9f08c843fb608c8dbe5
+size 142820420

layers_1.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6bf226e341b55cabecdc3e1451dc88a9d49cd24fb4ea8d71d3981c0ca9e942ec
+size 142260578

layers_10.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25eda293ef4d237f8fac3587bb86f5bfa7948b93dd195a9d1be11c95a29b72eb
+size 142357632

layers_11.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27bc99d50df4e4cf9999ba0aa2ba1212651c2c6269ac106215d49e9ea7e5fe26
+size 142242516

layers_12.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a20de82fd25bebdb0471bf6aab41aed02fc616491ef0ca6dcff97445911346f
+size 142304726

layers_13.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:469b0aef2b99a5b6c4a4b5199d3947d5ce9844a2823a3c4774c60d15af5dab5a
+size 142261740

layers_14.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a570b1c3c750b1eb0d0d0cd904b037b42b5802824ac723a62da67faffc3283df
+size 142337809

layers_15.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ebefbd0292efbc05e00c949e2cca4b895611bf44eb3c919c72a217bbd91c933
+size 142348063

layers_16.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a4cf29d32bd75fb7e545d81f0b98ec8e8a3f4b4206c7243644da95020a069eca
+size 142387962

layers_17.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b6e0e85d3195b4e681cd822001d5106ce4e7684e54bf0c86d96526a787fe7585
+size 142405964

layers_18.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:faeaf2e03e5b0f49e96436776174dd868e44a22fddc0c3b5c16e3b6e6f28fd7e
+size 142459064

layers_19.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29cd715f9a3e887a2cf309017889d9ce7ee4e2209aa76fd0ff373f7d7e6cfbf3
+size 142437785

layers_2.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b4d38c0f44d066d72e9ab8aa992776c051b0264eeddfb1386213add0807b762f
+size 142128788

layers_20.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0db56a0614bcddfdc7e8d4a5cd13ac27514d6dce25633bcc5414ecb1d6e55ca1
+size 142549085

layers_21.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f45e752a0b6ccf394617e9758b66322eef395fc722aa1fa6f93485ae384eb631
+size 142561574

layers_22.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:567b3518e38e091a004b11ab5f865fc73976c156bf4f9d8a9330903fafca0ad3
+size 142633393

layers_23.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76d3c571ad5e842578d931c80faa9254884094f9b02a5c7abbf26f8c1516ba2f
+size 142697478

layers_24.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4faac652df2771945849893f41e77f5fbe3d9cf88a79d23ed9be9f8736d0b7f5
+size 142742762

layers_25.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1e4dd9d11da9454affbcf284ffc1126426780eb73bc1bcdf7be7c5e0109112cc
+size 142825095

layers_26.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:808a5f420443e18a3acbbb1640f5e241ce8eacbb9a81cb557d54310ecc82462e
+size 142966045

layers_27.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de36af27aa3d315d2ed364d7e209d26c3f82aa9f26da9a3a174c51baba0bfb65
+size 143206962

layers_28.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd213476230ccb02ff9e12b41554df7fb6473bba9eec6002a11b84776027349d
+size 143364582

layers_29.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d812fc9b35b3e650572baaa49abb45757b51e8385897c7a521f488fc8c2fdd1
+size 142953296

layers_3.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:22a6f396d83893a1aedbca8b4d2a7cbac241e42813603b2db119ead2ddf7da8e
+size 142111594

layers_30.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:250b4a7001f7fbb9de722874686b92293eee6d2360de7e3c0702ff51ae123d35
+size 142830751

layers_31.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5fed993d72d35719a0fd3d1df43925a299ca9c0dcd67d2d901650bd00a98de5
+size 143581795

layers_4.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1a5770a296dec5e2cdfbcdc4391a81378ef9ac4be79f67f00e7aade0f354e103
+size 142117666

layers_5.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fcd6b32b5db61aa5883ed844cdad5dab3f0e5ef0a0532b664e7bcdbeb2921e5b
+size 142167790

layers_6.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7fe6a918f75222c9c5d751003cd0e2744f0be8bf5f0febac8cc0d3b288201a07
+size 142225928

layers_7.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2136806d1a0b366623e884d0cd360d8eff9a9153ca7feb7ade57ca0f1e65556e
+size 141974416

layers_8.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c0297c58e8948d534e0c8604018dcf45ad2f0f1ecd9367e1cb501bce7719ee8
+size 142314448

layers_9.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8db696d798567d6a9a3ba223fc00ba9ab66f077eef881372aef819d58f356204
+size 142356055

noise_refiner_0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f7ed2d5518567de8b5949f7c11d025dd3fefcdba57675880e02b62ebcedb01f
+size 142931134

noise_refiner_1.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ed67969b91b6b5b0e32b47694396dbc81bbb1de471e243d2265026b130bb822
+size 142687584

ref_image_refiner_0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3469815dd57c338bd24b62bb18ac509293d763c2f6ee2a67a6a9fd6992d05930
+size 142876011

ref_image_refiner_1.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fad91b438366dca5283d5e09d43d9eed0f421f2075773b22e4f8829b893e42d8
+size 142536784