Spaces:

Agents-MCP-Hackathon
/

Decider-MCP

Configuration error

App Files Files Community

Kian Kyars commited on Jun 10

Commit

5c65737

1 Parent(s): fc14fba

Add error handling and fallback device mapping for model loading

Browse files

Files changed (1) hide show

app.py +44 -13

app.py CHANGED Viewed

@@ -72,23 +72,54 @@ class Model:
     def load_models(self):
         import os
         os.environ["TOKENIZERS_PARALLELISM"] = "false"
-        self.colqwen2_model = ColQwen2.from_pretrained(
-            "vidore/colqwen2-v0.1",
-            torch_dtype=torch.bfloat16,
-            device_map="cuda:0",
-            trust_remote_code=True,
-        )
         self.colqwen2_processor = ColQwen2Processor.from_pretrained(
             "vidore/colqwen2-v0.1"
         )
-        self.qwen2_vl_model = Qwen2VLForConditionalGeneration.from_pretrained(
-            MODEL_NAME,
-            revision=MODEL_REVISION,
-            torch_dtype=torch.bfloat16,
-            trust_remote_code=True,
-        )
-        self.qwen2_vl_model.to("cuda:0")
         self.qwen2_vl_processor = AutoProcessor.from_pretrained(
             MODEL_NAME,
             revision=MODEL_REVISION,

     def load_models(self):
         import os
         os.environ["TOKENIZERS_PARALLELISM"] = "false"
+        os.environ["TRANSFORMERS_OFFLINE"] = "0"
+        # Load ColQwen2 with explicit configuration
+        try:
+            self.colqwen2_model = ColQwen2.from_pretrained(
+                "vidore/colqwen2-v0.1",
+                torch_dtype=torch.bfloat16,
+                device_map="auto",
+                trust_remote_code=True,
+                low_cpu_mem_usage=True,
+            )
+        except Exception as e:
+            print(f"Error loading ColQwen2: {e}")
+            # Fallback to CPU loading then move to GPU
+            self.colqwen2_model = ColQwen2.from_pretrained(
+                "vidore/colqwen2-v0.1",
+                torch_dtype=torch.bfloat16,
+                device_map=None,
+                trust_remote_code=True,
+            )
+            self.colqwen2_model = self.colqwen2_model.to("cuda:0")
         self.colqwen2_processor = ColQwen2Processor.from_pretrained(
             "vidore/colqwen2-v0.1"
         )
+        # Load Qwen2-VL with explicit configuration
+        try:
+            self.qwen2_vl_model = Qwen2VLForConditionalGeneration.from_pretrained(
+                MODEL_NAME,
+                revision=MODEL_REVISION,
+                torch_dtype=torch.bfloat16,
+                trust_remote_code=True,
+                device_map="auto",
+                low_cpu_mem_usage=True,
+            )
+        except Exception as e:
+            print(f"Error loading Qwen2VL: {e}")
+            # Fallback approach
+            self.qwen2_vl_model = Qwen2VLForConditionalGeneration.from_pretrained(
+                MODEL_NAME,
+                revision=MODEL_REVISION,
+                torch_dtype=torch.bfloat16,
+                trust_remote_code=True,
+                device_map=None,
+            )
+            self.qwen2_vl_model = self.qwen2_vl_model.to("cuda:0")
         self.qwen2_vl_processor = AutoProcessor.from_pretrained(
             MODEL_NAME,
             revision=MODEL_REVISION,