Spaces:

Tonic
/

VoxFactory

Running

App Files Files Community

Joseph Pollack commited on Sep 13

Commit

7ca96a1

unverified ·

1 Parent(s): 1de56de

removes trackio for testing

Browse files

Files changed (4) hide show

interface.py +26 -8
scripts/deploy_demo_space.py +53 -51
scripts/train.py +2 -4
scripts/train_lora.py +2 -4

interface.py CHANGED Viewed

@@ -460,11 +460,20 @@ def start_voxtral_training(
     # Collect all logs
     all_logs = []
-    def collect_logs(generator):
-        """Helper to collect logs from a generator."""
         for line in generator:
             all_logs.append(line)
-            print(line)  # Also print to console for debugging
     try:
         # 1) Train
@@ -493,7 +502,10 @@ def start_voxtral_training(
                 args += ["--freeze-audio-tower"]
         all_logs.append("🚀 Starting Voxtral training...")
-        collect_logs(run_command_stream(args, env))
         all_logs.append("✅ Training completed!")
         # 2) Push to Hub
@@ -505,8 +517,11 @@ def start_voxtral_training(
                 full_repo_name,
             ]
             all_logs.append(f"📤 Pushing model to Hugging Face Hub: {full_repo_name}")
-            collect_logs(run_command_stream(push_args, env))
-            all_logs.append("✅ Model pushed successfully!")
         # 3) Deploy demo Space
         if deploy_demo:
@@ -522,8 +537,11 @@ def start_voxtral_training(
                 "--space-name", demo_space_name,
             ]
             all_logs.append("🚀 Deploying demo Space...")
-            collect_logs(run_command_stream(deploy_args, env))
-            all_logs.append("✅ Demo Space deployed!")
         # Return all collected logs as a single string
         return "\n".join(all_logs)

     # Collect all logs
     all_logs = []
+    def collect_logs_with_code(generator):
+        """Collect logs and parse the exit code from the final status line."""
+        import re
+        exit_code = None
         for line in generator:
             all_logs.append(line)
+            print(line)
+            m = re.search(r"exit code:\s*(\d+)", line)
+            if m:
+                try:
+                    exit_code = int(m.group(1))
+                except Exception:
+                    pass
+        return 0 if exit_code == 0 else (exit_code if exit_code is not None else 1)
     try:
         # 1) Train
                 args += ["--freeze-audio-tower"]
         all_logs.append("🚀 Starting Voxtral training...")
+        train_code = collect_logs_with_code(run_command_stream(args, env))
+        if train_code != 0:
+            all_logs.append("❌ Training failed. Skipping model push and demo deployment.")
+            return "\n".join(all_logs)
         all_logs.append("✅ Training completed!")
         # 2) Push to Hub
                 full_repo_name,
             ]
             all_logs.append(f"📤 Pushing model to Hugging Face Hub: {full_repo_name}")
+            push_code = collect_logs_with_code(run_command_stream(push_args, env))
+            if push_code != 0:
+                all_logs.append("❌ Model push failed.")
+            else:
+                all_logs.append("✅ Model pushed successfully!")
         # 3) Deploy demo Space
         if deploy_demo:
                 "--space-name", demo_space_name,
             ]
             all_logs.append("🚀 Deploying demo Space...")
+            deploy_code = collect_logs_with_code(run_command_stream(deploy_args, env))
+            if deploy_code != 0:
+                all_logs.append("❌ Demo Space deployment failed.")
+            else:
+                all_logs.append("✅ Demo Space deployed!")
         # Return all collected logs as a single string
         return "\n".join(all_logs)

scripts/deploy_demo_space.py CHANGED Viewed

@@ -189,36 +189,37 @@ class DemoSpaceDeployer:
             # For GPT-OSS models, we need more sophisticated environment setup
             model_name = self.model_id.split("/")[-1] if "/" in self.model_id else self.model_id
             import json as _json
-            env_setup = f"""
-# Environment variables for GPT-OSS model configuration
 import os
-os.environ['HF_MODEL_ID'] = json.dumps(self.model_id)
-os.environ['LORA_MODEL_ID'] = json.dumps(self.model_id)
 os.environ['BASE_MODEL_ID'] = 'openai/gpt-oss-20b'
-os.environ['MODEL_SUBFOLDER'] = json.dumps(self.subfolder if self.subfolder else "")
-os.environ['MODEL_NAME'] = json.dumps(model_name)
-os.environ['MODEL_IDENTITY'] = json.dumps(self.model_identity or "")
-os.environ['SYSTEM_MESSAGE'] = json.dumps(self.system_message or (self.model_identity or ""))
-os.environ['DEVELOPER_MESSAGE'] = json.dumps(self.developer_message or "")
-os.environ['REASONING_EFFORT'] = json.dumps((self.reasoning_effort or "medium"))
-{"os.environ['EXAMPLES_TYPE'] = " + _json.dumps(self.examples_type) + "\n" if self.examples_type else ''}
-{"os.environ['DISABLE_EXAMPLES'] = 'true'\n" if self.disable_examples else ("os.environ['DISABLE_EXAMPLES'] = 'false'\n" if self.disable_examples is not None else '')}
-{"os.environ['EXAMPLES_JSON'] = " + _json.dumps(self.examples_json) + "\n" if self.examples_json else ''}
 # Branding/owner variables
-os.environ['HF_USERNAME'] = json.dumps(self.hf_username)
-os.environ['BRAND_OWNER_NAME'] = json.dumps(self.brand_owner_name)
-os.environ['BRAND_TEAM_NAME'] = json.dumps(self.brand_team_name)
-os.environ['BRAND_DISCORD_URL'] = json.dumps(self.brand_discord_url)
-os.environ['BRAND_HF_ORG'] = json.dumps(self.brand_hf_org)
-os.environ['BRAND_HF_LABEL'] = json.dumps(self.brand_hf_label)
-os.environ['BRAND_HF_URL'] = json.dumps(self.brand_hf_url)
-os.environ['BRAND_GH_ORG'] = json.dumps(self.brand_gh_org)
-os.environ['BRAND_GH_LABEL'] = json.dumps(self.brand_gh_label)
-os.environ['BRAND_GH_URL'] = json.dumps(self.brand_gh_url)
-os.environ['BRAND_PROJECT_NAME'] = json.dumps(self.brand_project_name)
-os.environ['BRAND_PROJECT_URL'] = json.dumps(self.brand_project_url)
 """
         elif self.demo_type == "voxtral":
             # For Voxtral, we do not inject env setup into app.py.
@@ -227,34 +228,35 @@ os.environ['BRAND_PROJECT_URL'] = json.dumps(self.brand_project_url)
         else:
             # For SmolLM models, use simpler setup
             import json as _json
-            env_setup = f"""
-# Environment variables for model configuration
 import os
-os.environ['HF_MODEL_ID'] = json.dumps(self.model_id)
-os.environ['MODEL_SUBFOLDER'] = json.dumps(self.subfolder if self.subfolder else "")
-os.environ['MODEL_NAME'] = json.dumps(self.model_id.split("/")[-1])
-os.environ['MODEL_IDENTITY'] = json.dumps(self.model_identity or "")
-os.environ['SYSTEM_MESSAGE'] = json.dumps(self.system_message or (self.model_identity or ""))
-os.environ['DEVELOPER_MESSAGE'] = json.dumps(self.developer_message or "")
-os.environ['REASONING_EFFORT'] = json.dumps((self.reasoning_effort or "medium"))
-{"os.environ['EXAMPLES_TYPE'] = " + _json.dumps(self.examples_type) + "\n" if self.examples_type else ''}
-{"os.environ['DISABLE_EXAMPLES'] = 'true'\n" if self.disable_examples else ("os.environ['DISABLE_EXAMPLES'] = 'false'\n" if self.disable_examples is not None else '')}
-{"os.environ['EXAMPLES_JSON'] = " + _json.dumps(self.examples_json) + "\n" if self.examples_json else ''}
 # Branding/owner variables
-os.environ['HF_USERNAME'] = json.dumps(self.hf_username)
-os.environ['BRAND_OWNER_NAME'] = json.dumps(self.brand_owner_name)
-os.environ['BRAND_TEAM_NAME'] = json.dumps(self.brand_team_name)
-os.environ['BRAND_DISCORD_URL'] = json.dumps(self.brand_discord_url)
-os.environ['BRAND_HF_ORG'] = json.dumps(self.brand_hf_org)
-os.environ['BRAND_HF_LABEL'] = json.dumps(self.brand_hf_label)
-os.environ['BRAND_HF_URL'] = json.dumps(self.brand_hf_url)
-os.environ['BRAND_GH_ORG'] = json.dumps(self.brand_gh_org)
-os.environ['BRAND_GH_LABEL'] = json.dumps(self.brand_gh_label)
-os.environ['BRAND_GH_URL'] = json.dumps(self.brand_gh_url)
-os.environ['BRAND_PROJECT_NAME'] = json.dumps(self.brand_project_name)
-os.environ['BRAND_PROJECT_URL'] = json.dumps(self.brand_project_url)
 """
         return env_setup

             # For GPT-OSS models, we need more sophisticated environment setup
             model_name = self.model_id.split("/")[-1] if "/" in self.model_id else self.model_id
             import json as _json
+            ex_type_line = f"os.environ['EXAMPLES_TYPE'] = {_json.dumps(self.examples_type)}\n" if self.examples_type else ""
+            disable_line = ("os.environ['DISABLE_EXAMPLES'] = 'true'\n" if self.disable_examples
+                            else ("os.environ['DISABLE_EXAMPLES'] = 'false'\n" if self.disable_examples is not None else ""))
+            examples_json_line = f"os.environ['EXAMPLES_JSON'] = {_json.dumps(self.examples_json)}\n" if self.examples_json else ""
+            env_setup = f"""# Environment variables for GPT-OSS model configuration
 import os
+import json
+os.environ['HF_MODEL_ID'] = json.dumps({_json.dumps(self.model_id)})
+os.environ['LORA_MODEL_ID'] = json.dumps({_json.dumps(self.model_id)})
 os.environ['BASE_MODEL_ID'] = 'openai/gpt-oss-20b'
+os.environ['MODEL_SUBFOLDER'] = json.dumps({_json.dumps(self.subfolder if self.subfolder else "")})
+os.environ['MODEL_NAME'] = json.dumps({_json.dumps(model_name)})
+os.environ['MODEL_IDENTITY'] = json.dumps({_json.dumps(self.model_identity or "")})
+os.environ['SYSTEM_MESSAGE'] = json.dumps({_json.dumps(self.system_message or (self.model_identity or ""))})
+os.environ['DEVELOPER_MESSAGE'] = json.dumps({_json.dumps(self.developer_message or "")})
+os.environ['REASONING_EFFORT'] = json.dumps({_json.dumps((self.reasoning_effort or "medium"))})
+{ex_type_line}{disable_line}{examples_json_line}
 # Branding/owner variables
+os.environ['HF_USERNAME'] = json.dumps({_json.dumps(self.hf_username)})
+os.environ['BRAND_OWNER_NAME'] = json.dumps({_json.dumps(self.brand_owner_name)})
+os.environ['BRAND_TEAM_NAME'] = json.dumps({_json.dumps(self.brand_team_name)})
+os.environ['BRAND_DISCORD_URL'] = json.dumps({_json.dumps(self.brand_discord_url)})
+os.environ['BRAND_HF_ORG'] = json.dumps({_json.dumps(self.brand_hf_org)})
+os.environ['BRAND_HF_LABEL'] = json.dumps({_json.dumps(self.brand_hf_label)})
+os.environ['BRAND_HF_URL'] = json.dumps({_json.dumps(self.brand_hf_url)})
+os.environ['BRAND_GH_ORG'] = json.dumps({_json.dumps(self.brand_gh_org)})
+os.environ['BRAND_GH_LABEL'] = json.dumps({_json.dumps(self.brand_gh_label)})
+os.environ['BRAND_GH_URL'] = json.dumps({_json.dumps(self.brand_gh_url)})
+os.environ['BRAND_PROJECT_NAME'] = json.dumps({_json.dumps(self.brand_project_name)})
+os.environ['BRAND_PROJECT_URL'] = json.dumps({_json.dumps(self.brand_project_url)})
 """
         elif self.demo_type == "voxtral":
             # For Voxtral, we do not inject env setup into app.py.
         else:
             # For SmolLM models, use simpler setup
             import json as _json
+            ex_type_line = f"os.environ['EXAMPLES_TYPE'] = {_json.dumps(self.examples_type)}\n" if self.examples_type else ""
+            disable_line = ("os.environ['DISABLE_EXAMPLES'] = 'true'\n" if self.disable_examples
+                            else ("os.environ['DISABLE_EXAMPLES'] = 'false'\n" if self.disable_examples is not None else ""))
+            examples_json_line = f"os.environ['EXAMPLES_JSON'] = {_json.dumps(self.examples_json)}\n" if self.examples_json else ""
+            env_setup = f"""# Environment variables for model configuration
 import os
+import json
+os.environ['HF_MODEL_ID'] = json.dumps({_json.dumps(self.model_id)})
+os.environ['MODEL_SUBFOLDER'] = json.dumps({_json.dumps(self.subfolder if self.subfolder else "")})
+os.environ['MODEL_NAME'] = json.dumps({_json.dumps(self.model_id.split("/")[-1])})
+os.environ['MODEL_IDENTITY'] = json.dumps({_json.dumps(self.model_identity or "")})
+os.environ['SYSTEM_MESSAGE'] = json.dumps({_json.dumps(self.system_message or (self.model_identity or ""))})
+os.environ['DEVELOPER_MESSAGE'] = json.dumps({_json.dumps(self.developer_message or "")})
+os.environ['REASONING_EFFORT'] = json.dumps({_json.dumps((self.reasoning_effort or "medium"))})
+{ex_type_line}{disable_line}{examples_json_line}
 # Branding/owner variables
+os.environ['HF_USERNAME'] = json.dumps({_json.dumps(self.hf_username)})
+os.environ['BRAND_OWNER_NAME'] = json.dumps({_json.dumps(self.brand_owner_name)})
+os.environ['BRAND_TEAM_NAME'] = json.dumps({_json.dumps(self.brand_team_name)})
+os.environ['BRAND_DISCORD_URL'] = json.dumps({_json.dumps(self.brand_discord_url)})
+os.environ['BRAND_HF_ORG'] = json.dumps({_json.dumps(self.brand_hf_org)})
+os.environ['BRAND_HF_LABEL'] = json.dumps({_json.dumps(self.brand_hf_label)})
+os.environ['BRAND_HF_URL'] = json.dumps({_json.dumps(self.brand_hf_url)})
+os.environ['BRAND_GH_ORG'] = json.dumps({_json.dumps(self.brand_gh_org)})
+os.environ['BRAND_GH_LABEL'] = json.dumps({_json.dumps(self.brand_gh_label)})
+os.environ['BRAND_GH_URL'] = json.dumps({_json.dumps(self.brand_gh_url)})
+os.environ['BRAND_PROJECT_NAME'] = json.dumps({_json.dumps(self.brand_project_name)})
+os.environ['BRAND_PROJECT_URL'] = json.dumps({_json.dumps(self.brand_project_url)})
 """
         return env_setup

scripts/train.py CHANGED Viewed

@@ -376,11 +376,9 @@ def main():
     data_collator = VoxtralDataCollator(processor, model_checkpoint)
-    # Only report to trackio if it's enabled and working
     report_to = []
-    if wandb_enabled:
-        report_to = ["trackio"]
     training_args = TrainingArguments(
         output_dir=output_dir,
         per_device_train_batch_size=args.batch_size,

     data_collator = VoxtralDataCollator(processor, model_checkpoint)
+    # Disable Transformers Trackio callback to avoid httpx timeouts; logging is handled via trackio.init()
     report_to = []
     training_args = TrainingArguments(
         output_dir=output_dir,
         per_device_train_batch_size=args.batch_size,

scripts/train_lora.py CHANGED Viewed

@@ -405,11 +405,9 @@ def main():
     data_collator = VoxtralDataCollator(processor, model_checkpoint)
-    # Only report to trackio if it's enabled and working
     report_to = []
-    if wandb_enabled:
-        report_to = ["trackio"]
     training_args = TrainingArguments(
         output_dir=output_dir,
         per_device_train_batch_size=args.batch_size,

     data_collator = VoxtralDataCollator(processor, model_checkpoint)
+    # Disable Transformers Trackio callback to avoid httpx timeouts; logging is handled via trackio.init()
     report_to = []
     training_args = TrainingArguments(
         output_dir=output_dir,
         per_device_train_batch_size=args.batch_size,