Spaces:

akhaliq
/

Apertus-8B-Instruct-2509

Running on Zero

akhaliq HF Staff commited on Sep 4

Commit

ba5e93f

verified ·

1 Parent(s): e958943

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
 MODEL_NAME = "swiss-ai/Apertus-8B-Instruct-2509"
 device = "cuda" if torch.cuda.is_available() else "cpu"
@@ -11,6 +12,7 @@ HF_TOKEN = os.getenv("HF_TOKEN")
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, token=HF_TOKEN).to(device)
 def predict(message, history):
     messages = []
@@ -53,4 +55,4 @@ chatbot = gr.ChatInterface(
 )
 # Launch the app
-chatbot.launch()

 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
+import spaces
 MODEL_NAME = "swiss-ai/Apertus-8B-Instruct-2509"
 device = "cuda" if torch.cuda.is_available() else "cpu"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, token=HF_TOKEN).to(device)
+@spaces.GPU
 def predict(message, history):
     messages = []
 )
 # Launch the app
+chatbot.launch(share=True, server_port=80, enable_queue=True)