Spaces:

benjaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
/

ProyectoBMO

Sleeping

App Files Files Community

benjaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa commited on 20 days ago

Commit

e5bf37c

verified ·

1 Parent(s): 7e0bff8

Create app.py

Browse files

Files changed (1) hide show

app.py +146 -0

app.py ADDED Viewed

	@@ -0,0 +1,146 @@

+import gradio as gr
+from transformers import pipeline
+import tempfile
+import os
+import json
+print("🚀 Iniciando Asistente ESP32...")
+# Cargar modelos optimizados para ESP32
+try:
+    print("📥 Cargando modelo de voz...")
+    stt_pipeline = pipeline(
+        "automatic-speech-recognition",
+        model="openai/whisper-tiny",
+        device=-1  # Usar CPU
+    )
+    print("📥 Cargando modelo de chat...")
+    chat_pipeline = pipeline(
+        "text-generation",
+        model="microsoft/DialoGPT-small",
+        device=-1,
+        max_length=100
+    )
+    print("✅ Modelos cargados correctamente!")
+except Exception as e:
+    print(f"❌ Error cargando modelos: {e}")
+    stt_pipeline = None
+    chat_pipeline = None
+def process_audio(audio_file):
+    """Procesar audio para ESP32"""
+    if stt_pipeline is None or chat_pipeline is None:
+        return "Models not loaded", "Please try again in a moment"
+    try:
+        print("🎤 Procesando audio...")
+        # Transcripción
+        result = stt_pipeline(audio_file)
+        text = result["text"].strip()
+        print(f"📝 Transcripción: {text}")
+        if not text or text == "":
+            return "No se detectó audio", "Habla más claro por favor"
+        # Generar respuesta
+        print("🤖 Generando respuesta...")
+        chat_response = chat_pipeline(
+            f"Usuario: {text}\nAsistente:",
+            max_new_tokens=80,
+            temperature=0.7,
+            do_sample=True,
+            pad_token_id=chat_pipeline.tokenizer.eos_token_id
+        )
+        answer = chat_response[0]["generated_text"]
+        # Limpiar respuesta
+        if "Asistente:" in answer:
+            answer = answer.split("Asistente:")[-1].strip()
+        print(f"💬 Respuesta: {answer}")
+        return text, answer
+    except Exception as e:
+        error_msg = f"Error: {str(e)}"
+        print(error_msg)
+        return error_msg, "Error en el procesamiento"
+# Interfaz mejorada para ESP32
+with gr.Blocks(theme=gr.themes.Soft(), title="Asistente ESP32") as demo:
+    gr.Markdown(
+        """
+        # 🎤 Asistente de Voz para ESP32
+        **Servicio optimizado para microcontroladores**
+        """
+    )
+    with gr.Row():
+        with gr.Column():
+            gr.Markdown("### 📤 Subir Audio")
+            audio_input = gr.Audio(
+                sources=["upload"],
+                type="filepath",
+                label="Audio WAV (16kHz, mono, 16-bit)",
+                waveform_options={"show_controls": False}
+            )
+            process_btn = gr.Button("🚀 Procesar Audio", variant="primary")
+            gr.Markdown("### 📋 Especificaciones ESP32")
+            gr.Markdown("""
+            - **Formato:** WAV, 16kHz, mono, 16-bit
+            - **Duración:** 3-5 segundos máximo
+            - **Conexión:** HTTPS POST a esta URL
+            """)
+        with gr.Column():
+            gr.Markdown("### 📝 Resultados")
+            transcription = gr.Textbox(
+                label="Transcripción",
+                placeholder="El texto aparecerá aquí...",
+                lines=3
+            )
+            response = gr.Textbox(
+                label="Respuesta del Asistente",
+                placeholder="La respuesta aparecerá aquí...",
+                lines=4
+            )
+    # Ejemplos para probar
+    gr.Markdown("### 🧪 Ejemplos para Probar")
+    gr.Examples(
+        examples=[
+            ["https://example.com/audio1.wav"],  # Puedes subir ejemplos después
+            ["https://example.com/audio2.wav"]
+        ],
+        inputs=[audio_input],
+        outputs=[transcription, response],
+        fn=process_audio,
+        cache_examples=False
+    )
+    # Procesar cuando se sube audio o se clickea el botón
+    process_btn.click(
+        fn=process_audio,
+        inputs=[audio_input],
+        outputs=[transcription, response]
+    )
+    # Info del estado
+    gr.Markdown("### 🔍 Estado del Sistema")
+    status = gr.Textbox(
+        value="✅ Servicio listo para ESP32" if stt_pipeline else "⚠️ Cargando modelos...",
+        label="Estado",
+        interactive=False
+    )
+# Configuración del servidor
+if __name__ == "__main__":
+    demo.launch(
+        server_name="0.0.0.0",
+        server_port=7860,
+        share=False,
+        debug=True
+    )