parakeet-tdt-0.6b-v2

Running

App Files Files Community

sungo-ganpare commited on Jun 18

Commit

a7307d4

1 Parent(s): d1aa8f4

GPU制限エラーを検知する例外クラスを追加し、処理中にGPU制限に達した場合のエラーハンドリングを強化。音声ファイル処理時にエラーを適切に報告するように修正。

Browse files

Files changed (2) hide show

local_controller.py +50 -17
transcribe_cli.py +1 -1

local_controller.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import os
 import json
 import time
 import requests
 from pathlib import Path
 # from pydub import AudioSegment # 現在のコードでは直接使用されていません
@@ -109,6 +110,10 @@ def split_audio_with_ffmpeg(audio_path: str, output_dir_base: str, chunk_length_
 # test_space_connection, process_chunk, write_srt, write_vtt, write_json_output, write_lrc は前回とほぼ同じ
 # (ログ出力にファイル名を追加するなどの微調整は有効)
 def process_chunk(chunk_path: str, original_audio_filename: str) -> Optional[Dict]:
     """チャンクをSpaceに送信して処理"""
     chunk_name = Path(chunk_path).name
@@ -123,12 +128,16 @@ def process_chunk(chunk_path: str, original_audio_filename: str) -> Optional[Dic
                 client = Client(SPACE_URL)
                 break
             except Exception as e:
                 print(f"  Connection attempt {attempt + 1} for {chunk_name} (from {original_audio_filename}) failed: {e}")
                 if attempt < 2: time.sleep(5)
                 else: raise
         if client is None: return None
-        # print(f"  Sending chunk to Space: {chunk_name} (from {original_audio_filename})")
         result = None
         api_methods_to_try = [{"name": "fn_index=1", "fn_index": 1}, {"name": "fn_index=0", "fn_index": 0}, {"name": "default", "fn_index": None}]
         for method_info in api_methods_to_try:
@@ -139,16 +148,21 @@ def process_chunk(chunk_path: str, original_audio_filename: str) -> Optional[Dic
                     result = client.predict(gradio_file(chunk_path))
                 # print(f"  Successfully used API method '{method_info['name']}' for {chunk_name}")
                 break
-            except Exception: # as e:
-                # print(f"  API method '{method_info['name']}' for {chunk_name} failed: {e}")
                 result = None
         if result is None:
             print(f"  All API call methods failed for {chunk_name} (from {original_audio_filename})")
             return None
-        # print(f"  Received response from Space for {chunk_name} (type: {type(result)})")
-        if isinstance(result, dict): return result
         elif isinstance(result, str):
             try: return json.loads(result)
             except json.JSONDecodeError:
@@ -157,7 +171,15 @@ def process_chunk(chunk_path: str, original_audio_filename: str) -> Optional[Dic
         else:
             print(f"  Unexpected response format for {chunk_name}: {type(result)}")
             return None
     except Exception as e:
         print(f"Error sending chunk {chunk_name} (from {original_audio_filename}) to Space: {e}")
         return None
@@ -445,8 +467,7 @@ def process_audio_file(input_path_str: str, output_dir_str: str):
     temp_conversion_dir = base_temp_dir / "conversion"
     # チャンクは split_audio_with_ffmpeg 内で output_dir_path / "temp_chunks" / audio_stem に保存される
-    try:
-        # WAV以外の入力はWAV (16kHz, mono) に変換
         if original_input_path_obj.suffix.lower() not in ['.wav']:
             print(f"  Converting {audio_filename} to WAV...")
             temp_conversion_dir.mkdir(parents=True, exist_ok=True)
@@ -489,12 +510,18 @@ def process_audio_file(input_path_str: str, output_dir_str: str):
         print(f"  Processing {len(chunk_paths)} chunks for {audio_filename} via API...")
         chunk_results = []
         for i, chunk_p_str in enumerate(chunk_paths):
-            api_result = process_chunk(chunk_p_str, audio_filename)
-            if api_result:
-                chunk_results.append(api_result)
-                print(f"    Successfully processed chunk {i+1}/{len(chunk_paths)}")
-            else:
-                print(f"    Failed to process chunk {i+1}/{len(chunk_paths)}")
             # APIリクエスト間の待機時間を追加
             if i < len(chunk_paths) - 1:  # 最後のチャンクの後は待機不要
@@ -639,8 +666,14 @@ def main():
     for i, file_to_process_obj in enumerate(actual_files_to_process):
         print(f"\n--- [{i+1}/{total_to_process_count}] Processing: {file_to_process_obj.name} ---")
         output_dir_for_this_file = file_to_process_obj.parent.as_posix()
-        process_audio_file(file_to_process_obj.as_posix(), output_dir_for_this_file)
-        print(f"--- Finished: {file_to_process_obj.name} ---")
     print(f"\nAll {total_to_process_count} new file(s) processed.")

 import os
 import json
 import time
+import sys
 import requests
 from pathlib import Path
 # from pydub import AudioSegment # 現在のコードでは直接使用されていません
 # test_space_connection, process_chunk, write_srt, write_vtt, write_json_output, write_lrc は前回とほぼ同じ
 # (ログ出力にファイル名を追加するなどの微調整は有効)
+class GPUQuotaExceededError(Exception):
+    """GPU制限に達した場合の例外"""
+    pass
 def process_chunk(chunk_path: str, original_audio_filename: str) -> Optional[Dict]:
     """チャンクをSpaceに送信して処理"""
     chunk_name = Path(chunk_path).name
                 client = Client(SPACE_URL)
                 break
             except Exception as e:
+                error_msg = str(e).lower()
+                # GPU制限エラーを検知
+                if any(keyword in error_msg for keyword in ['gpu', 'quota', 'limit', 'exceeded', 'unavailable']):
+                    print(f"  GPU quota exceeded detected: {e}")
+                    raise GPUQuotaExceededError(f"GPU quota exceeded: {e}")
                 print(f"  Connection attempt {attempt + 1} for {chunk_name} (from {original_audio_filename}) failed: {e}")
                 if attempt < 2: time.sleep(5)
                 else: raise
         if client is None: return None
+          # print(f"  Sending chunk to Space: {chunk_name} (from {original_audio_filename})")
         result = None
         api_methods_to_try = [{"name": "fn_index=1", "fn_index": 1}, {"name": "fn_index=0", "fn_index": 0}, {"name": "default", "fn_index": None}]
         for method_info in api_methods_to_try:
                     result = client.predict(gradio_file(chunk_path))
                 # print(f"  Successfully used API method '{method_info['name']}' for {chunk_name}")
                 break
+            except Exception as api_e:
+                error_msg = str(api_e).lower()
+                # GPU制限エラーを検知
+                if any(keyword in error_msg for keyword in ['gpu', 'quota', 'limit', 'exceeded', 'unavailable', 'out of memory', 'resource']):
+                    print(f"  GPU quota exceeded during API call: {api_e}")
+                    raise GPUQuotaExceededError(f"GPU quota exceeded during API call: {api_e}")
+                # print(f"  API method '{method_info['name']}' for {chunk_name} failed: {api_e}")
                 result = None
         if result is None:
             print(f"  All API call methods failed for {chunk_name} (from {original_audio_filename})")
             return None
+          # print(f"  Received response from Space for {chunk_name} (type: {type(result)})")
+        if isinstance(result, dict):
+            return result
         elif isinstance(result, str):
             try: return json.loads(result)
             except json.JSONDecodeError:
         else:
             print(f"  Unexpected response format for {chunk_name}: {type(result)}")
             return None
+    except GPUQuotaExceededError:
+        # GPU制限エラーは再発生させて上位で処理
+        raise
     except Exception as e:
+        error_msg = str(e).lower()
+        # 最後の砦としてもう一度GPU制限エラーをチェック
+        if any(keyword in error_msg for keyword in ['gpu', 'quota', 'limit', 'exceeded', 'unavailable', 'out of memory', 'resource']):
+            print(f"GPU quota exceeded detected in general exception: {e}")
+            raise GPUQuotaExceededError(f"GPU quota exceeded: {e}")
         print(f"Error sending chunk {chunk_name} (from {original_audio_filename}) to Space: {e}")
         return None
     temp_conversion_dir = base_temp_dir / "conversion"
     # チャンクは split_audio_with_ffmpeg 内で output_dir_path / "temp_chunks" / audio_stem に保存される
+    try:        # WAV以外の入力はWAV (16kHz, mono) に変換
         if original_input_path_obj.suffix.lower() not in ['.wav']:
             print(f"  Converting {audio_filename} to WAV...")
             temp_conversion_dir.mkdir(parents=True, exist_ok=True)
         print(f"  Processing {len(chunk_paths)} chunks for {audio_filename} via API...")
         chunk_results = []
         for i, chunk_p_str in enumerate(chunk_paths):
+            try:
+                api_result = process_chunk(chunk_p_str, audio_filename)
+                if api_result:
+                    chunk_results.append(api_result)
+                    print(f"    Successfully processed chunk {i+1}/{len(chunk_paths)}")
+                else:
+                    print(f"    Failed to process chunk {i+1}/{len(chunk_paths)}")
+            except GPUQuotaExceededError as gpu_error:
+                print(f"  GPU quota exceeded while processing {audio_filename}")
+                print(f"  Error: {gpu_error}")
+                print(f"  GPU制限に達しました。処理を強制終了します。")
+                raise  # main()関数で捕捉するために再発生
             # APIリクエスト間の待機時間を追加
             if i < len(chunk_paths) - 1:  # 最後のチャンクの後は待機不要
     for i, file_to_process_obj in enumerate(actual_files_to_process):
         print(f"\n--- [{i+1}/{total_to_process_count}] Processing: {file_to_process_obj.name} ---")
         output_dir_for_this_file = file_to_process_obj.parent.as_posix()
+        try:
+            process_audio_file(file_to_process_obj.as_posix(), output_dir_for_this_file)
+            print(f"--- Finished: {file_to_process_obj.name} ---")
+        except GPUQuotaExceededError as gpu_error:
+            print(f"\n=== GPU QUOTA EXCEEDED ===")
+            print(f"処理を中断します。GPU制限に達しました。")
+            print(f"Error details: {gpu_error}")
+            sys.exit(1)  # 即座に強制終了
     print(f"\nAll {total_to_process_count} new file(s) processed.")

transcribe_cli.py CHANGED Viewed

@@ -987,7 +987,7 @@ if __name__ == "__main__":
                 # ダイアログを最前面に表示する試み (環境による)
                 root.attributes('-topmost', True)
                 # WSL環境での初期ディレクトリを設定
-                initial_dir = "/mnt/f/demucs_folder/htdemucs"  # Windowsのユーザーディレクトリを初期値として設定
                 selected_path = filedialog.askdirectory(
                     title="処理対象のディレクトリを選択してください",
                     initialdir=initial_dir

                 # ダイアログを最前面に表示する試み (環境による)
                 root.attributes('-topmost', True)
                 # WSL環境での初期ディレクトリを設定
+                initial_dir = "/mnt/t/demucs_folder/htdemucs"  # Windowsのユーザーディレクトリを初期値として設定
                 selected_path = filedialog.askdirectory(
                     title="処理対象のディレクトリを選択してください",
                     initialdir=initial_dir