Commit History
GPUタイムアウトを300秒から60秒に変更。gradio_client.fileをインポートし、chunk_pathをgradio_file()でラップ。音声ファイルの前処理を改善し、モノラル変換とリサンプリングを追加。新しいトランスクリプトファイルを作成。
af69235
Gradioクライアントのインポートを追加し、接続テスト機能を実装。requirements.txtにgradio_clientを追加。
29074da
音声処理の設定を強化し、セグメント分割機能を改善。自然な区切り点を探す関数を追加し、VTTファイルのサイズ制限を設定。バッチサイズを2に変更し、エラーハンドリングを強化。
c9be4ad
Update app.py
aaa4bd6
verified
Merge branch 'main' of hf.co:spaces/sungo-ganpare/parakeet-tdt-0.6b-v2
f08f513
音声処理機能を改善し、Gradioインターフェースを更新。pydubによる音声長の取得を追加し、エラーハンドリングを強化。GPUリソースの管理を改善し、ダミー音声ファイルの作成機能を追加。
4f11bbf
Update app.py
4d2e878
verified
音声ファイルの処理を改善し、Gradioインターフェースを更新。音声のアップロードと文字起こし結果をJSON形式で返却する機能を追加。依存関係にrequestsとffmpeg-pythonを追加し、READMEの絵文字を修正。
6a535bc
デモの説明文を更新し、長時間音声対応の最適化を強調。日本語に翻訳し、主な特長を明確化。
b0b7186
CUDAメモリ管理を強化し、トランスクリプション前にキャッシュをクリア。デバッグ用にメモリ状況をログ出力。キューサイズと同時実行数を制限してタイムアウト対策を実施。
d206e43
save
b479da3
Merge branch 'main' of https://huggingface.co/spaces/sungo-ganpare/parakeet-tdt-0.6b-v2
d57f74a
音声ファイルを3時間以上の場合にオーバーラップ付きで分割し、逐次ASRを実行する機能を追加。関連するタイムスタンプの補正処理も実装。分割ファイルのクリーンアップ処理を強化。
3da7deb
オーディオファイルの前処理と文字起こし機能を改善し、エラーハンドリングを強化
d4575dc
いったんセーブ
9eb42b2
いろいろ反映
21b4fcb
これは?
326f6f8
テスト
02ca3a8
add support for longform
d90f461
Nithin Rao Koluguri
commited on
Update app.py
912f81e
Add support for longer audio inference
da5395a
Nithin Rao Koluguri
commited on
add session info
fb46650
Update app.py
b087acf
Update app.py
5b9fece
add parakeet-v2
0a98475
Nithin Rao Koluguri
commited on