Commit History

音声ファイル処理の結果をユーザー指定の形式に合わせてJSON形式で返却するように変更。セグメント内の単語情報を含める処理を追加。
1873d1e

sungo-ganpare commited on

GPUタイムアウトを300秒から60秒に変更。gradio_client.fileをインポートし、chunk_pathをgradio_file()でラップ。音声ファイルの前処理を改善し、モノラル変換とリサンプリングを追加。新しいトランスクリプトファイルを作成。
af69235

sungo-ganpare commited on

Gradioクライアントのインポートを追加し、接続テスト機能を実装。requirements.txtにgradio_clientを追加。
29074da

sungo-ganpare commited on

音声処理の設定を強化し、セグメント分割機能を改善。自然な区切り点を探す関数を追加し、VTTファイルのサイズ制限を設定。バッチサイズを2に変更し、エラーハンドリングを強化。
c9be4ad

sungo-ganpare commited on

Merge branch 'main' of hf.co:spaces/sungo-ganpare/parakeet-tdt-0.6b-v2
f08f513

sungo-ganpare commited on

音声処理機能を改善し、Gradioインターフェースを更新。pydubによる音声長の取得を追加し、エラーハンドリングを強化。GPUリソースの管理を改善し、ダミー音声ファイルの作成機能を追加。
4f11bbf

sungo-ganpare commited on

音声ファイルの処理を改善し、Gradioインターフェースを更新。音声のアップロードと文字起こし結果をJSON形式で返却する機能を追加。依存関係にrequestsとffmpeg-pythonを追加し、READMEの絵文字を修正。
6a535bc

sungo-ganpare commited on

デモの説明文を更新し、長時間音声対応の最適化を強調。日本語に翻訳し、主な特長を明確化。
b0b7186

sungo-ganpare commited on

CUDAメモリ管理を強化し、トランスクリプション前にキャッシュをクリア。デバッグ用にメモリ状況をログ出力。キューサイズと同時実行数を制限してタイムアウト対策を実施。
d206e43

sungo-ganpare commited on

Merge branch 'main' of https://huggingface.co/spaces/sungo-ganpare/parakeet-tdt-0.6b-v2
d57f74a

sungo-ganpare commited on

音声ファイルを3時間以上の場合にオーバーラップ付きで分割し、逐次ASRを実行する機能を追加。関連するタイムスタンプの補正処理も実装。分割ファイルのクリーンアップ処理を強化。
3da7deb

sungo-ganpare commited on

オーディオファイルの前処理と文字起こし機能を改善し、エラーハンドリングを強化
d4575dc

sungo-ganpare commited on

add support for longform
d90f461

Nithin Rao Koluguri commited on

Add support for longer audio inference
da5395a

Nithin Rao Koluguri commited on

add parakeet-v2
0a98475

Nithin Rao Koluguri commited on

Update app.py
ba5e3a9

nithinraok commited on

Update app.py
ede25a6

nithinraok commited on

Update app.py
a10d717

nithinraok commited on

Update app.py
ce8a201

nithinraok commited on

Create app.py
7c6ede0

nithinraok commited on