Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

音声データのノイズ除去技術解説：SoX / OpenAI Whisper / RNNoise

音声データの扱い方をざっくり勉強したのでまとめ

電話の音声データをOpenAIのTTS (text-to-speech) modelで作成する

長時間音声データをAzure AI SpeechのFast Transcription API (preview)で文字起こしする

MTG音声データから議事録を生成するCLIを作った

音声データを BigQuery で分析可能に 🗣️

ComfyUIで音声データセットを作る

【Python】pydub使ったら音声データの解析がめっちゃ簡単だった

機械学習のための音声データセット構築法

スマホで撮影した写真をOCRで文字起こしし、音声データに変換して再生する方法

【OpenAI】Whisper で音声データを文章化し、発話の開始時間と終了時間を含めたCSVデータにする

信号処理による話者性変換を用いた音声データ拡張

イコライザーを用いた音声データ拡張

whisperを利用して音声データから音声抽出翻訳する方法

OpenAI Whisperに音声データを全文書き起こしさせる【Google Colaboratory】

1

記事がありません