Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
音声データのノイズ除去技術解説:SoX / OpenAI Whisper / RNNoise
音声データの扱い方をざっくり勉強したのでまとめ
電話の音声データをOpenAIのTTS (text-to-speech) modelで作成する
長時間音声データをAzure AI SpeechのFast Transcription API (preview)で文字起こしする
MTG音声データから議事録を生成するCLIを作った
音声データを BigQuery で分析可能に 🗣️
ComfyUIで音声データセットを作る
【Python】pydub使ったら音声データの解析がめっちゃ簡単だった
機械学習のための音声データセット構築法
スマホで撮影した写真をOCRで文字起こしし、音声データに変換して再生する方法
【OpenAI】Whisper で音声データを文章化し、発話の開始時間と終了時間を含めたCSVデータにする
信号処理による話者性変換を用いた音声データ拡張
イコライザーを用いた音声データ拡張
whisperを利用して音声データから音声抽出翻訳する方法
OpenAI Whisperに音声データを全文書き起こしさせる【Google Colaboratory】
1
記事がありません