Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    Google Cloud Speech-to-Text APIを使った話者分離(Speaker Diarization)の実装
    • 1
    • 1
    AWS Step Functionsで議事録自動化フローを作成しました(途中経過)
    AWS
    初心者
    stepfunctions
    Transcribe
    bedrock
    【AI文字起こし】kotoba-whisper-v2.2をGoogle Colabで試してみる
    Python
    whisper
    colaboratory
    LLM
    Kotoba-Whisper
    pyannote.audioとOpenSearchで類似話者検索を試す
    Python
    OpenSearch
    ベクトル検索
    pyannote.audio
    Pythonで音声認識を簡単に!Whisperライブラリの使い方完全ガイド
    Python
    AI
    whisper
    OpenAI
    ローカル環境で音声・動画ファイルの文字起こし&話者分離
    Python
    AI
    whisper
    Teams
    pyannote.audio
    【話者分離】pyannote動作環境をEC2に構築してみた
    Python
    AWS
    whisper
    huggingface
    pyannote.audio
    TRPGのボイスセッションのログを感情分析して、リプレイのハイライトを作成する
    音声認識
    AmiVoiceAPI
    PodCastの音声を文字起こしする。 AmiVoiceAPI と Google Cloud Platform Cloud Speech-to-Text API との比較
    Linux
    初心者
    podcast
    音声認識API
    AmiVoiceAPI
    [話者分離] 最強の双子 vs AmiVoice 話者ダイアライゼーション
    Python
    音声認識API
    AmiVoice
    rye
    AmiVoiceAPI
    pyannote.audio 3.1 使ってみる
    Python
    huggingface
    pyannote.audio
    【モデル選定】 通話記録の要約にAmazon TranscribeとClaude-instantを選んだ経緯
    Amazon
    音声認識
    要約
    Transcribe
    Claude-instant
    WhisperXの環境構築メモ
    Python
    whisper
    whisperx
    pyannote.audio
    Google ColaboratoryでOpenAI Whisperモデルを使って会議議事録作成
    whisper
    OpenAI
    colaboratory
    歌唱者ダイアリゼーションの実装 --その1 データセット
    Python
    AI
    ChatGPT
    diarization
    Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する!
    ChatGPT
    Whisperで文字起こししてみた&話者分離をしてみた&ChatGPTと合わせて英検1級のリスニング問題を解かせてみた。
    whisper
    OpenAI
    ChatGPT
    自然言語処理と音声認識を活用した自動で字幕を作成する仕組みを考えてみた~wav2vec2を添えて~
    音声認識
    字幕
    言語処理
    wav2vec2
    pyannote.audioで簡単話者分離〜whisperを添えて〜
    Python
    AI
    音声認識
    whisper
    話者分離
    【インターンレポート】End-to-End話者ダイアライゼーションのための,より自然な会話シミュレーション手法の研究
    音声認識
    Google Cloud Speech API を使って話者分離を行い文字起こしする
    JavaScript
    wav
    音声認識
    GoogleCloudSpeechAPI
    GoogleCloud
    Pythonで長い会議を見える化〜話者ダイアリゼーションの動向〜
    Python
    機械学習
    サーベイについて
    サーベイ
    論文読み
    Google Cloud Speech-to-Text 使ってみた
    Ruby
    SpeechToText
    GoogleCloud
    Google Cloud Speech API を使って話者分離を行い結果を Peaks.js で可視化する
    React
    GoogleSpeechAPI
    GoogleCloudSpeechAPI
    Peaks.js
    SpeakerDiarization
    • 1