Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

Google Cloud Speech-to-Text APIを使った話者分離（Speaker Diarization）の実装

1

1

AWS Step Functionsで議事録自動化フローを作成しました（途中経過）

【AI文字起こし】kotoba-whisper-v2.2をGoogle Colabで試してみる

pyannote.audioとOpenSearchで類似話者検索を試す

ベクトル検索

Pythonで音声認識を簡単に！Whisperライブラリの使い方完全ガイド

ローカル環境で音声・動画ファイルの文字起こし&話者分離

【話者分離】pyannote動作環境をEC2に構築してみた

TRPGのボイスセッションのログを感情分析して、リプレイのハイライトを作成する

PodCastの音声を文字起こしする。 AmiVoiceAPI と Google Cloud Platform Cloud Speech-to-Text API との比較

音声認識API

[話者分離] 最強の双子 vs AmiVoice 話者ダイアライゼーション

音声認識API

pyannote.audio 3.1 使ってみる

【モデル選定】通話記録の要約にAmazon TranscribeとClaude-instantを選んだ経緯

WhisperXの環境構築メモ

Google ColaboratoryでOpenAI Whisperモデルを使って会議議事録作成

歌唱者ダイアリゼーションの実装 --その1　データセット

Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する！

Whisperで文字起こししてみた&話者分離をしてみた&ChatGPTと合わせて英検１級のリスニング問題を解かせてみた。

自然言語処理と音声認識を活用した自動で字幕を作成する仕組みを考えてみた~wav2vec2を添えて~

pyannote.audioで簡単話者分離〜whisperを添えて〜

【インターンレポート】End-to-End話者ダイアライゼーションのための，より自然な会話シミュレーション手法の研究

Google Cloud Speech API を使って話者分離を行い文字起こしする

GoogleCloudSpeechAPI

Pythonで長い会議を見える化〜話者ダイアリゼーションの動向〜

サーベイについて

Google Cloud Speech-to-Text 使ってみた

Google Cloud Speech API を使って話者分離を行い結果を Peaks.js で可視化する

GoogleSpeechAPI

GoogleCloudSpeechAPI

SpeakerDiarization

1