Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
Google Cloud Speech-to-Text APIを使った話者分離(Speaker Diarization)の実装
1
1
AWS Step Functionsで議事録自動化フローを作成しました(途中経過)
AWS
初心者
stepfunctions
Transcribe
bedrock
【AI文字起こし】kotoba-whisper-v2.2をGoogle Colabで試してみる
Python
whisper
colaboratory
LLM
Kotoba-Whisper
pyannote.audioとOpenSearchで類似話者検索を試す
Python
OpenSearch
ベクトル検索
pyannote.audio
Pythonで音声認識を簡単に!Whisperライブラリの使い方完全ガイド
Python
AI
whisper
OpenAI
ローカル環境で音声・動画ファイルの文字起こし&話者分離
Python
AI
whisper
Teams
pyannote.audio
【話者分離】pyannote動作環境をEC2に構築してみた
Python
AWS
whisper
huggingface
pyannote.audio
TRPGのボイスセッションのログを感情分析して、リプレイのハイライトを作成する
音声認識
AmiVoiceAPI
PodCastの音声を文字起こしする。 AmiVoiceAPI と Google Cloud Platform Cloud Speech-to-Text API との比較
Linux
初心者
podcast
音声認識API
AmiVoiceAPI
[話者分離] 最強の双子 vs AmiVoice 話者ダイアライゼーション
Python
音声認識API
AmiVoice
rye
AmiVoiceAPI
pyannote.audio 3.1 使ってみる
Python
huggingface
pyannote.audio
【モデル選定】 通話記録の要約にAmazon TranscribeとClaude-instantを選んだ経緯
Amazon
音声認識
要約
Transcribe
Claude-instant
WhisperXの環境構築メモ
Python
whisper
whisperx
pyannote.audio
Google ColaboratoryでOpenAI Whisperモデルを使って会議議事録作成
whisper
OpenAI
colaboratory
歌唱者ダイアリゼーションの実装 --その1 データセット
Python
AI
ChatGPT
diarization
Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する!
ChatGPT
Whisperで文字起こししてみた&話者分離をしてみた&ChatGPTと合わせて英検1級のリスニング問題を解かせてみた。
whisper
OpenAI
ChatGPT
自然言語処理と音声認識を活用した自動で字幕を作成する仕組みを考えてみた~wav2vec2を添えて~
音声認識
字幕
言語処理
wav2vec2
pyannote.audioで簡単話者分離〜whisperを添えて〜
Python
AI
音声認識
whisper
話者分離
【インターンレポート】End-to-End話者ダイアライゼーションのための,より自然な会話シミュレーション手法の研究
音声認識
Google Cloud Speech API を使って話者分離を行い文字起こしする
JavaScript
wav
音声認識
GoogleCloudSpeechAPI
GoogleCloud
Pythonで長い会議を見える化〜話者ダイアリゼーションの動向〜
Python
機械学習
サーベイについて
サーベイ
論文読み
Google Cloud Speech-to-Text 使ってみた
Ruby
SpeechToText
GoogleCloud
Google Cloud Speech API を使って話者分離を行い結果を Peaks.js で可視化する
React
GoogleSpeechAPI
GoogleCloudSpeechAPI
Peaks.js
SpeakerDiarization
1