Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
次へ
Jetson Orin Nanoで音声認識:ROS2とWhisper.cppのセットアップ
医療AIを安全に導入!Azure OpenAIで始めるカルテ作成と音声認識のやさしい設定ガイド
完全ローカル運用で安心!WhisperとLM Studioを使った音声認識&AI活用入門
【Swift】iOSの音声認識でリアルタイム音声文字起こしを行う方法
Cloudflare Workers AI 使ってみた「音声認識編」
iPhone 上で動作する音声認識モデルの最適化手法
音声認識実践ガイド: WhisperからリアルタイムDictationまで
ストリーミング音声認識API/SDKの最新比較(2025年時点)
リアルタイム音声認識をwhisperのturboモデル+faster_whisperで動かす
#UEで音声認識を使ったゲームを作ってみた
音声認識でドローンを動かす
Anime Whisper: 演技セリフに特化した音声認識モデル(第1回)
音声認識ライブラリ VOSK を試してみた
【AWS】Amazon Transcribe + Terraformで作る音声認識システム
Web Speech APIを利用した音声認識Webアプリの作成
【完全無料の音声認識ソフトで文字起こし】Juliusのインストール方法と使用方法
ReazonSpeech NeMo ASRでバッチ推論で音声認識
音声認識バッチ処理システムの作成_ローカル実装
Whisper! 声を聞いて、文字を書くよ!音声認識界に衝撃を与えた!
ReazonSpeechとWhisperで音声認識_Google Colaboratory上での実装
Whisper Medusaを試してみた:高速で正確な音声認識モデル
口癖チェッカーを作ろう!Next.jsで簡単に音声認識アプリを開発
[音声認識]whisperモデルで文字起こし
生成AIをGoogle Colaboratoryで簡単に 【Part5 音声認識AI faster-whisper編】
生成AIをGoogle Colaboratoryで簡単に 【Part4 音声認識AI Whisper API編】
ここ数年の音声認識誤り訂正論文10本(1本+9本)まとめ
Faster WhisperとDistil Whisperの音声認識gRPCサーバ
音声認識モデルの精度を検証
音声認識技術を全く知らないWebエンジニアが、E2E解説文論を頑張って読み解く(後半:E2Eをつかってみる)
【kaggle】 ベンガル語音声認識コンペの振り返り
OpenAI APIによる音声認識の精度改善:文字起こしポストプロセッシングの実践
音声認識技術を全く知らないWebエンジニアが、E2E解説文論を頑張って読み解く(前半:E2Eの概要)
Whisper による音声認識の最先端〜8年越しのASR
【音声認識モデル】Azure OpenAI Whisper/Azure Speech to Textの違い
[iOS 17] 音声認識におけるカスタム言語モデルのサポート
Next.js+WebSpeechAPIで超簡単音声認識をしてみよう
音声認識のみで操作できるTODOアプリを作った話
AI音声認識機能のQAにおける苦労と工夫したこと
2023年時点の音声認識技術を使って、競馬中継の実況音声を文字起こし
WebSpeechAPIを利用してWebブラウザで音声認識を行う
【Unity × ChatGPT API × WhisperAPI】音声認識AIアシスタントを実装する
ChatGPT と DeepL と whisper.cpp を使ってリアルタイム音声認識(中断中)
DockerでWhisper(音声認識&文字起こし)を動かす
音声認識可能な対話型AIを作成してみた(VOSK, GiNZA, python,チャットボット)
SpeechRecognitionを使ったマイク音声認識
音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと
最新の音声認識モデル『Whisper』を使ってみたよ
【Whisper】GPUが無くてもオフラインで簡単音声認識
1
次へ
記事がありません