Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
次へ
Jetson Orin Nanoで音声認識:ROS2とWhisper.cppのセットアップ
Notebook LM で作成した音声の字幕を作成する(Whisper & Google Colab)
Streamlit+FastAPI+Whisperで社内オンプレ文字起こしサーバーを構築(非同期処理)
完全ローカル運用で安心!WhisperとLM Studioを使った音声認識&AI活用入門
KdenliveでWhisperのインストールができない問題の解決法
Streamlit+Flask+Whisperで社内オンプレ文字起こしサーバーを構築(同期処理)
fast-whisperで手軽に文字起こしできるCLIツールを作った
【爆死レポ】古いGPUで faster-whisper large-v3 を動かそうとしたら地獄だった件
superwhisperを自作して格安の音声入力環境を構築した
iPhoneのボイスメモをAirDropでMacに送り、Whisperで自動文字起こしするバッチ処理
iPhoneのボイスメモをWindowsでWhisperによって自動文字起こしするバッチ処理
PythonとOpenAIのwhisperを使って、無料で話者分離付き文字起こしシステムを構築してNotionに自動アップロードする方法
OpenAI APIの新しい文字起こしモデルを試してSnackWhisperに適用しました
WhisperとGoogle Colaboratoryを使って文字起こし
音声データのノイズ除去技術解説:SoX / OpenAI Whisper / RNNoise
ローカルで無料で使える!OpenAI Whisperによる文字起こしツールの構築方法
Whisperでボイスコマンドを作ってみた
音声認識実践ガイド: WhisperからリアルタイムDictationまで
WhisperのAPIコストを格段に下げる方法
YouTube音声をダウンロードしてWhisperで文字起こしするスクリプト
もしかしてまだキーボード使ってる?AI駆動の音声入力ツールSuperWhisperをオススメしたい
リアルタイム音声認識をwhisperのturboモデル+faster_whisperで動かす
英語音声ファイルをWhisperAPIを使用して日本語字幕データに変換する
Anime Whisper: 演技セリフに特化した音声認識モデル(第1回)
kotoba-whisperの比較
faster-whisper(Whisper-Large-V3)で字幕(srt)をいい感じに作る
Windows11のWSL上にcudaとcudnnを入れてfaster-whisperを動かす(faster-whisper 1.0.3)
Whisper! 声を聞いて、文字を書くよ!音声認識界に衝撃を与えた!
WhisperX をサーバレスGPU(Modal)上で動かす
Windows で OpenAI Whisper (large-v3) を動してみた
ReazonSpeechとWhisperで音声認識_Google Colaboratory上での実装
WhisperKit を CLI と Python で使う
Speech-to-Text(Reazonspeech/Amzon Transcribe/Whisper ) を試してみた!
Whisper Medusaを試してみた:高速で正確な音声認識モデル
生成AIをローカルで簡単に 【Part5.5 faster-whisper+マイク録音編】
[音声認識]whisperモデルで文字起こし
生成AIをGoogle Colaboratoryで簡単に 【Part5 音声認識AI faster-whisper編】
生成AIをGoogle Colaboratoryで簡単に 【Part4 音声認識AI Whisper API編】
Faster WhisperとDistil Whisperの音声認識gRPCサーバ
OpenAI Whisperのコードの動きを追ってみるメモ
Windowsでwhisper.cpp(GPU)を動かす
SageMaker JumpStart で Whisper をホストし、Mac の音声をリアルタイムで文字起こし
Faster WhisperとAWS SageMakerを活用してGPUでの高速文字起こしエンドポイントを構築する
WhisperKitの使い方と評価 音声処理AIをMacとiOSで動かす
homebrewでインストールしたwhisper-cppをコマンドラインから呼ぶ
【iOS】WhisperKitを使ってiPhoneで高性能文字起こしをする!
【WhisperKit】MBAで音声を文字起こし✍️
CodeWhispererの機能まとめ
1
次へ
1
2
3
More pages
次へ
猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️仮想現実とAI:リアルの境界は消えるか?
機械学習
AI
バイナリテック
猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️AIによる文化消滅リスク
機械学習
AI
バイナリテック
Unity Sentisの公式デモを触ってみた (執筆中)
Unity
UnitySentis
OpenAI: モルガン・スタンレー 公開事例 - 金融サービスの革新に向けたAI評価フレームワーク
DX
ケーススタディ
事例
OpenAI
生成AI
FastRTCを日本語対応に!リアルタイム音声処理拡張パッケージ fastrtc-jp を作りました
音声合成
WebRTC
音声認識
VOICEVOX
Style-Bert-VITS2
Mac mini での ローカルLLM で使ったモデルの一部を削除する(MLX LM、MLX-VLM で使ったもの)
Mac
mlx
ローカルLLM
mlx-vlm
mlx-lm
faster-Whisper、ChatGPT API、VOICEVOX coreを組み合わせて音声対話AIを作った話
AI
対話システム
VOICEVOX
ChatGPT
faster-whisper
AWSとAzureで使用できる最新のAI比較【2025年4月版】
AWS
Azure
chatbot
生成AI
ChatGPT
Building LLM Powered Applications
DoCAP
LLM
faster-whisperで漢字を抑制してひらがな、カタカナ出力する
Python
GPU
whisper
faster-whisper
Qiita新規作成タグレポート(2025/04/20 - 26)
Qiita
Windows11の環境でllama-cpp-pythonをGPU対応でビルドするまでにハマった話
Python
AI
whisper
LLM
LLaMA
猿でもわかるAIビジネス活用シリーズ 🐵📊|[第5回] AI時代の働き方:人間の仕事はどう変わるのか?
機械学習
AI
バイナリテック
OBSでmacOSの音声キャプチャが勝手に止まる件、最終的にBlackHoleループ構成で解決した話
macOS
議事録
BlackHole
whisper
OBS
【無料】ローカルで会議動画を文字起こし
Windows
whisper
【脱キーボード】Open Super Whisperで極上の文字起こし体験を手に入れる方法
whisper
gpt-4o-transcribe
gpt-4o-mini-transcribe
super-whisper
数が多すぎて混乱してきたので OpenAI の LLM たちをまとめてみた
初心者
初心者向け
OpenAI
ChatGPT
LLM
Unity Sentisで Whisper-tiny による文字起こしとエフェクトの表示
Unity
初投稿
whisper
ONNX
UnitySentis
【徹底解説】Mastra:TypeScript製AIエージェントフレームワーク
TypeScript
AI
LLM
Mastra
CUDA×CTranslate2の不具合解消
CUDA
Python3
PyTorch
faster-whisper
CTranslate2
Azure Open AI の基礎及びセキュリティ機能 Content filteringを試す
Microsoft
Azure
Security
プロンプト
LLM
✨ChatGPT関連のおすすめ講座4選!自分だけのGPTを作成して、デプロイまで学べる完全ガイド🚀
Python
初心者
AI
ChatGPT
LLM
🧠 Chiral: 人間の思考に基づいたAIの新境地
#未来技術
#超知能AI
#思考ベースAI
#Chiral
#脳波AI
病院のガバナンス、血糖値予測、鎮静状態評価の最先端研究~NAMのヘルスケアレポート
医療AI
nam中野哲平
NAM中野哲平氏による論文解説
ヘルスケアテック
pyttsx3で録音したwhisperのモデルごとの精度比較
Python
音声認識
whisper
pyttsx3
Will・Can・Mustで考える、QAが価値を最大化するためのアプローチ
QA
ソフトウェアテスト
OpenAI 最新 TTS/STT Models 使い方&Pythonコードサンプル
Python
TTS
OpenAI
ChatGPT
LLM
【Node.js】OpenAI の API + 新モデル(gpt-4o-transcribe、gpt-4o-mini-transcribe)で音声認識
JavaScript
Node.js
OpenAI
gpt-4o-transcribe
gpt-4o-mini-transcribe
【実装編】AIが解説する登山動画!シーン説明ジェネレーターの開発記
Python
Python+Streamlit でトランプゲームをコミュニティクラウドにデプロイする
Python
game
Webアプリケーション
トランプ
Streamlit
1
2
3
More pages
次へ