Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1
次へ

Jetson Orin Nanoで音声認識：ROS2とWhisper.cppのセットアップ

Notebook LM で作成した音声の字幕を作成する(Whisper & Google Colab)

Streamlit＋FastAPI＋Whisperで社内オンプレ文字起こしサーバーを構築(非同期処理)

完全ローカル運用で安心！WhisperとLM Studioを使った音声認識＆AI活用入門

KdenliveでWhisperのインストールができない問題の解決法

Streamlit＋Flask＋Whisperで社内オンプレ文字起こしサーバーを構築(同期処理)

fast-whisperで手軽に文字起こしできるCLIツールを作った

【爆死レポ】古いGPUで faster-whisper large-v3 を動かそうとしたら地獄だった件

superwhisperを自作して格安の音声入力環境を構築した

iPhoneのボイスメモをAirDropでMacに送り、Whisperで自動文字起こしするバッチ処理

iPhoneのボイスメモをWindowsでWhisperによって自動文字起こしするバッチ処理

PythonとOpenAIのwhisperを使って、無料で話者分離付き文字起こしシステムを構築してNotionに自動アップロードする方法

OpenAI APIの新しい文字起こしモデルを試してSnackWhisperに適用しました

WhisperとGoogle Colaboratoryを使って文字起こし

音声データのノイズ除去技術解説：SoX / OpenAI Whisper / RNNoise

ローカルで無料で使える！OpenAI Whisperによる文字起こしツールの構築方法

Whisperでボイスコマンドを作ってみた

音声認識実践ガイド: WhisperからリアルタイムDictationまで

WhisperのAPIコストを格段に下げる方法

YouTube音声をダウンロードしてWhisperで文字起こしするスクリプト

もしかしてまだキーボード使ってる？AI駆動の音声入力ツールSuperWhisperをオススメしたい

リアルタイム音声認識をwhisperのturboモデル+faster_whisperで動かす

英語音声ファイルをWhisperAPIを使用して日本語字幕データに変換する

Anime Whisper: 演技セリフに特化した音声認識モデル（第1回）

kotoba-whisperの比較

faster-whisper(Whisper-Large-V3)で字幕(srt)をいい感じに作る

Windows11のWSL上にcudaとcudnnを入れてfaster-whisperを動かす(faster-whisper 1.0.3)

Whisper! 声を聞いて、文字を書くよ！音声認識界に衝撃を与えた！

WhisperX をサーバレスGPU(Modal)上で動かす

Windows で OpenAI Whisper (large-v3) を動してみた

ReazonSpeechとWhisperで音声認識_Google Colaboratory上での実装

WhisperKit を CLI と Python で使う

Speech-to-Text(Reazonspeech／Amzon Transcribe／Whisper ) を試してみた！

Whisper Medusaを試してみた：高速で正確な音声認識モデル

生成AIをローカルで簡単に【Part5.5 faster-whisper+マイク録音編】

[音声認識]whisperモデルで文字起こし

生成AIをGoogle Colaboratoryで簡単に【Part5 音声認識AI faster-whisper編】

生成AIをGoogle Colaboratoryで簡単に【Part4 音声認識AI Whisper API編】

Faster WhisperとDistil Whisperの音声認識gRPCサーバ

OpenAI Whisperのコードの動きを追ってみるメモ

Windowsでwhisper.cpp(GPU)を動かす

SageMaker JumpStart で Whisper をホストし、Mac の音声をリアルタイムで文字起こし

Faster WhisperとAWS SageMakerを活用してGPUでの高速文字起こしエンドポイントを構築する

WhisperKitの使い方と評価音声処理AIをMacとiOSで動かす

homebrewでインストールしたwhisper-cppをコマンドラインから呼ぶ

【iOS】WhisperKitを使ってiPhoneで高性能文字起こしをする！

【WhisperKit】MBAで音声を文字起こし✍️

CodeWhispererの機能まとめ

1
次へ

1
2
3
次へ

猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️仮想現実とAI：リアルの境界は消えるか？

バイナリテック

猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️AIによる文化消滅リスク

バイナリテック

Unity Sentisの公式デモを触ってみた (執筆中)

OpenAI: モルガン・スタンレー公開事例 - 金融サービスの革新に向けたAI評価フレームワーク

ケーススタディ

FastRTCを日本語対応に！リアルタイム音声処理拡張パッケージ fastrtc-jp を作りました

Style-Bert-VITS2

Mac mini でのローカルLLM で使ったモデルの一部を削除する（MLX LM、MLX-VLM で使ったもの）

ローカルLLM

faster-Whisper、ChatGPT API、VOICEVOX coreを組み合わせて音声対話AIを作った話

対話システム

AWSとAzureで使用できる最新のAI比較【2025年4月版】

Building LLM Powered Applications

faster-whisperで漢字を抑制してひらがな、カタカナ出力する

Qiita新規作成タグレポート（2025/04/20 - 26）

Windows11の環境でllama-cpp-pythonをGPU対応でビルドするまでにハマった話

猿でもわかるAIビジネス活用シリーズ 🐵📊|[第5回] AI時代の働き方：人間の仕事はどう変わるのか？

バイナリテック

OBSでmacOSの音声キャプチャが勝手に止まる件、最終的にBlackHoleループ構成で解決した話

【無料】ローカルで会議動画を文字起こし

【脱キーボード】Open Super Whisperで極上の文字起こし体験を手に入れる方法

gpt-4o-transcribe

gpt-4o-mini-transcribe

数が多すぎて混乱してきたので OpenAI の LLM たちをまとめてみた

初心者向け

Unity Sentisで Whisper-tiny による文字起こしとエフェクトの表示

【徹底解説】Mastra：TypeScript製AIエージェントフレームワーク

CUDA×CTranslate2の不具合解消

Azure Open AI の基礎及びセキュリティ機能 Content filteringを試す

プロンプト

✨ChatGPT関連のおすすめ講座4選！自分だけのGPTを作成して、デプロイまで学べる完全ガイド🚀

🧠 Chiral: 人間の思考に基づいたAIの新境地

#思考ベースAI

病院のガバナンス、血糖値予測、鎮静状態評価の最先端研究~NAMのヘルスケアレポート

nam中野哲平

NAM中野哲平氏による論文解説

ヘルスケアテック

pyttsx3で録音したwhisperのモデルごとの精度比較

Will・Can・Mustで考える、QAが価値を最大化するためのアプローチ

ソフトウェアテスト

OpenAI 最新 TTS/STT Models 使い方＆Pythonコードサンプル

【Node.js】OpenAI の API ＋新モデル（gpt-4o-transcribe、gpt-4o-mini-transcribe）で音声認識

gpt-4o-transcribe

gpt-4o-mini-transcribe

【実装編】AIが解説する登山動画！シーン説明ジェネレーターの開発記

Python＋Streamlit でトランプゲームをコミュニティクラウドにデプロイする

Webアプリケーション

1
2
3
次へ