Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    • 次へ
    Jetson Orin Nanoで音声認識:ROS2とWhisper.cppのセットアップ
    Notebook LM で作成した音声の字幕を作成する(Whisper & Google Colab)
    Streamlit+FastAPI+Whisperで社内オンプレ文字起こしサーバーを構築(非同期処理)
    完全ローカル運用で安心!WhisperとLM Studioを使った音声認識&AI活用入門
    KdenliveでWhisperのインストールができない問題の解決法
    Streamlit+Flask+Whisperで社内オンプレ文字起こしサーバーを構築(同期処理)
    fast-whisperで手軽に文字起こしできるCLIツールを作った
    【爆死レポ】古いGPUで faster-whisper large-v3 を動かそうとしたら地獄だった件
    superwhisperを自作して格安の音声入力環境を構築した
    iPhoneのボイスメモをAirDropでMacに送り、Whisperで自動文字起こしするバッチ処理
    iPhoneのボイスメモをWindowsでWhisperによって自動文字起こしするバッチ処理
    PythonとOpenAIのwhisperを使って、無料で話者分離付き文字起こしシステムを構築してNotionに自動アップロードする方法
    OpenAI APIの新しい文字起こしモデルを試してSnackWhisperに適用しました
    WhisperとGoogle Colaboratoryを使って文字起こし
    音声データのノイズ除去技術解説:SoX / OpenAI Whisper / RNNoise
    ローカルで無料で使える!OpenAI Whisperによる文字起こしツールの構築方法
    Whisperでボイスコマンドを作ってみた
    音声認識実践ガイド: WhisperからリアルタイムDictationまで
    WhisperのAPIコストを格段に下げる方法
    YouTube音声をダウンロードしてWhisperで文字起こしするスクリプト
    もしかしてまだキーボード使ってる?AI駆動の音声入力ツールSuperWhisperをオススメしたい
    リアルタイム音声認識をwhisperのturboモデル+faster_whisperで動かす
    英語音声ファイルをWhisperAPIを使用して日本語字幕データに変換する
    Anime Whisper: 演技セリフに特化した音声認識モデル(第1回)
    kotoba-whisperの比較
    faster-whisper(Whisper-Large-V3)で字幕(srt)をいい感じに作る
    Windows11のWSL上にcudaとcudnnを入れてfaster-whisperを動かす(faster-whisper 1.0.3)
    Whisper! 声を聞いて、文字を書くよ!音声認識界に衝撃を与えた!
    WhisperX をサーバレスGPU(Modal)上で動かす
    Windows で OpenAI Whisper (large-v3) を動してみた
    ReazonSpeechとWhisperで音声認識_Google Colaboratory上での実装
    WhisperKit を CLI と Python で使う
    Speech-to-Text(Reazonspeech/Amzon Transcribe/Whisper ) を試してみた!
    Whisper Medusaを試してみた:高速で正確な音声認識モデル
    生成AIをローカルで簡単に 【Part5.5 faster-whisper+マイク録音編】
    [音声認識]whisperモデルで文字起こし
    生成AIをGoogle Colaboratoryで簡単に 【Part5 音声認識AI faster-whisper編】
    生成AIをGoogle Colaboratoryで簡単に 【Part4 音声認識AI Whisper API編】
    Faster WhisperとDistil Whisperの音声認識gRPCサーバ
    OpenAI Whisperのコードの動きを追ってみるメモ
    Windowsでwhisper.cpp(GPU)を動かす
    SageMaker JumpStart で Whisper をホストし、Mac の音声をリアルタイムで文字起こし
    Faster WhisperとAWS SageMakerを活用してGPUでの高速文字起こしエンドポイントを構築する
    WhisperKitの使い方と評価 音声処理AIをMacとiOSで動かす
    homebrewでインストールしたwhisper-cppをコマンドラインから呼ぶ
    【iOS】WhisperKitを使ってiPhoneで高性能文字起こしをする!
    【WhisperKit】MBAで音声を文字起こし✍️
    CodeWhispererの機能まとめ
    • 1
    • 次へ
    • 1
    • 2
    • 3
    • More pages
    • 次へ
    猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️仮想現実とAI:リアルの境界は消えるか?
    機械学習
    AI
    バイナリテック
    猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️AIによる文化消滅リスク
    機械学習
    AI
    バイナリテック
    Unity Sentisの公式デモを触ってみた (執筆中)
    Unity
    UnitySentis
    OpenAI: モルガン・スタンレー 公開事例 - 金融サービスの革新に向けたAI評価フレームワーク
    DX
    ケーススタディ
    事例
    OpenAI
    生成AI
    FastRTCを日本語対応に!リアルタイム音声処理拡張パッケージ fastrtc-jp を作りました
    音声合成
    WebRTC
    音声認識
    VOICEVOX
    Style-Bert-VITS2
    Mac mini での ローカルLLM で使ったモデルの一部を削除する(MLX LM、MLX-VLM で使ったもの)
    Mac
    mlx
    ローカルLLM
    mlx-vlm
    mlx-lm
    faster-Whisper、ChatGPT API、VOICEVOX coreを組み合わせて音声対話AIを作った話
    AI
    対話システム
    VOICEVOX
    ChatGPT
    faster-whisper
    AWSとAzureで使用できる最新のAI比較【2025年4月版】
    AWS
    Azure
    chatbot
    生成AI
    ChatGPT
    Building LLM Powered Applications
    DoCAP
    LLM
    faster-whisperで漢字を抑制してひらがな、カタカナ出力する
    Python
    GPU
    whisper
    faster-whisper
    Qiita新規作成タグレポート(2025/04/20 - 26)
    Qiita
    Windows11の環境でllama-cpp-pythonをGPU対応でビルドするまでにハマった話
    Python
    AI
    whisper
    LLM
    LLaMA
    猿でもわかるAIビジネス活用シリーズ 🐵📊|[第5回] AI時代の働き方:人間の仕事はどう変わるのか?
    機械学習
    AI
    バイナリテック
    OBSでmacOSの音声キャプチャが勝手に止まる件、最終的にBlackHoleループ構成で解決した話
    macOS
    議事録
    BlackHole
    whisper
    OBS
    【無料】ローカルで会議動画を文字起こし
    Windows
    whisper
    【脱キーボード】Open Super Whisperで極上の文字起こし体験を手に入れる方法
    whisper
    gpt-4o-transcribe
    gpt-4o-mini-transcribe
    super-whisper
    数が多すぎて混乱してきたので OpenAI の LLM たちをまとめてみた
    初心者
    初心者向け
    OpenAI
    ChatGPT
    LLM
    Unity Sentisで Whisper-tiny による文字起こしとエフェクトの表示
    Unity
    初投稿
    whisper
    ONNX
    UnitySentis
    【徹底解説】Mastra:TypeScript製AIエージェントフレームワーク
    TypeScript
    AI
    LLM
    Mastra
    CUDA×CTranslate2の不具合解消
    CUDA
    Python3
    PyTorch
    faster-whisper
    CTranslate2
    Azure Open AI の基礎及びセキュリティ機能 Content filteringを試す
    Microsoft
    Azure
    Security
    プロンプト
    LLM
    ✨ChatGPT関連のおすすめ講座4選!自分だけのGPTを作成して、デプロイまで学べる完全ガイド🚀
    Python
    初心者
    AI
    ChatGPT
    LLM
    🧠 Chiral: 人間の思考に基づいたAIの新境地
    #未来技術
    #超知能AI
    #思考ベースAI
    #Chiral
    #脳波AI
    病院のガバナンス、血糖値予測、鎮静状態評価の最先端研究~NAMのヘルスケアレポート
    医療AI
    nam中野哲平
    NAM中野哲平氏による論文解説
    ヘルスケアテック
    pyttsx3で録音したwhisperのモデルごとの精度比較
    Python
    音声認識
    whisper
    pyttsx3
    Will・Can・Mustで考える、QAが価値を最大化するためのアプローチ
    QA
    ソフトウェアテスト
    OpenAI 最新 TTS/STT Models 使い方&Pythonコードサンプル
    Python
    TTS
    OpenAI
    ChatGPT
    LLM
    【Node.js】OpenAI の API + 新モデル(gpt-4o-transcribe、gpt-4o-mini-transcribe)で音声認識
    JavaScript
    Node.js
    OpenAI
    gpt-4o-transcribe
    gpt-4o-mini-transcribe
    【実装編】AIが解説する登山動画!シーン説明ジェネレーターの開発記
    Python
    Python+Streamlit でトランプゲームをコミュニティクラウドにデプロイする
    Python
    game
    Webアプリケーション
    トランプ
    Streamlit
    • 1
    • 2
    • 3
    • More pages
    • 次へ