Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
音声認識ライブラリ VOSK を試してみた
Whisper(v3, distil)やVoskを超簡単に試せるデスクトップアプリ爆誕!
JavaScriptとVOSKで自動文字起こし録音ツールを作ってみた
音声認識可能な対話型AIを作成してみた(VOSK, GiNZA, python,チャットボット)
話題の音声認識ツールキット Vosk を試してみた
1
1
2
FastRTCを日本語対応に!リアルタイム音声処理拡張パッケージ fastrtc-jp を作りました
音声合成
WebRTC
音声認識
VOICEVOX
Style-Bert-VITS2
.NETのSpeech.Recognitionをバッチファイルから使う
.NET
SpeechRecognition
SpeechToText
説教を録音してGTX980Tiで文字起こし。GPTに過失割合を判定してもらう
AI
whisper
pip ではインストールできるのに PDM や Poetry でインストールできないときに確認したいこと
Python
pip
Poetry
PdM
vosk を利用して音声ファイルから文字起こしファイル(テキストファイル、字幕ファイル `srt`)を生成する
Python
VOSK
vosk を使ってローカルの音声ファイルを文字起こししたテキストファイルを作るスクリプト
Python
VOSK
Vosk + gpt 4o-mini + pythonで作るリアルタイム翻訳ツール
Python
音声認識
VOSK
生成AI
4o-mini
Qiita のトレンド記事を要約してまとめたモノ(さぼり)
Qiita
AI
トレンド
要約
【パタパタ】遊戯王ライフ表示器作ってみた
Arduino
DIY
遊戯王
AfterAI
議事録アプリケーションの開発
Python
C#
VirtualBoxのUbuntu22.04上にROS2環境を構築し、YOLOとVOSKを動かす
VirtualBox
ROS2
YOLO
VOSK
Ubuntu22.04
PyLoT Robotics 2024 -ソフトウェア-
Python
ROS2
OpenManipulator-X
音声アシスタント作りたくなって調べた[メモ]
Python
音声認識
GPT-4o
ドライブ用音声チャットボットの開発〜ノイズフルな環境での音声認識〜
音声処理
音声認識
音声認識API
ChatGPT
AmiVoiceAPI
ChatGPTと画像認識で実機ロボットを制御してみる
ロボット
ROS2
YOLO
ChatGPT
LLM
Whisper(v3, distil)やVoskを超簡単に試せるデスクトップアプリ爆誕!
音声認識
whisper
個人開発
VOSK
Tauri
Azure OpenAI Service の最初の一歩: Azure版 ChatGPT を Azure OpenAI Studio のチャット用プレイグラウンドで試す
Azure
OpenAI
ChatGPT
AzureOpenAIService
AzureOpenAIStudio
ChatGPT API(gpt-3.5-turbo)を Node.js から使ってみる(公式リファレンスで参照した情報も記載)
JavaScript
Node.js
OpenAI
ChatGPT
2022年 Python/データ分析関連の人気Qiita記事150選
Python
機械学習
AI
データ分析基盤
音声認識のVoskでリアルタイムにPC上の音を文字起こし出来るようにしてみた
Python
Docker
音声認識
OSS
VOSK
音声認識可能な対話型AIを作成してみた(VOSK, GiNZA, python,チャットボット)
Python
自然言語処理
音声認識
GiNZA
VOSK
Zoom Meeting SDKとVosk browserでZoom会議のリアルタイム文字起こし
Zoom
QiitaEngineerFesta_Zoom
QiitaEngineerFesta2022
Zoom Meetingにアバターで参加するぞ。番外編
Zoom
QiitaEngineerFesta_Zoom
QiitaEngineerFesta2022
Zoom Meeting SDKでなんちゃってボイスチェンジャー
Zoom
QiitaEngineerFesta_Zoom
QiitaEngineerFesta2022
Zoom Meeting SDKをつかって会議にアバターで参加する
Zoom
QiitaEngineerFesta_Zoom
QiitaEngineerFesta2022
Zoom Meeting SDKでアバターにいろいろしゃべらせる
Zoom
QiitaEngineerFesta_Zoom
QiitaEngineerFesta2022
Zoom Meeting SDKでタイムキーパーちゃんを作る
Zoom
QiitaEngineerFesta_Zoom
QiitaEngineerFesta2022
VOSK+MeCabで無理やり辞書追加みたいなことをする
Python
mecab
音声認識
VOSK
日本語音声のマイク入力をオフラインでリアルタイム音声認識:「VOSK」を JavaScript(Node.js)で扱う
JavaScript
Node.js
音声認識
VOSK
QiitaEngineerFesta2022
VOSKとargostranslateとpyttsx3でオフライン通訳させてみました
初心者
翻訳
音声認識
Windows10
1
2