Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
Google Cloud Speech-to-Text APIを使った話者分離(Speaker Diarization)の実装
Unity + gRPCでCloud Speech-to-Textを利用する
Speech-to-Text(Reazonspeech/Amzon Transcribe/Whisper ) を試してみた!
Semantic Kernel で Text-To-Speech と Speech-To-Text を試す
Unity Sentisを使ったローカルで高速なspeech-to-text
自分でコードを書かずにChatGPTに指示だけしてGoogle speech-to-text APIを使って発表の音声をテキストにしてみた
GCP様のspeech-to-textで音声をテキスト化してみる
Cloud Speech-to-TextAPIで自動文字起こし
1
前へ
More pages
2
3
4
More pages
次へ
Macで実現高品質な音声収録編集ワークフロー:実務で使えるPythonスクリプトとトラブルシューティング
Python
Mac
Pyaudio
sounddevice
音声収録
Google Cloudアップデート (2/20-2/26/2025)
GoogleCloud
GPTの視覚的機能とTTS APIを用いた動画の処理とナレーション生成
TTS
Databricks
GPT-4
Cloudflare Workers AI で Whisper Large V3 Turbo を使った日本語の文字起こしをする
cloudflare
whisper
OpenAI
CloudflareWorkers
【機能検証】Amazon Polly がシンガポール英語(Jasmine)の新しい音声を味見してみた!!
AWS
音声合成
初心者向け
AmazonPolly
機能検証
Google Cloudアップデート (2/13-2/19/2025)
GoogleCloud
AI最新論文をAI自身に解説させてみた話
AI
エンジニア
論文読み
rag
ChatGPT
OpenAI(4. 2022年ごろ:GPT-3.5, ChatGPT, DALL-E 2, Whisper)
歴史
OpenAI
Google Cloudアップデート (2/6-2/12/2025)
GoogleCloud
Fish Audio APIでイーロンマスク風の音声で`text to speech`する際のメモ
TextToSpeech
Web Speech APIを使ってリアルタイムVOICEVOX音声変換やってみた【ChatGPT】【Claude】
TypeScript
WebSpeechAPI
VOICEVOX
ChatGPT
Claude
音声AIで切り拓く未来:リアルタイム応答システムの挑戦
Python
websocket
AI
OpenAI
voicebot
Microsoft Teams 業務効率化レシピ集: Power Automate & Bot 活用で日々のルーチンワークを自動化
自動化
BotFramework
業務効率化
Teams
PowerAutomate
Google Cloudアップデート (1/30-2/5/2025)
GoogleCloud
音声生成モデルのCosyVoiceを使ってみる
音声合成
TTS
aliyun
Alibaba
CosyVoice
XinferenceにhuggingfaceからRuriシリーズのモデルを登録
Docker
huggingface
LLM
XInference
Transcription API: Convert Audio to Text with Accuracy
C++
CSS
JavaScript
フロントエンド
ChatGPT
Conventional Commits with Gitmoji
gitmoji
conventional
OpenAI o3-miniとGoogle TTS使って朝のニュースをポッドキャストにする
TTS
OpenAI
o3-mini
Azure OpenAI Text to speech で今日の天気予報を読み上げる
TextToSpeech
logicapps
AzureOpenAI
Inference Endpoints で LLM をパパっと使えるようにする
AWS
API
AI
huggingface
LLM
curlコマンド UTF-8でエンコード
curl
最新技術を音声で学ぶ!AIラジオ「Tech Post Cast」で情報収集を効率化
AWS
cloudflare
個人開発
OpenAI
GoogleCloud
外国語英会話補助アプリをつくろうとしてGoogle Speech-to-Text APIの認識に成功したが、ChatGPT APIの扱いで挫折した件。
Flask
SpeechToText
API連携
ChatGPT
英会話アプリ
Twilioで話した内容を書き起こしてみよう
Node.js
twilio
備忘録
TextToSpeech
GoogleChat
無料で学ぶ!生成AIとバズった技術まとめ(LLM、LangChain、Dify、SAM2、Stable Diffusion、RVCなど)
rag
StableDiffusion
生成AI
LangChain
LLM
Kokoro-82M TTS導入しました
Python
AI
TTS
Fish Speech をローカルで動かしてみた
Python
Text-to-Speech
GenerativeAI
Visual Studio CodeでC#のWindowsForm デバッグ実行まで
C#
WindowsForm
VSCode
Zotero の drag and drop をハックする ~ CSL ファイルの編集
Zotero
論文管理
前へ
More pages
2
3
4
More pages
次へ