Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
いままで体験した中で最高精度!すごいボイスクローン: INDEX-TTS
ローカルで動かせる日本語TTSをいろいろ試す(その2)
ローカルで動かせる日本語TTSをいろいろ試す
【Gemini】GPU不要!超軽量TTSとLLMを使ったチャットWebサービスの構築 ~ UTAU収録音声を用いたTTS ~
使いたい英語アプリが無かったので作った - OpenAI TTS API, Gradio🚀
「gpt-4o-transcribe」、「gpt-4o-mini-transcribe」、「gpt-4o-mini-tts」について
Google Colab T4でKokoro TTSの音声合成を試してみた
【Flutter】音声読み上げをやってみた【flutter_tts】
Matcha-TTSにDifferential Transformerを組み込んだ話
AWS Lambda で TTS (pyopenjtalk) をしてみる
Google ColabからEdge TTSを利用して音声合成する方法
[Python]指定したWEBページからテキストを取得して音読してもらう[pyttsx3]
ChainlitとVOICEVOXを使って、AIチャットのTTSをやってみる
電話の音声データをOpenAIのTTS (text-to-speech) modelで作成する
ttskch/paginator-bundleでlimit値の上限を設定する方法
android.speech.ttsをJetpack Composeで使ってみた
Parler-TTS (真にオープンなテキスト音声合成モデル) とは
React+TypeScriptでWebAssembly011。React+TypeScript。ReactTsでWasm呼び出しのまとめ
vbaとGoogle TTSでPowerpointに音声ファイルを添付する
シンプルでカスタマイズしやすい最強のページネーションバンドル ttskch/paginator-bundle のご紹介 2023
GPT4+AzureのSTT+各種TTS(VOICEROID/VOICEPEAK/OpenAI/pyttsx3)の実験
【音声合成】Matcha-TTS🍵で日本語音声を生成してみる
JVSコーパスとESPNetを使って複数話者TTSモデル(VITS)を訓練させた
OpenAIのWhisper, TTS, Assistants APIでレストラン予約ができる音声会話型ボットを作る
OpenAIのWhisper, TTS, Assistants APIで長期記憶を持った音声会話型ボットを作る
Streamlit+GPT4-Vision+TTSで動画ナレーション自動生成ツールをつくった
(WIP)【2023年11月時点】日本語TTSモデルで高品質なOSSまとめ
ESPnet2で日本語のTTSを試す
Elevenlabsのmultilingual TTSをgoogle colabで試してみた。
Tango TTSをgoogle colabで試してみた。
TTSの軽量化:iSTFTとMulti-Bandを用いたTTS
音声技術の進化による外国語コンテンツ活用法:自動翻訳字幕とTTSを活用した自動吹き替え
ESPNet2 で日本語 TTS(Text-to-speech)するメモ (Windows でも動くよ)
【Flutter】Flutter_ttsを使ってテキスト読み上げアプリを作る【全文あり・コピペOK】
google-tts-api を使わない google-home-notifier
Symfonyでページネーションを実装するならttskch/pagerfanta-bundleがおすすめ!
1
1
2
3
More pages
次へ
ローカルPCで動くTTSで自作ゲームをフルボイス化する
TTS
クソアプリ
Twilio Functionsで作る:SMS放置→自動電話催促の動作イメージデモ
twilio
SMS
voice
プリセールスエンジニア
Functions
猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️AIアイデンティティ盗用問題
機械学習
AI
バイナリテック
話題のプライベートなローカルManus代替AgenticSeekをWindowsで試してみる
Windows
ollama
Manus
Agenticseek
🎤【Python】TikTok Liveのコメントをリアルタイムで音声読み上げするボットを作ってみた【tiktok-voice-bot】
Pyhton
音声処理
TTS
tiktok
猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️仮想現実とAI:リアルの境界は消えるか?
機械学習
AI
バイナリテック
FastRTCを日本語対応に!リアルタイム音声処理拡張パッケージ fastrtc-jp を作りました
音声合成
WebRTC
音声認識
VOICEVOX
Style-Bert-VITS2
toppersedujsp monitor
JSP
TOPPERS
monitor
edu
DoCAP
猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️ AIと人間の境界線は曖昧になるか?
機械学習
AI
バイナリテック
faster-Whisper、ChatGPT API、VOICEVOX coreを組み合わせて音声対話AIを作った話
AI
対話システム
VOICEVOX
ChatGPT
faster-whisper
AWS契約してLightSailでLibreChatを動かす
AWS
vps
docker-compose
Lightsail
librechat
AWSとAzureで使用できる最新のAI比較【2025年4月版】
AWS
Azure
chatbot
生成AI
ChatGPT
Windows上でsayコマンド
Windows
Say
音声認識モジュールの比較
音声認識
ASRPRO
CI-03T
LD3320
HLK-V20
LangGraph & Veo 2 連携で朝のニュース動画をフルAI化してみた
AI
生成AI
GenerativeAI
LLM
LangGraph
AI Agentでニュースや論文を自動更新――朝イチで“耳”からインプット
AI
Agent
OpenAI
LLM
LangGraph
数が多すぎて混乱してきたので OpenAI の LLM たちをまとめてみた
初心者
初心者向け
OpenAI
ChatGPT
LLM
【Python】教育目的でOpenAI APIを使ったときの料金を検証してみた
Python
初心者
#openai
【Python】VSCode × StreamlitでAzure OpenAIチャットアプリを構築する方法
Python
VSCode
Streamlit
ChatGPT
AzureOpenAI
Agent SDKでTTSする方法
TTS
AgentSDK
Azure OpenAI Developers セミナー 2025 動画などを紹介+Updates
Azure
AI
AzureAISearch
AzureAIAgent
AzureAIFoundry
「AI-Vtuber「ネウロ様(neuro-sama)」の分析その2:【話者交替】」
AI
OpenAI
Vtuber
LLM
話者交替
青チャートで周囲を巻き込んで課題解決したガクチカ【三角関数信号処理FFT】
Python
怪文書
技術継承担当のAIキャラを作りたい!②
Python
学生
React
three-vrm
LLM
【徹底解説】Mastra:TypeScript製AIエージェントフレームワーク
TypeScript
AI
LLM
Mastra
CursorとClaudeをplaywright-mcpで連携!AI VTuber開発は水族館と文通とモニター崩壊の先にあった
MCP
cursor
Playwright
AITuber
Claude
【discord.js】なぜ転送メッセージは荒らし対策BOTを貫通してしまうのか。
discord
discord.js
荒らし
discordbot
Azure Speech Service
TextToSpeech
OpenAI の API + 新モデル「gpt-4o-mini-tts」で音声合成 その2: ストリーミング・パラメータ追加を試す【Node.js】
JavaScript
Node.js
音声合成
OpenAI
gpt-4o-mini-tts
ASRPRO 音声認識モジュール 日本語対応
音声認識
M5
UnitASR
ASRPRO
CI-03T
1
2
3
More pages
次へ