Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

いままで体験した中で最高精度！すごいボイスクローン: INDEX-TTS

ローカルで動かせる日本語TTSをいろいろ試す（その２）

ローカルで動かせる日本語TTSをいろいろ試す

【Gemini】GPU不要！超軽量TTSとLLMを使ったチャットWebサービスの構築～ UTAU収録音声を用いたTTS ～

使いたい英語アプリが無かったので作った - OpenAI TTS API, Gradio🚀

「gpt-4o-transcribe」、「gpt-4o-mini-transcribe」、「gpt-4o-mini-tts」について

Google Colab T4でKokoro TTSの音声合成を試してみた

【Flutter】音声読み上げをやってみた【flutter_tts】

Matcha-TTSにDifferential Transformerを組み込んだ話

AWS Lambda で TTS (pyopenjtalk) をしてみる

Google ColabからEdge TTSを利用して音声合成する方法

[Python]指定したWEBページからテキストを取得して音読してもらう[pyttsx3]

ChainlitとVOICEVOXを使って、AIチャットのTTSをやってみる

電話の音声データをOpenAIのTTS (text-to-speech) modelで作成する

ttskch/paginator-bundleでlimit値の上限を設定する方法

android.speech.ttsをJetpack Composeで使ってみた

Parler-TTS (真にオープンなテキスト音声合成モデル) とは

React+TypeScriptでWebAssembly011。React+TypeScript。ReactTsでWasm呼び出しのまとめ

vbaとGoogle TTSでPowerpointに音声ファイルを添付する

シンプルでカスタマイズしやすい最強のページネーションバンドル ttskch/paginator-bundle のご紹介 2023

GPT4+AzureのSTT+各種TTS(VOICEROID/VOICEPEAK/OpenAI/pyttsx3)の実験

【音声合成】Matcha-TTS🍵で日本語音声を生成してみる

JVSコーパスとESPNetを使って複数話者TTSモデル（VITS）を訓練させた

OpenAIのWhisper, TTS, Assistants APIでレストラン予約ができる音声会話型ボットを作る

OpenAIのWhisper, TTS, Assistants APIで長期記憶を持った音声会話型ボットを作る

Streamlit+GPT4-Vision+TTSで動画ナレーション自動生成ツールをつくった

(WIP)【2023年11月時点】日本語TTSモデルで高品質なOSSまとめ

ESPnet2で日本語のTTSを試す

Elevenlabsのmultilingual TTSをgoogle colabで試してみた。

Tango TTSをgoogle colabで試してみた。

TTSの軽量化：iSTFTとMulti-Bandを用いたTTS

音声技術の進化による外国語コンテンツ活用法：自動翻訳字幕とTTSを活用した自動吹き替え

ESPNet2 で日本語 TTS(Text-to-speech)するメモ (Windows でも動くよ)

【Flutter】Flutter_ttsを使ってテキスト読み上げアプリを作る【全文あり・コピペOK】

google-tts-api を使わない google-home-notifier

Symfonyでページネーションを実装するならttskch/pagerfanta-bundleがおすすめ！

1

1
2
3
次へ

ローカルPCで動くTTSで自作ゲームをフルボイス化する

クソアプリ

Twilio Functionsで作る：SMS放置→自動電話催促の動作イメージデモ

プリセールスエンジニア

猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️AIアイデンティティ盗用問題

バイナリテック

話題のプライベートなローカルManus代替AgenticSeekをWindowsで試してみる

🎤【Python】TikTok Liveのコメントをリアルタイムで音声読み上げするボットを作ってみた【tiktok-voice-bot】

猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️仮想現実とAI：リアルの境界は消えるか？

バイナリテック

FastRTCを日本語対応に！リアルタイム音声処理拡張パッケージ fastrtc-jp を作りました

Style-Bert-VITS2

toppersedujsp monitor

猿でもわかるAIの倫理・リスクシリーズ 🐵⚠️ AIと人間の境界線は曖昧になるか？

バイナリテック

faster-Whisper、ChatGPT API、VOICEVOX coreを組み合わせて音声対話AIを作った話

対話システム

AWS契約してLightSailでLibreChatを動かす

AWSとAzureで使用できる最新のAI比較【2025年4月版】

Windows上でsayコマンド

音声認識モジュールの比較

LangGraph & Veo 2 連携で朝のニュース動画をフルAI化してみた

AI Agentでニュースや論文を自動更新――朝イチで“耳”からインプット

数が多すぎて混乱してきたので OpenAI の LLM たちをまとめてみた

初心者向け

【Python】教育目的でOpenAI APIを使ったときの料金を検証してみた

【Python】VSCode × StreamlitでAzure OpenAIチャットアプリを構築する方法

Agent SDKでTTSする方法

Azure OpenAI Developers セミナー 2025 動画などを紹介＋Updates

「AI-Vtuber「ネウロ様（neuro-sama)」の分析その２：【話者交替】」

青チャートで周囲を巻き込んで課題解決したガクチカ【三角関数信号処理FFT】

技術継承担当のAIキャラを作りたい！②

【徹底解説】Mastra：TypeScript製AIエージェントフレームワーク

CursorとClaudeをplaywright-mcpで連携！AI VTuber開発は水族館と文通とモニター崩壊の先にあった

【discord.js】なぜ転送メッセージは荒らし対策BOTを貫通してしまうのか。

Azure Speech Service

OpenAI の API ＋新モデル「gpt-4o-mini-tts」で音声合成その2：ストリーミング・パラメータ追加を試す【Node.js】

gpt-4o-mini-tts

ASRPRO 音声認識モジュール　日本語対応

1
2
3
次へ