Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

論文要約: Tacotron2 - TacotronとWaveNetを組み合わせた音声合成モデル

1

1
2
3

LLMVoX: LLMを拡張する軽量ストリーミングTTSの革新

ストリーミング

レベル別で紹介！オープンソースで挑戦できる120のプロジェクトアイデア集

プロジェクト

オープンソース

Module-LLMのNPU用モデルへ変換する(MeloTTS編)

人工知能（AI）：生成AIって何？

人工知能（AI）：自然言語処理・音声認識・音声合成の違いって何？（後半）

自然言語処理

テキスト音声合成（Text-to-speech synthesis : TSS）に入門（前半）

【178選】エンジニア必見！最新AIサービス完全ガイド

生成AIの種類・仕組み・従来のAIとの違いを解説

生成AIの種類・仕組み・従来のAIとの違いを解説

深層学習基礎概要

「Python で学ぶ音声合成」のメルスペクトログラムの合成を、非自己回帰型（non-AR）でできるようにしました。

メルスペクトログラム

韻律付き音素

「Python で学ぶ音声合成」のメルスペクトログラムの合成を transformer で行うように改修した。

「Pythonで学ぶ音声合成」の Tacotron2 のメルスペクトログラム合成を LSTM から Transformer に改修した。

logmelspectrogram

Tacotron2の実装について解説してみる

せっかくだから俺は！渾身のクソアプリを解説するぜ！

ニューラルボコーダー論文25本ノック

ニューラルボコーダー

tacotron2でvtuberの音声合成をしてみる

Griffin-Lim アルゴリズムとは？

ESPNetで作るキャラクター音声合成

ESPnetの日本語TTSモデルで簡易的にアクセント指定できるスクリプトを作ってみた。

Mozilla TTS の後継 coqui TTS (VITS) で日本語音声合成

VITS を使った音声変換で特定話者のゆっくり化を試す

ヒカキンのフェイク動画作ってみた

Nvidia mellotron で日本語転移学習をしてみた2

GoogleColaboratory

Tacotronを高速化させるためにVocederについて少し調べてみた。

Nvidia mellotron で日本語マルチ話者転移学習をやってみた。

GoogleColaboratory

かわいい日本語音声合成（Tacotron2 + WaveGlow + CycleGAN-VC2）

Jetson NanoにPyTorch Geometricを導入

PyTorch-geometric

音声合成・激動の10年を振り返る

DeNA目線で見る　音声変換の最先端

MachineLearning

【論文読解】Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis

1
2
3