Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    Google Cloud Speech-to-Text APIを使った話者分離(Speaker Diarization)の実装
    Unity + gRPCでCloud Speech-to-Textを利用する
    Speech-to-Text(Reazonspeech/Amzon Transcribe/Whisper ) を試してみた!
    Semantic Kernel で Text-To-Speech と Speech-To-Text を試す
    Unity Sentisを使ったローカルで高速なspeech-to-text
    自分でコードを書かずにChatGPTに指示だけしてGoogle speech-to-text APIを使って発表の音声をテキストにしてみた
    GCP様のspeech-to-textで音声をテキスト化してみる
    Cloud Speech-to-TextAPIで自動文字起こし
    • 1
    • 前へ
    • More pages
    • 2
    • 3
    • 4
    • More pages
    • 次へ
    Macで実現高品質な音声収録編集ワークフロー:実務で使えるPythonスクリプトとトラブルシューティング
    Python
    Mac
    Pyaudio
    sounddevice
    音声収録
    Google Cloudアップデート (2/20-2/26/2025)
    GoogleCloud
    GPTの視覚的機能とTTS APIを用いた動画の処理とナレーション生成
    TTS
    Databricks
    GPT-4
    Cloudflare Workers AI で Whisper Large V3 Turbo を使った日本語の文字起こしをする
    cloudflare
    whisper
    OpenAI
    CloudflareWorkers
    【機能検証】Amazon Polly がシンガポール英語(Jasmine)の新しい音声を味見してみた!!
    AWS
    音声合成
    初心者向け
    AmazonPolly
    機能検証
    Google Cloudアップデート (2/13-2/19/2025)
    GoogleCloud
    AI最新論文をAI自身に解説させてみた話
    AI
    エンジニア
    論文読み
    rag
    ChatGPT
    OpenAI(4. 2022年ごろ:GPT-3.5, ChatGPT, DALL-E 2, Whisper)
    歴史
    OpenAI
    Google Cloudアップデート (2/6-2/12/2025)
    GoogleCloud
    Fish Audio APIでイーロンマスク風の音声で`text to speech`する際のメモ
    TextToSpeech
    Web Speech APIを使ってリアルタイムVOICEVOX音声変換やってみた【ChatGPT】【Claude】
    TypeScript
    WebSpeechAPI
    VOICEVOX
    ChatGPT
    Claude
    音声AIで切り拓く未来:リアルタイム応答システムの挑戦
    Python
    websocket
    AI
    OpenAI
    voicebot
    Microsoft Teams 業務効率化レシピ集: Power Automate & Bot 活用で日々のルーチンワークを自動化
    自動化
    BotFramework
    業務効率化
    Teams
    PowerAutomate
    Google Cloudアップデート (1/30-2/5/2025)
    GoogleCloud
    音声生成モデルのCosyVoiceを使ってみる
    音声合成
    TTS
    aliyun
    Alibaba
    CosyVoice
    XinferenceにhuggingfaceからRuriシリーズのモデルを登録
    Docker
    huggingface
    LLM
    XInference
    Transcription API: Convert Audio to Text with Accuracy
    C++
    CSS
    JavaScript
    フロントエンド
    ChatGPT
    Conventional Commits with Gitmoji
    gitmoji
    conventional
    OpenAI o3-miniとGoogle TTS使って朝のニュースをポッドキャストにする
    TTS
    OpenAI
    o3-mini
    Azure OpenAI Text to speech で今日の天気予報を読み上げる
    TextToSpeech
    logicapps
    AzureOpenAI
    Inference Endpoints で LLM をパパっと使えるようにする
    AWS
    API
    AI
    huggingface
    LLM
    curlコマンド UTF-8でエンコード
    curl
    最新技術を音声で学ぶ!AIラジオ「Tech Post Cast」で情報収集を効率化
    AWS
    cloudflare
    個人開発
    OpenAI
    GoogleCloud
    外国語英会話補助アプリをつくろうとしてGoogle Speech-to-Text APIの認識に成功したが、ChatGPT APIの扱いで挫折した件。
    Flask
    SpeechToText
    API連携
    ChatGPT
    英会話アプリ
    Twilioで話した内容を書き起こしてみよう
    Node.js
    twilio
    備忘録
    TextToSpeech
    GoogleChat
    無料で学ぶ!生成AIとバズった技術まとめ(LLM、LangChain、Dify、SAM2、Stable Diffusion、RVCなど)
    rag
    StableDiffusion
    生成AI
    LangChain
    LLM
    Kokoro-82M TTS導入しました
    Python
    AI
    TTS
    Fish Speech をローカルで動かしてみた
    Python
    Text-to-Speech
    GenerativeAI
    Visual Studio CodeでC#のWindowsForm デバッグ実行まで
    C#
    WindowsForm
    VSCode
    Zotero の drag and drop をハックする ~ CSL ファイルの編集
    Zotero
    論文管理
    • 前へ
    • More pages
    • 2
    • 3
    • 4
    • More pages
    • 次へ