Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    オフィスでのオンライン会議が変わる?Teamsの音声分離を試してみた
    Time domain 音声分離の始まりを追う(TasNet)
    • 1
    • 前へ
    • More pages
    • 2
    • 3
    • 4
    • More pages
    • 次へ
    Web Speech APIを使ってリアルタイムVOICEVOX音声変換やってみた【ChatGPT】【Claude】
    TypeScript
    WebSpeechAPI
    VOICEVOX
    ChatGPT
    Claude
    Voice-Pro: 究極のAI音声変換・多言語翻訳ツール 🎙️
    YouTube
    translation
    AI
    TTS
    ASR
    【AI文字起こし】kotoba-whisper-v2.2をGoogle Colabで試してみる
    Python
    whisper
    colaboratory
    LLM
    Kotoba-Whisper
    【書評】イラスト図解式 この一冊で全部わかるWeb技術の基本
    WebAPI
    Web
    Webアプリケーション
    書評
    初心者エンジニア
    【Unity x ADX】グローバルAisacを使用して、ゲーム内で動的にAisacを適用する
    Unity
    audio
    Adx2
    ADX2LE
    インタラクティブミュージック
    SPATIO-TEMPORAL SALIENCY MODEL TO PREDICT EYE MOVEMENTS IN VIDEO FREE VIEWINGy(2008)
    個人メモ
    論文メモ
    2025年版:主要な音声認識モデルの特徴を比較・解説
    whisper
    ASR
    deepspeech
    Universal-1
    Spotify APIでaudio_featuresが使えなくなったので代わりを作る
    Python
    音楽
    音声処理
    Spotify
    Pythonではじめる音響解析!TensorFlow.Kerasの便利な機能「DataSets」を使ってつくるスペクトログラムを用いて音声認識をするニューラルネットワークの解説
    Python
    Keras
    spectrogram
    TensorFlow
    STFT
    電気通信主任技術者(伝送交換)の学習メモ
    電気通信主任技術者試験
    cyberagent/DeepSeek-R1-Distill-Qwen-32B-JapaneseをDatabricksで動かしてみる
    Databricks
    CyberAgent
    deepseek
    DeepSeekR1
    外国語英会話補助アプリをつくろうとしてGoogle Speech-to-Text APIの認識に成功したが、ChatGPT APIの扱いで挫折した件。
    Flask
    SpeechToText
    API連携
    ChatGPT
    英会話アプリ
    Vertex AI における Gemini API のデータ利用について
    Google
    Gemini
    プライバシー
    VertexAI
    データ利用
    情報試験の知識垂れ流し_情報安全確保支援士午前
    資格
    情報理論のキーワード
    情報理論
    ギターソロ区間の自動判定に挑戦した話 🎸🎶🔍
    Python
    音声処理
    librosa
    Demucs
    Raspberry Pi 5 で無課金、モニター不要、自動で会話を記録するスマートスピーカーを作成
    Python
    GoogleAppsScript
    RaspberryPi
    systemd
    faster-whisper
    【Demucs&Librosa】AI音声解析で音楽中の演奏区間を抽出する
    Python
    初心者向け
    AI
    音声認識
    残念英語力のレガシーアプリ開発者がre:Inventを生きのこるために、そしてこの先生きのこるために
    AWS
    ポエム
    reinvent
    reInvent2024
    G検定自作チートシート
    G検定
    aoai-realtime-audio-sdkを動かしてみた
    JavaScript
    やってみた
    RealtimeAPI
    aoai-realtime-audio-sdk
    gpt-4o-realtime-preview
    マスタリングTCP/IP 3章 データリンク
    本
    身近な例で理解するRTMとRTCの世界
    RTM
    RTC
    Google Cloud Console でプロジェクトを作成し、Speech-to-Text API を有効化するまでの手順
    speech-to-text
    Pythonで西遊記(1978)のオープニングを再現してみようとした
    Python
    ハッカソン
    初心者
    ML/DL/LLMの主要アルゴリズムを一気見!ビジネス活用と学習のポイント徹底ガイド
    アルゴリズム
    機械学習
    DeepLearning
    AI
    LLM
    Dify×Gemini 2.0で音声データを簡単文字起こし
    AdventCalendar2024
    企業での生成AI利用ガイド(4)~2024年のAIまとめ、そして「時間と量子もつれの不思議な関係」
    AI
    rag
    生成AI
    ChatGPT
    Asteriskを使って通話を録音し、文字起こしをしてみた
    asterisk
    sip
    IP電話
    文字起こし
    Entra ID
    Windows
    Network
    Azure
    初心者
    EntraID
    • 前へ
    • More pages
    • 2
    • 3
    • 4
    • More pages
    • 次へ