Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    [代替]YouTubeのtranscriptを取得する方法|Colab, youtube-transcript-api
    長時間音声データをAzure AI SpeechのFast Transcription API (preview)で文字起こしする
    Copilot Studio の会話履歴が保存される ConversationTranscript テーブルを探る
    • 1
    • 前へ
    • 1
    • 2
    • 3
    • More pages
    • 次へ
    Google ColabでSpeechToTextしたい!
    SpeechToText
    colaboratory
    2025年版:主要な音声認識モデルの特徴を比較・解説
    whisper
    ASR
    deepspeech
    Universal-1
    深い集中と生産性を高める秘訣 ──カル・ニューポートとアンドリュー・ヒューバーマンの対話から学ぶ“充実した知的生活”──
    AI
    半導体
    テクノロジー
    生成AI
    ChatGPT
    Twilioで話した内容を書き起こしてみよう
    Node.js
    twilio
    備忘録
    TextToSpeech
    GoogleChat
    音声認識して、MindARで画像をcanvas-textureで貼り付け、頭上に「吹き出し」を表示させてみた
    JavaScript
    A-Frame
    SpeechToText
    MindAR
    AWS Certified AI Practitioner(AIF)受験時の記録
    AWS
    MachineLearning
    AI
    資格
    AWS認定試験
    YouTube動画をMarkdown形式で要約するPythonスクリプト
    Python
    Markdown
    YouTube
    Gemini
    Obsidian
    Google Cloud Speech-to-Text の始め方
    speech-to-text
    無音時に API を停止+ウェイクワードでコマンドを受け付ける Google Cloud Speech-to-Text 実装例
    VAD
    speech-to-text
    Windows PC (SikuliX / ChatGPT Vision / 音声コマンド) でマウス&キーボードをソフト制御する方法
    SikuliX
    speech-to-text
    ChatGPT
    Windows環境での開発環境セットアップ手順 ~ SikuliX OpenCV ChatGPT gRPC+protobuf Whisper / Google Cloud Speech-to-Text ~
    OpenCV
    protobuf
    gRPC
    SikuliX
    speech-to-text
    GeminiをPythonで使うための完全ガイド
    Python
    API
    AI
    Gemini
    Google Meet に AIアドバイザーを同席させる
    chrome-extension
    GoogleMeet
    生成AI
    GoogleGenerativeAI
    Markdown変換ライブラリ:MarkItDownを使う
    Python
    前処理
    データ処理
    LLM
    Amazon Bedrock のバッチ推論を試してみた
    AWS
    初心者
    bedrock
    LLM
    バッチ推論
    Amazon Lex V2 をCloudFormationで構築する実践ガイド
    AWS
    CloudFormation
    AmazonLex
    見切り発車で平仮名の学習アプリを作る【7日目】
    個人開発
    見切り発車で平仮名の学習アプリを作る【6日目】
    個人開発
    LaTeXでディレクトリ構造を示すdirtreeパッケージの利用
    LaTeX
    創作意欲が爆発したのでAmazon TranscribeとAmazon Comprehendを使って対戦ゲーム中の自分の発言を感情分析してみた。
    AWS
    クリスマスイブに画面に向かって全力で応援できるアプリを作った
    クリスマス
    audioContext
    SpeechRecognition
    Next.js
    Vercel
    Asteriskを使って通話を録音し、文字起こしをしてみた
    asterisk
    sip
    IP電話
    文字起こし
    Appleのストアページで使われているアクセシビリティのテクニック
    アクセシビリティ
    MarkItDown を使ってみよう
    Markdown
    MarkItDown
    Streamlitで音声入力もできるチャットアプリを作ってみた(〜ChatGPT下位互換編〜)
    Python
    Streamlit
    ChatGPT
    LLM
    【OpenAI × twilio】RealtimeAPIでお悩み電話相談室を作って相談してみた
    Go
    websocket
    twilio
    OpenAI
    RealtimeAPI
    Azure AI Video Indexer の Search Video API
    C#
    Azure
    AzureAIVideoIndexer
    Hexabase App Modeler-汎用型プロンプトの要件定義性能
    uml
    システム開発
    AI
    要件定義
    開発ドキュメント
    【python】高速音声対話の実現に向けた音声認識と発話区間検出の並列実行
    Python
    音声認識
    Pyaudio
    対話システム
    GoogleCloud
    oVice会議をリアルタイム文字起こし!音声データをコードで扱う技術
    WebRTC
    whisper
    AdventCalendar2024
    • 前へ
    • 1
    • 2
    • 3
    • More pages
    • 次へ