Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
[代替]YouTubeのtranscriptを取得する方法|Colab, youtube-transcript-api
長時間音声データをAzure AI SpeechのFast Transcription API (preview)で文字起こしする
Copilot Studio の会話履歴が保存される ConversationTranscript テーブルを探る
1
前へ
1
2
3
More pages
次へ
Google ColabでSpeechToTextしたい!
SpeechToText
colaboratory
2025年版:主要な音声認識モデルの特徴を比較・解説
whisper
ASR
deepspeech
Universal-1
深い集中と生産性を高める秘訣 ──カル・ニューポートとアンドリュー・ヒューバーマンの対話から学ぶ“充実した知的生活”──
AI
半導体
テクノロジー
生成AI
ChatGPT
Twilioで話した内容を書き起こしてみよう
Node.js
twilio
備忘録
TextToSpeech
GoogleChat
音声認識して、MindARで画像をcanvas-textureで貼り付け、頭上に「吹き出し」を表示させてみた
JavaScript
A-Frame
SpeechToText
MindAR
AWS Certified AI Practitioner(AIF)受験時の記録
AWS
MachineLearning
AI
資格
AWS認定試験
YouTube動画をMarkdown形式で要約するPythonスクリプト
Python
Markdown
YouTube
Gemini
Obsidian
Google Cloud Speech-to-Text の始め方
speech-to-text
無音時に API を停止+ウェイクワードでコマンドを受け付ける Google Cloud Speech-to-Text 実装例
VAD
speech-to-text
Windows PC (SikuliX / ChatGPT Vision / 音声コマンド) でマウス&キーボードをソフト制御する方法
SikuliX
speech-to-text
ChatGPT
Windows環境での開発環境セットアップ手順 ~ SikuliX OpenCV ChatGPT gRPC+protobuf Whisper / Google Cloud Speech-to-Text ~
OpenCV
protobuf
gRPC
SikuliX
speech-to-text
GeminiをPythonで使うための完全ガイド
Python
API
AI
Gemini
Google Meet に AIアドバイザーを同席させる
chrome-extension
GoogleMeet
生成AI
GoogleGenerativeAI
Markdown変換ライブラリ:MarkItDownを使う
Python
前処理
データ処理
LLM
Amazon Bedrock のバッチ推論を試してみた
AWS
初心者
bedrock
LLM
バッチ推論
Amazon Lex V2 をCloudFormationで構築する実践ガイド
AWS
CloudFormation
AmazonLex
見切り発車で平仮名の学習アプリを作る【7日目】
個人開発
見切り発車で平仮名の学習アプリを作る【6日目】
個人開発
LaTeXでディレクトリ構造を示すdirtreeパッケージの利用
LaTeX
創作意欲が爆発したのでAmazon TranscribeとAmazon Comprehendを使って対戦ゲーム中の自分の発言を感情分析してみた。
AWS
クリスマスイブに画面に向かって全力で応援できるアプリを作った
クリスマス
audioContext
SpeechRecognition
Next.js
Vercel
Asteriskを使って通話を録音し、文字起こしをしてみた
asterisk
sip
IP電話
文字起こし
Appleのストアページで使われているアクセシビリティのテクニック
アクセシビリティ
MarkItDown を使ってみよう
Markdown
MarkItDown
Streamlitで音声入力もできるチャットアプリを作ってみた(〜ChatGPT下位互換編〜)
Python
Streamlit
ChatGPT
LLM
【OpenAI × twilio】RealtimeAPIでお悩み電話相談室を作って相談してみた
Go
websocket
twilio
OpenAI
RealtimeAPI
Azure AI Video Indexer の Search Video API
C#
Azure
AzureAIVideoIndexer
Hexabase App Modeler-汎用型プロンプトの要件定義性能
uml
システム開発
AI
要件定義
開発ドキュメント
【python】高速音声対話の実現に向けた音声認識と発話区間検出の並列実行
Python
音声認識
Pyaudio
対話システム
GoogleCloud
oVice会議をリアルタイム文字起こし!音声データをコードで扱う技術
WebRTC
whisper
AdventCalendar2024
前へ
1
2
3
More pages
次へ