Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

[代替]YouTubeのtranscriptを取得する方法｜Colab, youtube-transcript-api

長時間音声データをAzure AI SpeechのFast Transcription API (preview)で文字起こしする

Copilot Studio の会話履歴が保存される ConversationTranscript テーブルを探る

1

前へ
1
2
3
次へ

Google ColabでSpeechToTextしたい！

2025年版：主要な音声認識モデルの特徴を比較・解説

深い集中と生産性を高める秘訣 ──カル・ニューポートとアンドリュー・ヒューバーマンの対話から学ぶ“充実した知的生活”──

テクノロジー

Twilioで話した内容を書き起こしてみよう

音声認識して、MindARで画像をcanvas-textureで貼り付け、頭上に「吹き出し」を表示させてみた

AWS Certified AI Practitioner(AIF)受験時の記録

MachineLearning

AWS認定試験

YouTube動画をMarkdown形式で要約するPythonスクリプト

Google Cloud Speech-to-Text の始め方

無音時に API を停止＋ウェイクワードでコマンドを受け付ける Google Cloud Speech-to-Text 実装例

Windows PC (SikuliX / ChatGPT Vision / 音声コマンド) でマウス＆キーボードをソフト制御する方法

Windows環境での開発環境セットアップ手順～ SikuliX OpenCV ChatGPT gRPC+protobuf Whisper / Google Cloud Speech-to-Text ～

GeminiをPythonで使うための完全ガイド

Google Meet に AIアドバイザーを同席させる

chrome-extension

GoogleGenerativeAI

Markdown変換ライブラリ：MarkItDownを使う

データ処理

Amazon Bedrock のバッチ推論を試してみた

バッチ推論

Amazon Lex V2 をCloudFormationで構築する実践ガイド

見切り発車で平仮名の学習アプリを作る【7日目】

見切り発車で平仮名の学習アプリを作る【6日目】

LaTeXでディレクトリ構造を示すdirtreeパッケージの利用

創作意欲が爆発したのでAmazon TranscribeとAmazon Comprehendを使って対戦ゲーム中の自分の発言を感情分析してみた。

クリスマスイブに画面に向かって全力で応援できるアプリを作った

クリスマス

SpeechRecognition

Asteriskを使って通話を録音し、文字起こしをしてみた

文字起こし

Appleのストアページで使われているアクセシビリティのテクニック

アクセシビリティ

MarkItDown を使ってみよう

Streamlitで音声入力もできるチャットアプリを作ってみた（〜ChatGPT下位互換編〜）

【OpenAI × twilio】RealtimeAPIでお悩み電話相談室を作って相談してみた

Azure AI Video Indexer の Search Video API

AzureAIVideoIndexer

Hexabase App Modeler-汎用型プロンプトの要件定義性能

システム開発

開発ドキュメント

【python】高速音声対話の実現に向けた音声認識と発話区間検出の並列実行

対話システム

oVice会議をリアルタイム文字起こし！音声データをコードで扱う技術

AdventCalendar2024

前へ
1
2
3
次へ