Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
vttファイルからTEI/XMLを作成する
IIIF Audio/Visual: 複数のvttファイルを記述する
1
1
2
3
4
5
ゼロから始めるAIシステム開発 #15 「DifyでQ&Aチャットボットを作成」
初心者
チャットボット
生成AI
LLM
Dify
【無料】ローカルで会議動画を文字起こし
Windows
whisper
【Rails】renderメソッド使用時のMissing partialエラーの対応など
学習記録
Rails6
HTMLタグ チートシート
HTML
チートシート
タグ
Android 動画字幕の初歩
Android
WebVTT
Media3
🎬💻 動画×WEBの融合でブランド認知度120%向上 - クロスメディア戦略の設計と実行ガイド
ウェブ開発
フロントエンド
ブランディング
クロスメディア
動画マーケティング
Cloudflare Workers AI で Whisper Large V3 Turbo を使った日本語の文字起こしをする
cloudflare
whisper
OpenAI
CloudflareWorkers
猫
猫2
初心者のためのVue.js入門
CSS
Vue.js
フロントエンド
Vuex
tailwindcss
スクラムガイド入門:アジャイル開発の基本を学ぼう
初心者
agile
scrum
初心者エンジニア
M4 Mac mini で mlx-whisper を試す(pyenv・venv を使った環境準備も)【Python-4】
Python
Mac
whisper
mlx
mlx-whisper
Jeli Post Incident Review で、インシデント振り返りがもっと楽になる!?
pagerduty
postmortem
Jeli
拡散モデルを活用した次世代動画生成と理解:Divot論文の詳細解析
動画生成
拡散モデル
LLM
ホームサーバー完全構築ガイド #6 クラウドストレージの構築
Linux
nginx
homeserver
nextcloud
Teams会議の議事録自動化作成
Python
Teams
microsoftgraphAPI
AzureOpenAIService
MicrosoftEntraID
2
2
文字データを表示する方法
学習
生成AIを用いて2022年ImageNetでSoTAの論文「CoCa: Contrastive Captioners are Image-Text Foundation Models (2022)」を読んでみた
機械学習
マルチモーダル
論文読み
生成AI
ChatGPT
生成AIを用いて2023年ImageNetでSoTAの論文「OmniVec: Learning robust representations with cross modal sharing (2023)」を読んでみた
機械学習
マルチモーダル
論文読み
生成AI
ChatGPT
WebVTTの世界:TVerがどのように字幕を配信しているか
HLS
WebVTT
TVer
RFC8216
[Google Cloud Speech-to-Text API(V2)] Javaで音声をテキストに変換する
Java
OAuth2.0
SpeechToText
音声認識API
サービスアカウント
Rocky LinuxでローカルのWhisper環境の構築方法
Whisper.cpp-CLI
2024/4/17主にITとかセキュリティの記事
Security
ニュース
触覚とtransformer について調査中
触覚
Transformer
音声認識 Whisper.cppを使ってみた
音声認識
whisper
OpenAI
2024/2/7主にITとかセキュリティの記事
Security
ニュース
Geminiの性能評価に使われているベンチマークの概要まとめ
人工知能
Gemini
Pythonで「図解!Jupyter Labを徹底解説!(インストール・使い方・拡張機能)」の動作を確認してみた
Python
JupyterLab
[Python] Whisper APIを使って文字起こしファイルを生成する
whisper
OpenAI
RECOROKUで社内勉強会の録画して共有してみた
勉強会
ミーティング
ナレッジ共有
QiitaEngineerFesta2023
RECOROKU
1
2
3
4
5