Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

vttファイルからTEI/XMLを作成する

IIIF Audio/Visual: 複数のvttファイルを記述する

1

1
2
3
4
5

ゼロから始めるAIシステム開発 #15 「DifyでQ＆Aチャットボットを作成」

チャットボット

【無料】ローカルで会議動画を文字起こし

【Rails】renderメソッド使用時のMissing partialエラーの対応など

HTMLタグチートシート

チートシート

Android 動画字幕の初歩

🎬💻 動画×WEBの融合でブランド認知度120%向上 - クロスメディア戦略の設計と実行ガイド

ウェブ開発

フロントエンド

ブランディング

クロスメディア

動画マーケティング

Cloudflare Workers AI で Whisper Large V3 Turbo を使った日本語の文字起こしをする

CloudflareWorkers

初心者のためのVue.js入門

フロントエンド

スクラムガイド入門：アジャイル開発の基本を学ぼう

初心者エンジニア

M4 Mac mini で mlx-whisper を試す（pyenv・venv を使った環境準備も）【Python-4】

Jeli Post Incident Review で、インシデント振り返りがもっと楽になる！？

拡散モデルを活用した次世代動画生成と理解：Divot論文の詳細解析

拡散モデル

ホームサーバー完全構築ガイド #6 クラウドストレージの構築

Teams会議の議事録自動化作成

microsoftgraphAPI

AzureOpenAIService

MicrosoftEntraID

文字データを表示する方法

生成AIを用いて2022年ImageNetでSoTAの論文「CoCa: Contrastive Captioners are Image-Text Foundation Models (2022)」を読んでみた

マルチモーダル

生成AIを用いて2023年ImageNetでSoTAの論文「OmniVec: Learning robust representations with cross modal sharing (2023)」を読んでみた

マルチモーダル

WebVTTの世界：TVerがどのように字幕を配信しているか

[Google Cloud Speech-to-Text API(V2)] Javaで音声をテキストに変換する

音声認識API

サービスアカウント

Rocky LinuxでローカルのWhisper環境の構築方法

Whisper.cpp-CLI

2024/4/17主にITとかセキュリティの記事

触覚とtransformer について調査中

音声認識　Whisper.cppを使ってみた

2024/2/7主にITとかセキュリティの記事

Geminiの性能評価に使われているベンチマークの概要まとめ

Pythonで「図解！Jupyter Labを徹底解説！(インストール・使い方・拡張機能)」の動作を確認してみた

[Python] Whisper APIを使って文字起こしファイルを生成する

RECOROKUで社内勉強会の録画して共有してみた

ミーティング

ナレッジ共有

QiitaEngineerFesta2023

1
2
3
4
5