Zennta
ログイン
会員登録
検索
後で読む
お気に入り
お気に入りグループ
検索
Qiita一覧
Zenn一覧
お問い合わせフォーム
利用規約
プライバシーポリシー
1
Gemini Multimodal Live API, Daily.co, Pipecatを使ったAI音声会話アプリ作成方法
Next'25 速報 - Unify your data with BigQuery multimodal tables
GeminiのMultimodal Live APIをコピペだけで試してみた!
Phi-4 multimodal を VRAM12GB に載せる
Phi-4-miniとPhi-4-multimodalが登場!
Multimodal Live API で、AIネイティブ次世代のリアルタイム会話型の学習サービスをつくってみた!
Gemini 2.0 と Multimodal Live API で実現するヒアリング Voice エージェント
文献調査: 「NVLM: Open Frontier-Class Multimodal LLMs」
Node.js から Gemini API in Vertex AI の Multimodal Live API にアクセスする
噂の Gemini Multimodal Live API を使ったサンプルアプリとは
【Python】Gemini 2.0 Multimodal Live API カメラ会話アプリ実装
Gemini 2.0 Multimodal Live API でリアルタイムマルチモーダルアプリケーションを構築しよう!
Gemini 2.0 Multimodal Live API 超解説
Multimodal RAG を実装してみる
MultiVector Retriever とMultimodal RAG について
【論文読み】MMMU: A Massive Multi-discipline MultimodalUnderstanding
Firebase Extensions で Gemini の Multimodal 機能を簡単に実装する方法
Vertex AI Gemini ProとLangChainで実現するMultimodal RAG
【論文紹介】MPMQA: Multimodal Question Answering on Product Manuals
中学生でもわかる Multimodal Embeddings
Multimodal-GPTを触ってみた
1
前へ
More pages
12
13
14
【勉強会】「第15回全脳アーキテクチャ勉強会」 の参加レポート (6/14/'16)
機械学習
DeepLearning
人工知能
【論文シリーズ】画像・文字混合データをボルツマンマシンで学習する
自然言語処理
DeepLearning
画像認識
Show, Attend and Tell を動かす,キャプション生成
Python
DeepLearning
ニューラルネットワーク
LSTM
Caption
論文読み: Classifying Student Dialogue Acts with Multimodal Learning Analytics
機械学習
論文読み
なぜ2015年はAI技術がアツかったのか考えてみる (+2016年のトレンド予測)
機械学習
DeepLearning
人工知能
公共交通オープンデータの現在 アメリカ編
opendata
オープンデータ
public_transport
公共交通
総務省 異能(Inno)vation 一次選考通過者&本採択者
異能vation
前へ
More pages
12
13
14