Zennta

ログイン会員登録

検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

お問い合わせフォーム利用規約プライバシーポリシー

1

Gemini Multimodal Live API, Daily.co, Pipecatを使ったAI音声会話アプリ作成方法

Next'25 速報 - Unify your data with BigQuery multimodal tables

GeminiのMultimodal Live APIをコピペだけで試してみた！

Phi-4 multimodal を VRAM12GB に載せる

Phi-4-miniとPhi-4-multimodalが登場!

Multimodal Live API で、AIネイティブ次世代のリアルタイム会話型の学習サービスをつくってみた！

Gemini 2.0 と Multimodal Live API で実現するヒアリング Voice エージェント

文献調査: 「NVLM: Open Frontier-Class Multimodal LLMs」

Node.js から Gemini API in Vertex AI の Multimodal Live API にアクセスする

噂の Gemini Multimodal Live API を使ったサンプルアプリとは

【Python】Gemini 2.0 Multimodal Live API カメラ会話アプリ実装

Gemini 2.0 Multimodal Live API でリアルタイムマルチモーダルアプリケーションを構築しよう！

Gemini 2.0 Multimodal Live API 超解説

Multimodal RAG を実装してみる

MultiVector Retriever とMultimodal RAG について

【論文読み】MMMU: A Massive Multi-discipline MultimodalUnderstanding

Firebase Extensions で Gemini の Multimodal 機能を簡単に実装する方法

Vertex AI Gemini ProとLangChainで実現するMultimodal RAG

【論文紹介】MPMQA: Multimodal Question Answering on Product Manuals

中学生でもわかる Multimodal Embeddings

Multimodal-GPTを触ってみた

1

前へ

More pages

12
13
14

【勉強会】「第15回全脳アーキテクチャ勉強会」の参加レポート (6/14/'16)

【論文シリーズ】画像・文字混合データをボルツマンマシンで学習する

自然言語処理

Show, Attend and Tell を動かす，キャプション生成

ニューラルネットワーク

論文読み: Classifying Student Dialogue Acts with Multimodal Learning Analytics

なぜ2015年はAI技術がアツかったのか考えてみる (+2016年のトレンド予測)

公共交通オープンデータの現在アメリカ編

オープンデータ

public_transport

総務省異能（Inno）vation 一次選考通過者&本採択者

前へ

More pages

12
13
14