Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    Gemini Multimodal Live API, Daily.co, Pipecatを使ったAI音声会話アプリ作成方法
    Next'25 速報 - Unify your data with BigQuery multimodal tables
    GeminiのMultimodal Live APIをコピペだけで試してみた!
    Phi-4 multimodal を VRAM12GB に載せる
    Phi-4-miniとPhi-4-multimodalが登場!
    Multimodal Live API で、AIネイティブ次世代のリアルタイム会話型の学習サービスをつくってみた!
    Gemini 2.0 と Multimodal Live API で実現するヒアリング Voice エージェント
    文献調査: 「NVLM: Open Frontier-Class Multimodal LLMs」
    Node.js から Gemini API in Vertex AI の Multimodal Live API にアクセスする
    噂の Gemini Multimodal Live API を使ったサンプルアプリとは
    【Python】Gemini 2.0 Multimodal Live API カメラ会話アプリ実装
    Gemini 2.0 Multimodal Live API でリアルタイムマルチモーダルアプリケーションを構築しよう!
    Gemini 2.0 Multimodal Live API 超解説
    Multimodal RAG を実装してみる
    MultiVector Retriever とMultimodal RAG について
    【論文読み】MMMU: A Massive Multi-discipline MultimodalUnderstanding
    Firebase Extensions で Gemini の Multimodal 機能を簡単に実装する方法
    Vertex AI Gemini ProとLangChainで実現するMultimodal RAG
    【論文紹介】MPMQA: Multimodal Question Answering on Product Manuals
    中学生でもわかる Multimodal Embeddings
    Multimodal-GPTを触ってみた
    • 1
    • 前へ
    • More pages
    • 12
    • 13
    • 14
    【勉強会】「第15回全脳アーキテクチャ勉強会」 の参加レポート (6/14/'16)
    機械学習
    DeepLearning
    人工知能
    【論文シリーズ】画像・文字混合データをボルツマンマシンで学習する
    自然言語処理
    DeepLearning
    画像認識
    Show, Attend and Tell を動かす,キャプション生成
    Python
    DeepLearning
    ニューラルネットワーク
    LSTM
    Caption
    論文読み: Classifying Student Dialogue Acts with Multimodal Learning Analytics
    機械学習
    論文読み
    なぜ2015年はAI技術がアツかったのか考えてみる (+2016年のトレンド予測)
    機械学習
    DeepLearning
    人工知能
    公共交通オープンデータの現在 アメリカ編
    opendata
    オープンデータ
    public_transport
    公共交通
    総務省 異能(Inno)vation 一次選考通過者&本採択者
    異能vation
    • 前へ
    • More pages
    • 12
    • 13
    • 14