Zennta

  • ログイン会員登録
  • 検索後で読むお気に入りお気に入りグループ

履歴

履歴がありません

Qiita一覧

Zenn一覧

  • お問い合わせフォーム利用規約プライバシーポリシー
    • 1
    BLIP2 / Google Colab
    CLIP/BLIP2を使ってrosbagの画像検索できるようにした話、プロンプトと検索結果の比較を添えて
    • 1
    • 1
    • 2
    • 3
    基盤エージェントの最新動向と課題
    AI
    Agent
    AIエージェント
    大規模マルチモーダルモデルを軽量チューニング:Multimodal Prompt TuningによるVLP高速最適化
    マルチモーダル
    VQA
    LLM
    Fwd2Bot徹底解説:LVLM視覚トークン圧縮の新潮流とその理論的背景
    LLM
    マルチモーダルAI
    視覚言語モデル
    【Vision Language Model】LLaVAの論文を読んでみた
    AI
    LLM
    vlm
    【推論#02】AI推論でよく使われる代表的なモデルまとめ(YOLO / ResNet / BERT など)
    AI
    YOLO
    ResNet
    bert
    推論
    無料で学ぶ!生成AIとバズった技術まとめ(LLM、LangChain、Dify、SAM2、Stable Diffusion、RVCなど)
    rag
    StableDiffusion
    生成AI
    LangChain
    LLM
    Community Labs, $13Kの賞金プールでArweaveコミュニティハッカソンに参加 [Community Labs]
    Blockchain
    Web3
    Ao
    arweave
    分散型コンピューティング
    Office2019でも画像の透明度を変更したい
    PowerShell
    画像
    Office365
    Office2019
    透明度
    Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation
    image
    DoCAP
    LLM
    LLaMA
    DOKを使ってStable Diffusionをファインチューニングする
    機械学習
    AI
    ファインチューニング
    dok
    StableDiffusion
    MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI, AI(8)
    英語
    benchmark
    参考文献
    DoCAP
    LLM
    【2024年8月公開 Arxiv論文ランキング】2408.xxxxx
    ランキング
    arXiv
    AI論文解説
    MMMU: A Massive Multi-discipline Multimodal AI(4)
    英語
    AI
    DoCAP
    LLM
    Stable Diffusion Web UIをCPUだけ実行し、APIを利用するまで
    AI
    Yayoi
    StableDiffusion
    StableDiffusionWebUI
    Ubuntu24.04
    #004: Azure Developer CLI (azd)を用いたBicepのデプロイ
    Azure
    VSCode-Extension
    Bicep
    azd
    COARSE CORRESPONDENCES:マルチモーダル言語モデルの3D空間理解を飛躍的に向上させる新手法
    LLM
    マルチモーダルモデル
    3D空間理解
    Stable Diffusion 3 は何が足りないか?
    ポエム
    StableDiffusion
    vlm
    論文まとめ:Anything-3D: Towards Single-view Anything Reconstruction in the Wild
    MachineLearning
    DeepLearning
    reconstruction
    diffusionmodel
    StableDiffusion
    xlsxファイルの中身を見てみる
    Excel
    office
    【サーベイ論文まとめ】RAG(Retrieval-Augmented Generation)
    DeepLearning
    ChatGPT
    LLM
    OpenVINO™ ノートブック・チームのメンバーからの重要な情報: パート 2
    DeepLearning
    intel
    AI
    notebook
    OpenVINO
    ConvLLaVAを日本語LLMで学習してみた
    画像処理
    自然言語処理
    生成AI
    LLM
    vlm
    FastAPI と React で UI 開発手順
    UI
    React
    FastAPI
    vite
    ChatGPT
    マルチモーダルLLMを理解する
    データサイエンス
    マルチモーダル
    Dataiku
    生成AI
    LLM
    解像度の高い画像が入力可能な日本語VLMを学習させてみた
    Python
    画像処理
    自然言語処理
    LLM
    vlm
    Databricksにおける生成AIを用いたブランドに沿う画像の生成
    Databricks
    StableDiffusion
    Turing 社のマルチモーダル LLM heron-blip-v1 を Google Colaboratory から UI 付きで動かす
    GoogleColaboratory
    turing
    生成AI
    LLM
    BLIP
    Cyber Apocalypse 2024 Writeup
    Security
    CTF
    writeup
    #NLP2024 にエア参加してみた
    NLP2024,
    自然言語処理学会
    GPT4を使用したVision&Languageモデルの評価手法LLaVA-Benchを試す
    LLM
    GPT-4
    LLaVA
    V&L
    • 1
    • 2
    • 3