入門マルチモーダルRAG ―図表を読み解くAIアプリケーションの実装― 電子書籍版
2860円(税込)
作品内容
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。「図表を読めるRAG」を作る近年、テキストだけでなく、図・表・グラフといった画像を含む資料からも情報を検索・活用できる「マルチモーダルRAG(Retrieval-Augmented Generation)」の重要性が高まっています。従来のRAGが扱える情報はテキストデータに限定されており、実務現場で扱う文書──技術報告書・研究論文・プレゼン資料──のように、図表を多く含むデータには十分対応できませんでした。本書は、この課題を踏まえて、実務文書にも対応できるマルチモーダルRAGについて体系的に解説します。本書では、自分の手でマルチモーダルRAGを構築できるようになることを目指します。全体を通して、手を動かしながら理解できるよう、再現可能なコード例を多数提示しています。【主要目次】Chapter 1 テキストベースのRAGChapter 2 Responses APIのfile searchによるRAGChapter 3 標準的なマルチモーダルRAGChapter 4 ColPaliを利用したマルチモーダルRAGChapter 5 エージェントによる自律制御を組み込んだMMA-RAGChapter 6 VQAを中核としたマルチモーダルRAG
作品情報
作者の関連作品作者の作品一覧