2025年2月12日

マンガでわかる生成AI【第11話】自社用チャットを作りたい!(前編)

一人暮らしを始めたばかりの沙織の心強いパートナーは「生成AI」!? 日常や仕事で起きるさまざまなピンチを、生成AIと共に乗り切れるのか!? 「ChatGPT」などでおなじみの生成AIを使いこなすためのヒントをマンガで解説します。



(企画・原作:森一弥 作画:佐倉イサミ

マンガで分かる生成AI【第12話】に続く・・・ 前回【第10話】はこちら

キーワード解説

漫画の原作者である、アステリア株式会社 ノーコード変革推進室 エバンジェリストの森が、今回のお話の概要や会話に登場したキーワードについて簡単に解説します!

RAG(ラグ)
Retrieval-augmented generation の略。
日本では「検索拡張生成」と呼ばれることもあるが、ほとんどの場合、略称のRAGと呼ばれていることが多い。大規模言語モデル(LLM)の学習内容に含まれない情報を別途検索してプロンプトに含める手法のことを言うので、広い意味だと「Web検索」の機能をONにしてチャットのサービスを実行する方法もRAGの一種と言える。何らかのシステムに携わっている方であれば、VectorStoreを利用した仕組みや概念、システム全体のことを指している事が多い。

VectorStore
主に文章をベクトルデータ化したものを格納するデータベースの一種。様々な製品、サービスがあり、一般的なRDBからの拡張を行った製品などもある。提供形態も、クラウド、オンプレミスともにあり、有料製品から、オープンソースまで様々存在している。

システムプロンプト
生成AIの利用者が入力する「ユーザープロンプト」に対して、サービス提供側があらかじめ仕込んでいるプロンプトのこと。利用用途を限定したり、制限をかけたりすることにも使われる。

トト先生の生成AI塾

いつかはするんじゃろうと思っていたRAGの話をし始めたな。
話の中で言っていたようじゃが、専用のデータベースなどを用意せず単にネット検索するものもRAGに含まれるのか?あまりそういった言い方をしているものは少なそうじゃが。
そうじゃな。検索拡張生成という日本語からもわかるように、LLMの学習内容に含まれない情報を、あとから検索して付与したうえで回答してもらう方法全般を指すから、広い意味じゃと最近のチャットサービスにも付いておる「Web検索オプション」もRAGの一種だと言える。

まぁ、殆どの場合、RAGといえば専用のVectorStoreを用意する方法のことを指しておるがの。ただ、従来の企業内検索システムのようなものをつなげる事もできるし、ハイブリッド方式なんてものも出始めておる。必ずしもVectorStoreが必須というわけではなくなってきておるな。
企業内の利用なら、外部に情報を出したくないなんて場合もあるじゃろう?
そうじゃな。やはり企業の重要な情報をすべて外部に出すことに抵抗がある企業は多い。RAGと言っても多くの場合はLLM部分はChatGPTやGoogleなどを使うことが多いので、ユーザーの質問に関係する一部分は出ていくことにはなるが、丸ごと出ていくことを考えれば許容できる範囲という感じかの。

そこにも懸念があれば、AWSやAzureなどでプライベートクラウド環境を構築することになるかの。
すべてを社内でまかなうのはまだまだ難しいのかの?
予算があればできそうじゃがな。
GPUが何枚も乗った専用サーバーを用意するとかが必要になるし、数百万では収まらず数千万という金額がかかるかもしれん。しかも数カ月後には陳腐化していたり、社内から大して使ってもらえなかったりする可能性もあるのでなかなか投資するのは難しいかもしれんの。
なるほど、現実的にはプライベートクラウドあたりが落としどころかのぉ。

原作者のオマケ裏話

生成AI界隈は相変わらずの速度で新しい情報が入ってきています。この原稿を書いている際には、「DeepSeek」や、OpenAIの「Deep Reserch」などの発表が目白押しだったりしてます。

2025年1月末に、生成AIの最新情報を紹介するオンラインイベント【最近の生成AIニュース10選 どこよりもわかりやすく解説!】を開催させていただいたのですが、こちらは準備がものすごく大変だった割に、一ヶ月も経てば古くなってしまいそうだなと震えているところです(笑)。アーカイブはどなたでも無料で視聴できますので、よろしければぜひご覧ください。

マンガの方はできるだけ長く使える知識をわかりやすく落とし込もうとしております。今回のネタにしたRAGはしばらくは大丈夫かと思っていますが、細かい技術では日々新しい改善がされていたりもしますので、ご自身で調べてみることをおすすめします。

私のXアカウントではマンガの裏話や日々のつぶやきも更新中です。
また、小学館ダイム公式サイト「@DIMEアットダイム」でも生成AIに関するコラムを連載しています。最新回のテーマは「2025年は「AI エージェント」が大流行すると言われている理由」です。

お時間のある方はぜひチェックしてみてくださいね。

この記事がよかったら「いいね!」
この記事を書いた人
森 一弥 アステリア株式会社 ノーコード変革推進室 エバンジェリスト。 2012年よりインフォテリア(現アステリア)勤務。2017年3月までは主力製品「ASTERIA WARP」のシニアプロダクトマネージャーとしてデータ連携製品の普及に務め、特に新技術との連携に力を入れる。 ブロックチェーン技術推進の一環として実証実験やコンサルティングなどを実施。ブロックチェーンを活用した株主投票では特許を取得。またブロックチェーン推進協会(BCCC)では技術応用部会を立ち上げ、技術者へブロックチェーンアプリケーションの作り方を啓発している。現在はAIやIoTなど先端技術の調査、普及啓発に努めている。