2023年3月20日

【AI専門家が徹底解説】話題の Chat GPT とは? 基本の使い方とAIの技術進展から見えること

アステリアで開催した「ChatGPT」 に関する勉強会をダイジェストでお届けします! 本勉強会では ChatGPTの基礎知識や使い方を中心に、AI技術の進展についても詳しく解説。参加したメディア関係者の方々と共に理解を深めました。


アステリアでは、2023年3月3日に報道機関向けに、今さまざまな業界で話題となっている OpenAI が開発したチャットボット「ChatGPT」 に関する勉強会を開催しました。勉強会では、ChatGPT の基礎知識や使い方を中心に、なぜここまで注目されているのか? というポイントや、具体的な用途について、当社エバンジェリストの森 一弥がレクチャー。

さらに、AI研究に関する開発子会社であるAsteria ART合同会社代表の園田智也氏が、AI技術進展から見たChatGPTについても解説。勉強会には多くのメディアの記者が参加し、ChatGPTに対する理解を深めました。

今回の記事では、本勉強会のダイジェストをお届けします。

登壇者プロフィール

森 一弥(もり・かずや)氏|アステリア株式会社 ノーコード変革推進室 エバンジェリスト

2012年よりインフォテリア勤務。2017年3月までは主力製品「ASTERIA WARP」のシニアプロダクトマネージャーとしてデータ連携製品の普及に務め、特に新技術との連携に力を入れる。 ブロックチェーン技術推進の一環として実証実験やコンサルティングなどを実施。ブロックチェーンを活用した株主投票では特許を取得。またブロックチェーン推進協会(BCCC)では技術応用部会を立ち上げ、技術者へブロックチェーンアプリケーションの作り方を啓発している。現在はAIやIoTなど先端技術の調査、普及啓発に努めている。

園田智也(そのだ・ともなり)博士|アステリア Artificial Recognition Technology (ART) 合同会社 代表

1997年、世界初の音楽検索エンジンを1997年に発明。そのエンジンは、機械学習で人間の声(歌声)のパターンを認識し、検索クエリに変換、インターネット上のデータベースに対して、曲名を検索するものであった。 1998〜2003年、機械学習と、ニューラルネットワークの技術を用いて、ジェスチャ認識システムや、マルチモーダルインターフェースシステムを開発した。 2001〜2003年、日本学術振興会特別研究員(文部科学省所管の独立行政法人日本学術振興会に認定された日本トップクラスの優れた若手研究者)。 2002年、IPA (独立行政法人 情報処理推進機構) 未踏ソフトウェア創造事業に採択。 2001年、博士課程の学生のときに、ウタゴエ株式会社を設立。 2019年、アステリアART合同会社 代表に就任。

「ChatGPT」の基本解説

そもそもChatGPT(チャットジーピーティー)とは、OpenAI社が開発した自然言語処理のAIチャットのこと。Teslaの共同創業者兼CEOとして知られるイーロン・マスク氏が創業に関わり、Microsoft が出資したAIの研究所で、現在は誰でも使えるサービスとして提供されています。

ChatGPTはさまざまな使い方ができます。例えば、文章の要約や翻訳はもちろん、文章やプログラムの雛形を作ることもできます。

言葉で説明してもわかりにくいので、まずは実際にChatGPTを使ってみましょう。
ChatGPTの開発元である、OpenAIのサイトを開きます。

【Try ChatGPT】を押すと登録画面が出てくるので、メールアドレスで自身のアカウントを作成します。登録が完了すれば、誰でもすぐに使い始められます。

ページ下部の入力欄に質問を入れます。日本語で大丈夫です。

例えば「日本の3月の伝統行事を教えてください」と投げかけてみます。すると、AIが分かりやすく箇条書きにしながら回答を出力してくれます。

あらゆる質問に対して、それに合った答えを返してくれるのがChatGPTです。

ChatGPTができることは、文章としての回答だけではありません。例えば、返ってきた答えに対して「上記を一覧表にしてください」と入力すると、表にまとめてくれます。AIとスレッドの中で会話が続くので、現在進行中のスレッドの中身を理解した上で、「上記を」と書くだけでこちらの指示が伝わるところも特徴の一つです。ちなみにこちらで出てきた一覧表をコピー&ペーストして、エクセルなどで使うことも可能です。

ChatGPTはなぜ世界で話題になったのか?

このようなサービスが誕生すると「これまでの仕事が奪われるのではないか」という議論が度々出ますが、ChatGPT の登場は、誰かの仕事を奪うものではなく、人の手助けになる便利な道具として捉えるべきではないかと考えています。

そして、なぜ ChatGPT がこれほどまでに話題になったのか?
その理由のひとつには、日本語の流暢さが日本人にとっても伝わりやすいことが挙げられていますが、さらに注目すべきは、ChatGTPの機能を使えるAPIが提供されていること。

APIを使うことで、業務に沿ったいろんな使い方が可能です。
例えば、企業のサポート業務などでお客様からの問い合わせにbotで答えたり、内容によって担当者に振り分けることもできるため、時間の短縮や作業負担の軽減なども可能になります

また分かりやすい例だと、帳票の作成にも有効に活用できます。
例えばExcelの中のマクロからChatGPTを読んで、さまざまな質問に一覧で答えてもらうこともできますし、レポートの作成や、分析資料、調査などの用途にも使うことができます。また、自社のサイトやアプリの中に取り込むことで、自社のサイト案内や、商品の説明にChatGPTを活用するということもできるようになるのです。

スライドにもある通り、ChatGPTや、AIを取り巻く関連会社、技術のニュースは日々メディアで取り上げられています。周辺情報も含めてキャッチアップして、ぜひ今後の技術進化を見届けてくださいね。

AI技術進展からみたChatGPT
ChatGPTの急成長を支えた技術「トランスフォーマー」

ではここからは、AI専門家が見る「ChatGPT」について解説していきます。

これまでは、いわゆる「ディープラーニング」と呼ばれる技術が、世の中では「AI」とされてきましたが、これには大きな問題があります。
それは大量のデータセット(※注釈1)が必要だということ。

AIに学習をさせるためには、数千〜数十万のデータセット画像に手でラベルを貼ったものなどを集め、コンピュータで学習させて認識させる必要があります。しかしこの膨大なこのデータセットを集める作業が難しかったため、誰かが学習したものを再利用する「事前学習」「転移学習」という機能を使って、事前に学習したものは触らずに、自分の学習認識させたい部分だけをデータセットで学習する、という方法が開発されてきました。

(編集部注釈※1) データセット
何らかの目的や対象について収集され、一定の形式に整えられたデータの集合

画像認識ではこのような手法が生まれてきましたが、言語モデルの場合にはなかなか有効な手法が見つからなかった、というのが歴史的な背景です。そこに登場したのが「トランスフォーマー(※注釈2)」という技術でした。

注釈※2
トランスフォーマー
自然言語処理や画像認識などの機械学習タスクにおいて、広く使用されるニューラルネットワークの一種。入力データ中の重要な情報を学習することができ、自然言語処理タスクにおいて特に有用と言われている。言語の特徴を事前学習したあと、比較的少ないデータセットを用いて、翻訳や要約などのタスクを行う際に高い性能を発揮する

このトランスフォーマーの誕生が大きなブレークスルーになりました。
これ以降、現在に至るまで、技術の中心になっています。

トランスフォーマーはどのように事前学習をするかと言うと、長い文章に、その次に出てくる文字を当てます。
例えば「今日の昼食は」まで入れると、次は「サ」を出すように学習していきます。次は「今日の昼食はサ」、まで入れたら次は「ラ」を出すように学習していきます。

非常にシンプルな学習を自動ですることで、単語の位置関係や単語間の関係を、効率よく、しかも自動で学習していくというのがポイント。このような手法を使うと「特定の文章と特定の単語の関係によって、ここにはどんな文字が入って、次に何が入ってくるか」がわかるようになります。これをベースに機械学習をしていきます。

こちらのスライドは、「今日の昼食は?」と聞いたときに、「サラダ」と答えるような学習をするときのモデルを表しています。

「今日の昼食は」と言ったときに、普通にサラダを「サ、ラ、ダ」と一文字ずつ出せばいいですが、データセットが少ないときは、世界に何の選択肢があるのかわからないので、前提知識も一緒に入力します。

例えば、サラダかパスタ、という前提知識も文章の間に挟んで「今日の昼食はサラダかパスタ」という前提知識のもとで「サラダ」と答えるように学習させます。このように学習をすることで、非常に高性能なQ&Aシステムができるということです。

「GPT-2」でより規模の大きなデータを得るには?

ところが、この前提知識を人間が埋め込んでいては膨大な手間がかかります。その結果考え出されたのが、「GPT-2」でより規模の大きなデータを得ることでした。データセットを従来の10倍、さらにパラメータ(モデルの大きさ)を10倍にしており、そうすることで、常識的な推論(Commonsense Reasoning)の出力を得るようになってきました。

例えば「子供と大人はどちらが腕相撲が強いですか」と聞いたとき、私たちは一般的に「大人だろう」と思いますが、それは裏側に「筋力の差があるから」という常識がありますよね。これをGPT-2ではファインチューニング(すでに学習済みのモデルに新たな層を追加し、モデル全体を再学習する手法)をせずに獲得しているということがわかりました。

そうしたことから、パラメータとデータセットをただ大きくしていけばいいという考えに至ります。
ところがここには問題があり、容量を大きくしていくことで学習させるだけでも数億円というような費用がかかり、さらにエネルギーも必要となります。そうした理由から、このコストに見合うだけの成果が得られるのかどうか? ということが新たな課題になってきたのです。

そこで、オープンAIの研究者たちが見つけた有名な法則が「スケール則(※注釈3)」でした。

注釈※3
スケール則
大規模なニューラルネットワークの訓練において、パラメーター数やデータセットサイズ、計算量などをスケールアップすることで、モデルのパフォーマンスがどのように変化するかを示す法則。大規模なニューラルネットワークの訓練において、どのような規模の計算リソースが必要であるかを予測する際に役立つ

この結果、データセット数やパラメータ数をどのぐらいまで増やせばいいのか、どれぐらい増やしたら何の効果が得られるのかを予測できるようになりました。つまり投資効果が計算でわかり、しかもしばらくの間は、どんどん増やしても大丈夫だということまでわかります。

そうした流れを経て、「GPT-3」そして「ChatGPT」という、大規模で多額の費用をかけたものが出来るようになりました

一般的に「GPT-3」では、民間で一般的に入手できる計算資源を用いた試算で数百年かかるとされる計算を、Microsoftが提供する「AIスーパーコンピューター」で学習させ、どれぐらいの精度のものが出来上がっていくか? ということを研究しました。そして「GPT-2」と比較し、アルゴリズム自体を高速化させる工夫を入れたことで、性能が向上。データセットサイズやモデルのパラメータ数を飛躍的に増やした結果、人間の手によるファインチューニングの手間も削減したのです。これが大きなブレークスルーになったと言われています。

これは、GPT-3では「例示」と呼ばれる手法です。例えば「リンゴはApple、ではバナナは?」と聞く。「リンゴはApple」という例を1個出した上で、バナナは?と聞くと、「Banana」と、”これは日本語から英語に訳すもの” だと勝手に解釈して、答えを出すようになります。

また、ChatGPTの技術の特徴として、前処理と後処理にしっかり投資がされているので、人間のフィードバックに合うような結果が返ってくるということがあります。

これによって、例えば何か質問をしたときに、人間の意図に沿った結果を出したり、でっち上げについてもかなり軽減されるようになりました。その結果、2022年11月に一般公開できるレベルまでになり、皆さんが手元で、安全に、そしてバイアスが少ない形で公開されたというのが今回の一連の事象なのです。

ChatGPT 誕生による大きな変化

こうした背景を踏まえて生まれた「ChatGPT」ですが、2022年11月以前と、それ以降の世界は、大きく変わってくるだろうというのがAI専門家の見解です。

その理由として、大量・多様なデータから高い汎化性能を獲得したファウンデーションモデルの存在があります。

これによって、富士山の絵をピカソ風に描いたり、さまざまなスタイルの猿のデータを作ることができます。今後この技術の進展によって、人類の作業効率が上がり、また素晴らしいものが生まれてくるでしょう。 これらは「ジェネラティブAI」、「生成AI」などと呼ばれていて、現在の機械学習およびそのAI技術の中心的なトレンドになっています。これら全て、最初にお話ししたトランスフォーマーという技術が根幹にあります。

今後、知能はインフラ化される!?

ChatGPTの台頭により、今後、知能がインフラ化されると考えています。
人工知能に仕事が取って代わられるのではなく、人工知能を自分の仕事に使う時代が到来したということです。そしてこれは、水道のようにインフラ化されていくものと考えています。

分かりやすい例でいうと、既に「Notion」「Tome」「GitHub」などでは、裏側でジェネレーティブAIが自動的にドキュメントやスライドやプログラムを作ったりします。おそらくオフィスアプリケーション、モデリング、デザインなど、誰もが使う身近なアプリケーションにも標準で搭載されていますし、音楽を作成するツールなどにも応用されてきます。

身近なところでは、例えばレシピサイトで今週の献立を提案してくれたり、新しいカレーの作り方のレシピを紹介してくれたりと、幅広いサイトで展開されていく未来もあるでしょう。

またこうした流れを汲んで、人事採用への影響もずいぶん出てくることが予想されます。エンジニアは、こうしたツールを使うスキルがあるかどうかを非常に重要視するでしょうし、こうしたスキルを活用することで、3人も4人分も早く仕事ができるようになるでしょう。例えばプログラミング言語の「Python」で書いたものを「Java」に書き換えて、とChatGPTに指示をすると、綺麗なプログラムを返してくれます。 このように効率化が進むと同時に、人間の能力が大幅に補完されて、可能性が広がる未来があるのです。

ChatGPT 解説イベントまとめ

世界で話題の「ChatGPT」について、使用方法から技術的な歴史も含めて解説いただきました。ChatGPTの誕生により、AI技術が身近に感じられるようになった人も多いでしょう。AI技術の進化によって、人間のできることが広がる時代に入っています。まださまざまな課題も抱えている技術ではありますが、ここから世界がどのように変革するのか? その行方を見守るのが楽しみになりました。

今後、さまざまな業種・業界で触れる機会が出てきそうなChatGPT。まだChatGPTを活用していない方は、ぜひこの機会に試してみてはいかがでしょうか?

関連リンク

AI研究開発子会社「アステリアART(アート)」について

この記事がよかったら「いいね!」
この記事を書いた人
in.LIVE 編集部 アステリア株式会社が運営するオウンドメディア「in.LIVE(インライブ)」の編集部です。”人を感じるテクノロジー”をテーマに、最新の技術の裏側を様々な切り口でご紹介します。