オペレーションを進化させる
現場のWEBマガジンpowered by Bewith

生成AI狂騒曲:イマサラだけど生成AIって何? 世界一わかりやすい生成AI

  • #生成AI

DIGITAL

宮本知宜

2024.06.05

2022年11月30日、ChatGPT3がリリースされ、世界はこの生成AIに衝撃を受けました。
この生成AIブームの火付け役となったOpenAI社の名前を聞かない日は無いくらい、連日報道がなされていることと思います。

ChatGPT3がリリースされて月間利用者数が1億人に達するまでに要した時間は約2ヶ月と言われています。ちなみに、TikTokの13ヶ月、Instagramは26ヶ月、Facebookは42ヶ月と言われており、圧倒的なスピードで世界に広がった事がわかります。

そして、この生成AIブームから約1年半たった今日も鳴りやまないこの生成AI狂想曲が今後どこへ向かうのか、また、ビジネスシーンやコンタクトセンターでどのように活用されている、或いは、活用される可能性があるのか、を計3回にわたって書いていきたいと思います。

第1回目は、あらためて生成AIって何?という基本的な部分や特徴、仕組についてご紹介いたします。

これまでのAIと生成AIは何が違うの?

これまで、AIブームは1950年代後半を皮切りに計3回来ているといわれています。そして、生成AIブームは第4次AIブームと言っても良い状況かもしれません。

シンプルに生成AIとこれまでのAIも事前に学習させる点や、指示された内容に対してアウトプットする、という点はかわりません。
 生成AIは学習した情報から、「新たなアウトプットを創造できる」点がこれまでのAIと大きく異なります。
そして、そのアウトプットは文章やアイディア、最近では画像や音楽も生成してくれます。そして、生成AIはその学習方法もこれまで主流だった機械学習(アルゴリズムを利用して大量のデータを学習し、そのデータ内容に沿ってパターン等を導き出し、新たな判断ができるようになるもの)だけではなく、ディープラーニング(人工ニューラルネットワークと呼ばれる階層構造のアルゴリズムを使用し、自らデータを抽出・学習し判断する事ができる)によって生成AIが最善の回答を導き出したり、独自の文章などのアウトプットを創造する事が可能です。

このディープラーニングを用いた代表的なモデルがLLM(Large Language Model:大規模言語モデル)です。LLMを使う事によって、あたかも人が回答してくれているようなもっともらしい自然な言い回しで様々な文章を生成する事ができます。

LLM(大規模言語モデル)とは

LLMとは、自然言語処理を用いて大量のテキストデータに対してディープラーニングを行うモデルです。自然言語処理とは、人が日常で使っている言語(自然言語といいます)をコンピュータで処理や分析する技術です。そして、ディープラーニングは前述の通り、自らデータを抽出・学習する事です。対話型生成AIで最もメジャーなChatGPTでは「GPT-3.5」や「GPT-4」と呼ばれるLLMを使用していますし、Googleが開発したAIチャットボット「Bard」のベースとなっている「PaLM」も聞いた事がある方もいるかもしれませんがLLMです。
 
 LLMには「パラメータ」という概念があります。「パラメータ」とは、LLMを学習させるときに使う数値のことで、これが多ければ多いほどより自然で正確な文章をAIが生成する事ができます。具体的には、文脈を理解し、その後に続く言葉の予測精度が高まるといった効果があります。


この「パラメータ」は予測確立の集合体の事をさしていますが、近年では数十億から数兆個のパラメータを持つ巨大なLLM もあり、実際にGPT-3.5のパラメータ数は3,550億個と言われており、又、GPT-4では非公開となっていますが、1兆7,600億個と言われています。

 ただ、この「パラメータ」は多いだけでは機能しません。LLMは「トークン」「ファインチューニング」が必要です。
「トークン」とはテキストをAIが理解しやすくするために小さい単位で分割して、テキストデータを処理しやすくする基本的な単位です。言語モデルや自然言語処理は、テキストをトークン化することにより単語や文字などに分割されます。


そして、「ファインチューニング(事前学習)」とは、特定のタスクや目的に絞った形として調整する事を指しています。
 このファインチューニングは既に学習した内容を参照しながらも新しい能力を得るというイメージなので、学習した英語の知識を参照しながら、ドイツ語を学んで習得する、といったイメージです。


その他にもこのLLMの拡張性を高めるRAG(Retrieval-Augmented Generation:ラグと発音します)という概念があります。RAGは、「検索拡張生成」などと訳されますが、通常の生成AIと違って、学習した内容だけではなく外部情報の検索を組み合わせる事で、より回答の精度や正確性の高いテキスト生成を実現する事が可能です。このRAGは2つのフェーズで構成されており、『データの検索・選択』と『回答の生成』があります。まず、『データの検索・選択』はAIが大量のデータから必要な情報を検索し選択します。そして、その選択された情報を基に新たな回答が生成されることになります。言い換えるとLLMが学習していない事をRAGがカンニングペーパーの役割として補助し、回答するイメージです。


そして、ここ数年国産LLMを開発する日本企業も出てきており、これは日本語に特化した、或いはビジネスシーンに特化したLLMとして海外発のものとは一線を画したスタンスを取っているものもいくつか出てきています。ただ、GoogleやMicrosoftなどのメガプラットフォーマーと資金面では圧倒的な差があり、提供コスト等の課題は出てくると思いますが、特定業界や業種特化型のLLMによる精度向上も期待したいと思います。

生成AIの特徴

ここまでは、生成AIの素晴らしさや拡張性等に触れてきましたが、過去、この現場ドリブンでも何度もAIに関する記事がある中で統一した見解を私たちは示しています。それはAIは「魔法の杖ではない」という事です。
 ここではわかりやすく、ChatGPTなどに代表される対話型生成AIができることは何か、を改めて整理しました。

<対話型生成AIができること>
①    文章を生成する
②    既に作成された文章の文字校正を行う
③    文章を翻訳する
④    プログラムの作成を支援する(コーディング)
⑤    情報を集める
⑥    文章の表現を対象とする人物像に合わせて変更する
⑦    アイディアを出す
⑧    文章を要約する

以上のような事が生成AIにはできます。これだけ聞くと「おー、すごいすごい!」となるかもしれませんが、注意すべき点もあります。

<注意すべき点>
①    最新の情報は知りません
    例えば、ChatGPTのLLM:GPT3.5は2021年9月頃までの情報を基に学習が完了されたモデルである為、最新の情報は反映されていません。
    その為、時間軸は常に学習が完了したタイミングまでの情報になってしまいます。
②    もっともらしい嘘をつきます(ハルシネーション)
    生成AIはハルシネーションといって、もっともらしい嘘をつく事があります。この嘘の幅についてもチューニングや前述のRAGによる補完を行う事でコントロールする事はできますが、「人間が確認するプロセス」も重要です。
③    人間のように察する事はできません
    LLMや言語によってもことなりますが、人間が経験上察する事ができる物事の背景や事情は理解できません。
    その為、より細かく具体的な指示を出す必要があります。この指示(命令)を「プロンプト」といいます。プロンプトがあいまいだと、望んだ回答を得る事ができない為、更問にて具体性を高める為に何度もキャッチボールをしないといけない場合もあります。

このように、生成AIとは上手く付き合う為には様々な工夫も人間側のスキルも必要であり決してなんでもできる魔法の杖ではない事がわかります。

より生成AIを上手く活用するには

生成AIから、より精度の高いアウトプットを得る為には、生成AIへの指示や命令を上手く行う事、即ちプロンプト上手になる事が重要です。この指示や命令を設計し最適化する事をプロンプトエンジニアリングと言います。
日本でもプロンプトエンジニアの年収は右肩上がりで約600万から1000万と言われていますが、欧米では数千万の年収はあたりまえの職種になっていますが、ここでは通常の対話型AIに投げ込むプロンプト(質問や指示)についての工夫について触れたいと思います。

プロンプトには以下の要素があります。
<プロンプトの4要素>
①    生成AIに実行してもらいたい事(指示命令/タスク等)
    作ってほしい(新しい文章を作成してほしい)
    教えてほしい(大量のデータから検索してほしい)
    要約してほしい(文章の要約)
    考えてほしい(○○に関するアイディアをあたえてほしい)
②    回答の質を高める為の周辺情報や背景(背景/文脈)
    どのような立場からどのような立場に向けて(親から小さな子供へ)
    質問の背景等の周辺情報(5W2H)
③    回答してほしい質問(入力)
    ①を前提にした具体的な質問
    ①が○○文字以内のあいさつ文とした場合、ご栄転の挨拶メール等の具体的な質問内容
④    アウトプット形式(出力)
    対比した表形式で
    3C分析で
    口語体で


これらを駆使しても思うような回答を得られないケースもありますが、追加でのリクエストを行い徐々に求める回答に近づける事も必要です。

おわりに

今回は生成AIの概念をあらためてわかりやすい表現で整理いたしました。今回多く登場した対話型生成AI以外にも映像や画像の生成AIやプレゼン資料の生成AIなど、用途に合わせた生成AIなどもご紹介したいと思います。
そして、これを読んで「私の仕事は将来的に無くなっちゃうのかしら!?」と不安に駆られた方もいるかもしれませんが、安心してください。生成AIのテクノロジーは人間がこれまでと比べてより多くのアウトプットが出せる一つの手段にすぎません

嘗て、RPAが出てきたときに、何を自動化させるか、という議論を多くみてきましたが、生成AIも同じだと思います。今ある業務プロセスの中で、どのプロセスを生成AIに任せてどのプロセスは人間が行うか。というBPR(Business Process Reengineering:業務改革)要素が多分にあります。この業務改革に於けるフローの可視化や生成AIを使う事による効率化や少人化の優先順位や投資対効果を検討する事は必ず人間が行わなくてはならない事、人間でなくてはできない事であると私は考えます。ぜひ皆さんの日々の業務の中でこの業務プロセスに使えそうなポイント等、見つめなおすきっかけになれば嬉しく思います。

ビーウィズが提供するクラウドコンタクトセンターシステム(クラウドPBX)『Omnia LINK(オムニアリンク)』は、コールセンター事業社であるビーウィズの現場ノウハウから生まれたコールセンターシステムです。
高精度な音声認識による「リアルタイムテキスト化」をはじめ、コールセンター向けの数々の先進機能を搭載しており、オペレーターとSVの業務を大幅に効率化し、コールセンターの生産性と品質の向上、在宅コールセンターの推進など様々な効果をもたらす、使いやすさにこだわったシステムです。


Omnia LINK(オムニアリンク)に関する詳しい資料は、こちらからご覧いただけます。
https://www.bewith.net/gemba-driven/download/entry-126.html

その他関連サービス

■クライアント企業に合わせた、最適運用を実現
コールセンター・コンタクトセンター

■クライアント企業のマーケティング活動を最適化
アウトバウンド

■お客様のニーズに寄り添い、お客様に合わせたミライを提供
インバウンド


関連記事