2023年10月4日、大手通信会社ソフトバンク社の孫氏は、生成AIのことについて述べる際、以下のように述べました。
「まだChatGPTを使っていない人は人生を悔い改めた方がいい」
「自分自身で毎日活用指定兄と、もうそれは電気を否定するとか自動車を否定する人と同じ」
AI+ITmedia by NEWS
孫社長がこれほど強調するほど、 ChatGPTなどの生成AIを含め、AIに対する正しい知識を身につけ、理解し活用していくことが重要だと言えます。
この記事では、AIトピックの中でも今話題の「生成AI」について取り上げていきます。
生成AIの進化は止まりません。今後 ChatGPTをうまく使いこなすスキルは、ビジネスパーソンに欠かせないスキルとなるでしょう。
- 生成AIって何?
- 生成AIってビジネスにどんなインパクトがある
- 生成AIの進化によって、どんな可能性をもたらす?
ChatGPTなどの生成AIについて話題になっているものの、
まだその仕組みについて実は、良くわかってないんだよな。
この記事を読むことで、生成AIやその背景にある技術について学べ、ビジネスへの影響や、将来の展望について知ることが出来るよ!
生成AIについて
生成AIに関する認知度と急激なユーザー数の増加
株式会社野村総合研究所が、2023年5月に実施した日本のビジネスパーソン約2,400名を対象としてインターネットアンケート調査を行いました。
- 「生成AI」の認知度は、50%を超えていました。
- 生成AIのビジネス業務での利用は、業界別に差が見られるが「実際に活用中」が3.0%、「トライアル中」が6.7%なり、「検討中」が9.5%でした。
画像:株式会社野村総合研究所(NRI)2023年6月13日 レポート より引用
2人に1人の割合で認知されているのに、ビジネスでの業務利用している人の割合が極端に低いね。
生成AIとは、ジェネレーティブAI(Generative AI) と呼ばれるAI(人工知能)の一種であり、クリエイティブな成果物を生み出す事ができます。
生成AI、特にOpenAIが開発したGPT-4は、目覚ましい進歩を遂げています。GPT-4は、その前モデルであるGPT-3やGPT-3.5を基に、一層進化した自然言語処理AIモデルです。
Chat-GPTのユーザーは、2022年に100万人を到達するまで5日ほどでした。Instagramがリリース当時2010年に、100万人ユーザーを到達するまで2.5ヶ月ほどでしたので、いかに多くの人に関心がある領域である事が分かります。そしてわずか2ヶ月ほどでアクティブユーザーが1億人を突破しました。
生成AIとChatGPTって何が違うの?
「ChatGPT」やGoogleの「Bard」などにの会話型のAIは、大規模言語モデル(LLM)と呼ばれる仕組みがベースとなっております。大規模言語モデルは、大量のテキストデータを用いて学習トレーニングさせた自然言語処理モデルです。大量テキストデータのトレーニングにより、人間とほぼ同じレベルの自然な文章の要約や受けごたえができるようにしたAIモデル。
生成AIは、テキスト・画像・音声などを生成できるAI技術の総称のことで、その生成AIの中で自然言語処理を担うモデルです。生成AIの中のモデルの1つとして、大規模言語モデルがある位置付けになります。
以下の記事では、ChatGPT以外の生成AIについてのまとめ解説をしているので、気になる方はぜひ参照してみてください。
また、以下ではChatGPTについてその始め方、使い方について詳しく解説しているので、こちらもぜひ参照してみてください。
生成AIの基礎と背景にある技術
生成AIとは何か、主要技術(例: GANs)と学習の背景についての概要
生成AI(Generative AI)は、新しいデータを生成または作成するAIのカテゴリーで、既存のデータセットから学習して、新しいコンテンツを生み出します。
例としては、文章、画像、音楽など、さまざまなメディアコンテンツの生成があります。
生成AIは主に、データのパターンを理解し、それを基に新しいデータを”生成”することを目的としています。
生成AIの中で主要な技術として挙げられるのが、GAN(Generative Adversarial Network)、
いわゆる生成敵対的ネットワークです。
生成敵対的ネットワーク(GAN)とは?
「GAN」または「Generative Adversarial Networks(生成敵対的ネットワーク)」は、深層学習(ディープラーニング)で利用される一種のアルゴリズムで、イアン・グッドフェローらによって2014年に提唱されました。
GANは、特に画像生成タスクにおいて革命的な結果をもたらし、コンピュータビジョンや機械学習の研究コミュニティで広く受け入れられています。
生成ネットワーク(Generator)
識別ネットワーク(Discriminator)
GANは2つのニューラルネットワーク、すなわち「生成ネットワーク」(Generator)と「識別ネットワーク」(Discriminator)を用いて構成されています。
これら2つのネットワークは、一種の「ゲーム」を通じて連携し、競争します。
- 生成ネットワーク (Generator)
-
- 目的: ランダムなノイズからデータ(通常は画像)を「生成」すること。
- 機能: 本物そっくりのデータを作り出し、識別ネットワークをだまそうとする。
- 識別ネットワーク (Discriminator)
-
- 目的: 提出されたデータ(写真や画像)が本物(実際のデータセットから来たもの)か、偽物(生成ネットワークによって生成されたもの)かを「識別」すること。
- 機能: 提出されたサンプルが本物か偽物かを識別し、正しく分類するよう学習する。
学習ステップ
生成ネットワークが新しいサンプルを生成します。
識別ネットワークがそのサンプルが本物か偽物かを評価します。
識別ネットワークの評価がフィードバックとして両ネットワークに送られ、それぞれのネットワークは次のラウンドでより良いパフォーマンスを発揮するよう更新されます。
このように、GANの構造は、「Generator」と「Discriminator」があり、2つのネットワークが競い合うことで精度の高いデータが生成されていく仕組みです。
よくある例として、画像分類を学習させて、学習させた入力画像と同じような画像を生成させるのがあるよね。
生成モデルの仕組みと具体的な例
ニューラルネットで、画像分類を行うようなケースについて解説しよう。
ニューラルネットワークの補足簡易説明(興味がある方向け)
ニューラルネットワークとは、人間の脳の神経回路を模した数理モデルのことで、ニューラルネットワークはデータから学習できるため、パターンを認識し、データを分類し、将来のイベントを予測するように学習させることができます。詳細については、今後、機械学習カテゴリーの記事を発信する予定ですので、そちらを参照してください。
茶色のネコの画像をクラスAとする。(クラスは、分類のような意味合い)
この画像分類の目的は、「とある確率分布で生成された画像に対して、どのぐらいの確率でクラスA(茶色のネコ)に当てはまるか」を考察し、擬似的に入力画像と本物、偽物と区別がつかない茶色のネコ画像を生成すること。
入力画像とクラスの対応関係を学習させます。この時、ニューラルネットは、入力画像に対して「どのくらいの確率でクラスAに当てはまるか?」という値を返します。識別の部分のみに確率の考え方が導入されたモデルです。
入力画像自体も、確率変数として扱います。「とある確率分布で生成された画像に対して、どのぐらいの確率でクラスA(茶色のネコ)に当てはまるか」を考察。
入力画像が従う確率分布をうまく求めることにより、その確率分布によって擬似的に擬似的に入力画像と本物、偽物と区別がつかない画像ができる
これを反復することで、生成ネットワークは次第により本物らしいデータを生成するようになり、判別ネットワークは識別能力を高めていきます。理想的には、生成ネットワークは最終的には本物と見分けがつかないデータを生成するようになります。
GANは、美術、音楽、テキスト、映像生成など、多岐にわたるアプリケーションに利用されています。一方で、トレーニングが不安定であり、モデルの設定やハイパーパラメータのチューニングが難しいといった課題も指摘されています。
GANの課題
- モード崩壊
- トレーニングの不安定性
- 高品質サンプルの生成
モード崩壊は、生成ネットワークがデータセットの多様性を捉えられない、
つまり一部の特定のサンプルしか生成できなくなる現象を指します。
理想的には、ネットワークは入力データの全範囲を網羅することで、多様でリアリスティックなサンプルを生成できるべきです。
GANのトレーニングは、生成ネットワークと判別ネットワークのバランスを保ちながら進める必要があります。
もし一方のネットワークが他方よりも過度に優れてしまうと、学習プロセスは不安定になり、
品質の低い生成物やモード崩壊を引き起こす可能性があります。
高品質なサンプルを生成することは、特に高解像度の画像や複雑な構造を持つデータにおいては難しい課題とされています。
多くの応用事例では、極めてリアリスティックで詳細な生成物が要求されるため、この課題への対応が不可欠です。
こういった課題があるものの、GANにはパワフルな生成能力があるため、多くの分野で広く利用されているよね。
GANが使用されている応用例
- アートとデザイン: 新しいデザインやアートワークを生成。
- スタイル変換: 画像のスタイルを別の画像のスタイルに変換(スタイル転送)
- スーパーレゾリューション: 低解像度の画像を高解像度にアップサンプリング
- データ拡張: データセットを豊かにするための新しいサンプルを生成
- 仮想世界の生成: ビデオゲームやVR/ARの環境を生成
- アニメーションとCGI: 新しいキャラクターやシーンを生成するのに使用
- 音楽・曲の生成: 新しい音楽トラックやメロディを生成
これらの応用例では、GANがもたらす革命的なポテンシャルを示していますが、
前述したような課題もまた積極的な研究の対象となっています。
これには、安定したトレーニングメカニズムの開発、多様なサンプルの生成、計算効率の向上などが含まれます。
これらの課題を解決することにより、GANの持つ潜在的な能力がさらに拡大することが期待されています。
マーケティングコンテンツの生成、特に広告クリエイティブとの相性がいいよね!きっと技術が進歩していくにつれて、製品デザイン、建築デザイン、ファッションデザイン等のクリエイティブ領域で活用されるようになるよね。ビジネスの影響を見ていこう!
生成AIのビジネスへの影響
生成AI、特に画像生成AIは、ビジネス界に革命をもたらしています。
この技術の進化はクリエイティブなプロセスに新しい波をもたらしていますが、一方で著作権の問題やクリエーターの役割と価値に関する議論も生じています。
1つの例として、画像生成AIの破壊力は特に、ストックフォトサービス業界に大きな影響を及ぼしています。
ストックフォトサービス事業者は、AIによって生成された画像が広告業界に多大な影響を与えており、その破壊力にどう対応するべきか葛藤しています。
生成AIで広告画像を簡単に作ることができて、さらに広告のキャッチフレーズまで考えてくれるからね。これは広告業界には、ものすごいインパクトだよね。
事業者は新しい時代のニーズに適応し、AI技術と共存しながらビジネスを展開する新しい方法を模索する重要な局面に立たされています。
画像生成AIの技術は、他の産業や業務にも多くの影響を与え、ビジネスの多くの部分で生成AIが活用されることが予想されています。
これは単なる画像や文書の生成にとどまらず、業務の効率化、特に膨大な量のデータを高速に処理・分析する作業において、革命をもたらす可能性を秘めています。
例えば、ChatGPTによるテキスト生成AIサービスは、業務の効率化や事業の拡大を実現し、長文を箇条書きにまとめたり、校閲・改善を数分で行うなど、従来の方法では考えられなかった新しい作業のアプローチを提供しています。
しかし、これらのAI技術の急速な進展により、クリエーターの未来や著作権についての新しい対応策とルール作りが急がれています。
既存の創作物の価値を損なう可能性もあるため、テクノロジーと倫理性のバランスを適切に保つことが、持続可能で公平なビジネスエコシステムを築く鍵となるでしょう。
日本企業の業務内における生成AIの利用状況
大半の日本企業(特に大企業)では、セキュリティ観点から使用が認められていません。
サイバーセキュリティ関連のBlackBerry社により実施された調査のうち、日本に関する結果によれば、2023年10月時点で、日本企業の72%がChatGPTの利用を禁止あるいは、禁止を検討しているという調査結果があります。
株式会社インプレス PCWatch
日本企業がこのままでは、取り残されてしまうのではないかとソフトバンクの孫社長は、警鐘を鳴らしました。
逆に言えば、日本企業の28%が禁止はしていない(検討していない)ってことだよね?今後活用していく企業とそうでない企業では、追いつけなるぐらいの決定的な差が生まれてしまう可能性あるかも。。。
企業向けの新プラン「ChatGPT Enterprise」
企業のセキュリティやプライバシー保護に関する懸念に対応する形で、
OpenAIは、セキュリティとプライバシー保護に加え、制限なしの「GPT-4」アクセス、
Advanced Data Analysis(高度データ分析)機能など含めた新しいプランの、「ChatGPT Enterprise」を発表しました。
このスピード感で、企業向けのプランが作成されるのは、それだけの需要があるからです。
ChatGPTを社内で活用したいという需要は非常に高くなっており、リリースから9ヶ月でフォーチュン500 企業の80%以上に採用されるまでになった。
しかし、セキュリティ要件を満たさないため全面的に展開できないなどの問題を抱える企業が多かったのです。
そこでこの要望に応える形で、設定されたのが「ChatGPT Enterprise」プランです。
こちらのプランでは、顧客のプロンプト(プロントとは、ChatGPTが応答を生成するための命令文)と企業データは、
Open AIモデルの学習トレーニングに一切利用されないことが保証されています。またデータの暗号化やSSOなどにも対応しています。
全ての利用制限が撤廃され、パフォーマンも向上しています。
上記でご紹介したAdvanced Data Analysis(高度データ分析)機能も制限なく利用可能となっています。
市場データを分析する金融のリサーチャー、調査結果を分析するマーケティング担当者、
ETLスクリプトをデバックするデータサイエンティストが扱う大量のデータ情報量を、ものの数秒で分析できるようになります。
今後は、ChatGPTを導入するケースが増えてきそう。。。
現状業務に利用している企業では、どんなふうに導入されているのかな?
実世界での利用事例|日本の企業で既に実用しているケース
- サイバーエージェント
-
インターネット放送事業「ABEMA」やWeb広告事業の展開
ChatGPTによって「デジタル広告の運用にメスを入れる」としています。
広告オペレーションにかかっている総時間約23万時間(月間)のうち、30%にあたる約7万時間の削減を目指しているとのことです。
- GMOペパボ
-
インターネット関連サービスの「GMOペパボ」では、全社的にChatGPTをはじめとする生成系AIの活用を進めています。だけでなく、エンジニアだけではなく、経営者や広報担当者もChatGPTを活用して文書作成などを実施しているとのことです。
- インプレス
-
「PC Watch」などのWebメディア事業運営で知られる「インプレス」。
2023年5月から「PC Watch」内の一部記事に、ChatGPTを用いた要約機能を試験的に導入しています。同サイトの一部記事を読者が開くと「AIで記事を要約する(β)」というボタンが表示されます。
これをクリックする事で、すぐに10行程度の記事の要約文が表示される仕組みとなっています。
- 大和証券
-
大和証券は2023年4月にChatGPTを導入しました。全社員約9000人が、情報収集や資料作成などさまざまな業務で活用することにより作業を効率化させ、接客・企画立案などほかの業務に充てる時間を増やす狙いです。情報が社外に流出しないシステムを構築し、回答内容の正確性を社員が最終的に確認することで、個人情報の流出や正確性への懸念を解消するとしています。
ChatGPTのアウトプットをそのままで使うのではく、最終的に確認して必要に応じて修正を入れる作業をするといいね
ChatGPTは、プロンプトと呼ばれる命令文の書き方にテクニックが必要。あまり良くない命令文を書いても、期待している回答が帰ってこないよね。正しい知識、スキルを持って使うこと大事
生成AIの将来展望
生成AIがビジネスに与える将来的な影響と法規制の可能性
生成AI(ジェネレーティブAI)は今後のビジネスにおいて、多大な影響をもたらすとされています。
その進化のスピードは凄まじく様々なビジネスにおいても活用できる範囲が拡大しています
具体的には、その他にもたくさんありますが、例をあげると、以下の活用方法が挙げられます。
- 文章生成
- 画像生成
- 音楽生成
- ビジネスプロセスのオートメーション(自動化)
- UIデザインの自動生成
- 大量データの分析
- プログラミング
- アイデアのブレーンストーミング
- 壁打ち
将来的なビジネスにおける生成AIの利用は、コンテンツ生成のみならず、ビジネスプロセスの自動化や効率化、新しいサービスやプロダクトアイデアの創出など、イノベーションをもたらす要因となると見込まれています。
生成AIが作り出すコンテンツや解析結果は、企業のマーケティング活動やプロダクト開発、カスタマーサービスなど、多くの部門で活用される可能性があります。
一方で、より多くの企業などの組織に普及するには倫理的な課題や法規制に対する懸念もあります。
生成AIがもたらすデータやコンテンツの信頼性、プライバシー、セキュリティ、著作権、偽情報の拡散など、多くの課題が指摘されています。
特に、生成AIによって作成されたコンテンツが、真実でない情報や偽造コンテンツとなる場合、それが社会にどのような影響をもたらすのか、という問いは深刻なものがあります。
すでにいくつかのソースからは、生成AIの普及に伴い、それを適切にコントロールし、利用するためのガイドラインや法規制の必要性が議論されています。これは、生成AIが持つポテンシャルを最大限に引き出すとともに、様々なリスクを防ぐために不可欠です。
「ChatGPT Enterprise」プランの登場により業務利用を検討する
企業が増えていきそう。導入する際は、社員にプライバシーやセキュリティ事項を含む十分な説明を行い、理解を得て、正しい使い方のガイドラインでトレーニングを行うオンボーディング必要だね。
生成AIの進化がビジネスにもたらす可能性と今後の期待について
生成AIの進化はビジネスの多くの側面に画期的な変化をもたらしています。
このテクノロジーは、データを利用して新しい情報やコンテンツを生成する能力によって、企業が直面する様々な課題を解決する道を開いています。
特に、ChatGPTのようなテクノロジーはビジネス活用への期待が大きくなっており、多くのメディアでも取り上げられています。
生成AIには大きく分けて以下のようなビジネスへの利点があります。
- コンテンツ生成
-
ビジネス文書やマーケティング素材を高品質で生成する能力があります。
- 高度なデータ分析
-
大量のデータから有益なインサイトを抽出し、新しいビジネスチャンスを見つけ出すサポートを提供します。
一方で、今後の展望としては、多くの企業が生成AIの積極的な活用を進めていますが、その実装と利用にはまだ課題が残っています。
ガイドラインや法規制の整備が必要になっており, 今後はデータのマルチモーダル化や基盤モデルをさらに進化させる必要があります。
データのマルチモーダル化についての補足説明
データのマルチモーダル化とは、異なる種類や形式のデータを統合し、AIやマシンラーニングモデルが複数のデータソースから情報を取り込み、解釈し、学習できる形にすることを指します。
具体的には、テキスト、画像、音声など異なるモード(モダリティ)のデータを一つのモデルが処理し、
これら異なる種類のデータから有益な情報や知見を抽出・生成することができます。
マルチモーダルAIは、異なるタイプのデータを同時に理解し、これらのデータ間の複雑な関連性をキャプチャする能力を持っています。
これにより、より洗練され、正確でリッチな情報や知識を生成することが可能になり、
例えばビジネスにおいては、顧客体験の向上、意思決定のサポート、製品開発など様々な場面で有用になり得ます。
具体的には、生成AIがビジネスをどのように変えるかという点では、その応用事例が非常に多岐にわたります。
全社横断での取り組みや、特定業務における深掘りした活用事例が現れており、技術の進化によって多くの新しい可能性が開かれています。
将来的には、生成AIがさらに進化することで、企業はより複雑で大規模な問題に対しても、
AIが提案する解決策を活用し、新しいビジネスモデルを生み出すことが期待されます。
言い換えれば、生成AIはビジネスの未来を大きく左右するポテンシャルを持っていますが、
その利用と実装には適切な枠組みと理解が必要であり、企業はこの新しい波にどう対応していくかが今後の大きな課題となっています。
今後AIを受け入れて活用できる人、企業とそうでない人、企業で決定的な差が生まれていく可能性があります。
個人レベルでは、業務スピードが何倍も上がる事にもつながりますし、企業レベルでも経営スピードを格段に早め、利益率を高めることにつながるでしょう。
あり得るシナリオとして、数年後にはエクセルのように当たり前のビジネススキルになっているかもしれません。
「AIのせいで仕事が奪われるのでは?」と不安になる方も多いでしょう。AIによって奪われる仕事と新しく生まれる仕事についての考察記事があるので、良ければ合わせて読んでみてください。
活用できるか活用できない(しない)の差を感じるには、まずは使ってみて、正しい知識、スキルを身につけることじゃないかな。
まとめ
- 生成AIとは、生成AIは、テキスト・画像・音声などを生成できるAI技術の総称
- ChatGPTは、LLMと呼ばれる大規模言語モデル。生成AIの中の1つのモデルという位置付け
- GAN(生成敵対的ネットワーク)は、ディーラーニング利用される一種のアルゴリズム。「識別ネットワーク」と「生成ネットワーク」の二つのニューロネットワークから構成される。
- GANの課題:モード崩壊、トレーニングの不安定性、高品質サンプルの生成
- 生成AI進化によるビジネスへの影響:AI技術と共存しながらビジネスを展開する新しい方法を模索する重要な局面に立たされています。
- 生成AIがビジネスにもたらす今後の展望:積極的な活用が見込まれるが、導入には適切な枠組みと使う側の十分な理解が必要。
新しい技術はいつの時代でも教えてくれる人が少なく、環境も整っていません。
まずは、自分でいじってみることで、使い方を覚えていく方も多いと思います。
インターネットがなかった時代から、インターネットが生まれた時も、現在のAIに対するようなイメージを持っていました。今ではインターネットを使えない人は、ほとんどいないと思います。
2023年に生まれてくる子どもたち が社会人になる頃には、AIの知能が人間の知能の1万倍の知能を持っているでしょう。そういった未来がとても高い可能性でやってきます。
その未来に向かって、私たち自身ができることは、新しい技術に好奇心もって使えるものをどんどん使っていく事ではないでしょうか。
個人レベル持続的に知識やスキルをアップデートし、AIを使いこなすことで今後のAI時代を生き抜く事ができるようになるでしょう。
当ブログでは、初心者からでもAIを学べるようAIについての知識の集約、解説、ChatGPTのおすすめスキルなどを発信して行きます。
よかったら、是非、ブックマーク&フォローしてください。