Google が開発した画期的なAI言語モデル「Bard」をご存知でしょうか?
Bardは、他の生成AIに比べて無料で多くの機能が使え、Googleの多様なアプリとの連携が便利なため、文章生成、翻訳、質問応答など様々なタスクをこなせるAIとして、多くの人々に利用されてきました。
しかし、2024年2月、Bardは新たな名前「Gemini」へと生まれ変わり、さらに進化を遂げたのです!
ChatGPTがこれまで、AIに基づく文章生成やデータ分析の分野で支配的な存在であったことは周知の事実です。
しかし、Gemini Advancedの登場により、この分野のパワーバランスが変わりつつあります。
この記事では、「Gemini」へと生まれ変わり、さらに有料プランがリリースされたので、
以下のような点にフォーカスして、比較解説をしていきます。
- Geminiに変わって何が新しいことがある?
- Geminiの有料版と無料版で何が違うの?
- 有料版は、ChatGPTと比べてどうなの?
Google BardからGeminiへのリブランドされたことで最新情報に興味がある方、有料版について詳しく知りたい方、ChatGPTと比較してどうなのかに興味がある方、乗り換えすべきなのか検討中の方におすすめの記事です。
ブランド名変更、新しいプランの解説、最新バージョンのGemini1.5の発表について解説し、
有料プランと無料プラン、ChatGPTとの比較をしていきます。
Goolge Bardから「Gemini」へ変更 ユーザー数が1億人突破
ブランド名変更 今後は、「Gemini」へ
2024年2月8日にGoogleが同社の生成AIの「Bard」を「Gemini」(ジェミニ)と改名しました。英語では、(ジェミナイ)と発音されていますが、日本語では、ジェミニと呼ばれています。
Microsoftが今までの「Bing AI」を「Copilot」にリブランドし統一化したのに対抗したのかも知れません。
これからは、「 Duet AI for Google workspce」も含めて「Gemini for Google Workspace」に変更され統一化されていくとのことです。
注目は、今回りリースされた有料版の「Gemini Advanced」で使える最上級モデルの「Ultra」。
これまでは、2023年に発表はされていたもの実際には、利用することができませんでした。
2023年のGoogleによる発表時には、ChatGPTのGPT-4を上回る性能を持ち、より高度なタスクが可能とされ、ChatGPTに対抗できるのではと、期待されてきました。
発表後も今までは、利用することができませんでした。それが今回リリースされたので話題となっています。
有料プランは、今まで無料版で使えた「Gemini Proモデル」より上級モデルの「Ultra 1.0」が利用できるプランとなります。
有料プランがリリースされましたが、今後も無料版は今まで通り利用可能です。
ポイントは、有料版に課金するほど無料版との違いがあるかどうかになりますね。
リブランドされ、有料プランリリース後Google One加入者が1億人を突破
2024年2月9日にGoogleのスンダー・ピチャイCEOは、サブスク型クラウドストレージサービス「Google One」の加入者数が1億人を突破したとX(旧Twitter)で発表しました。
これは、Google Advanced の有料プランを利用するには、Google Oneの新しいプランである「AI プレミアムプラン」に加入が必要となるためです。
もともとのGoogle Oneの加入者数がすでに1億人突破真近だったみたいだけど、AI premium plan発表によって押し上げられて突破したみたいだね。
Gemini 1.5 最新発表!
2024年2月15日に同社スンダー・ピチャイCEOは、2023年12月に発表されたばかりのGeminiの最新バージョンとなる「Gemini 1.5」を発表しました。
大言語モデル | インプットトークン数 |
---|---|
Gemini 1.5 Pro | 1,000,000トークン(英文約2500ページ, 1時間の動画, 11時間の音声, 30,000行のプログラムコード)開発者向け/ 128,000トークン英文約300ページ)一般向け標準 |
Gemini 1.0 Pro | 32,000トークン(英文約75ページ) |
GPT-4 Turbo | 128,000トークン(英文約300ページ) |
Calude 2.1 | 200,000トークン(英文約500ページ) |
今回の発表されたのは、中級モデルのGemini Proのアップデートバージョンとなる「Gemini Pro 1.5」です。
これまでの最上級モデル「Ultra 1.0」のアップデートはなく、まずは中級モデルのアップデートとなるとのことです。
今回のアップデートで、Gemini Pro 1.5は、最上級モデルの「Ultra 1.0」と同等の幅広いタスクを実行できるパフォーマンスレベルになっているそうです。
なんといっても驚異的な最大100万というインプットトークン数が発表され話題になっています。
しかし、注意しないといけない点があります。この最大100万のトークン数は、AI StudioとVetex AIを通じてのみ、一部の開発者向けに提供されるとしています。
一般向けには、標準の128,000トークンとなるとのことです。(GTP-4 Turboと同等)
現時点では、無料版では、Gemini Pro1.0となっていますが、もし無料版でGemini Pro 1.5が使えるようになると無料版で利用できる生成AIでは、一つ飛び抜けることになりますね!
When tested on a comprehensive panel of text, code, image, audio and video evaluations, 1.5 Pro outperforms 1.0 Pro on 87% of the benchmarks used for developing our large language models (LLMs). And when compared to 1.0 Ultra on the same benchmarks, it performs at a broadly similar level.
<日本語訳>テキスト、コード、画像、音声、動画を含む総合的な評価パネルでテストしたところ、1.5 Proは、大規模言語モデル(LLM)の開発に使用されるベンチマークの87%で1.0 Proを上回りました。また、同じベンチマークで1.0 Ultraと比較しても、ほぼ同等の性能を発揮しています。
https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#performance
OpenAIのChatGPTのアップデートされるスピードにも驚いていましたが、Googleのアップデートの速さも驚異的です。
今後Ultra1.0についてもバージョンアップされていくことが期待されるでしょう。
開発者向けといは言えども、まさかの100万トークン。1時間相当の動画、3万行のプログラミングコードを入力できるのは、凄すぎる!
最上級モデル「Ultra」有料版で登場 有料版「Gemini Advanced」
最上級モデル「Gemini Ultra 1.0」がリリース
「Ultra 1.0」は、GoogleのGeminiシリーズの中で、最上級のマルチモーダル大言語モデル(MLLM)です。
最も能力の高いモデルで、非常に複雑なタスク用に設計されています。
Googleが行ったUltraとGPT-4の性能比較の結果は、全32項目中、30項目で上回っていたとのことです。
- より自然で流暢な会話が可能
- よりクリエイティブな文章作成
- 情報検索の情報ソースをさらに提示してくれる
- 画像生成
- 画像認識
- 音声認識
今後導入されていく予定の機能(Gemini for Google Workspace)
- GmailやGoogleドキュメント内での文章作成&校正
- Googleスライドの画像生成&挿入
- Googleスプレッドシートのテキスト生成
- Google Meetの背景画像の生成
- 企業向け「Google Cloud」も、今後「Gemini for Google Cloud」へと変わっていきます。
有料版「 Gemini Advanced」を使うには
Googleのサブスクリプションサービス「 Google One」の新しくできたプラン、「AIプレミアムプラン」に加入する必要があります。
月額2,900円の有料プランですが、2024年2月時点では、2ヶ月間のフリートライアルがあります。
Gemini Advanced の使い方
使い方
ウェブサイト上で利用
Gemini 公式ウェブサイトにアクセス
モバイルアプリで利用
2024年2月中旬時点では、Android版のみ専用モバイルアプリ「 Gemini」がリリースされています。
iOS版は、まだありませんが今後対応されることが期待されます。
「 Ultra」モデルの回答が最適化されているのは英語回答のみ(2024年2月時点)
2024年2月中旬時点では、Gemini Advanced ( Ultra1.0)は、日本語設定でも利用できますが、「Gemini Advancedは、英語の回答に対してのみ最適化されていますが、対応している限り他の言語でも回答できます。」と表示されます。
現時点では、このように表示されますが今後日本語での回答も最適化されていくことが期待されます。
有料版Gemini Advancedと無料版Geminiと何が違う?
Google One Premium AIのプランに含まれる内容
上記の通り、Gemini Advanced (Ultra1.0)を利用するには、Google Oneの「AIプレミアムプラン」への加入が必要です。
ChatGPTの有料プランと異なる点は、有料プランがGoogle Oneのプランの中に組み込まれているため、Ultra1.0の利用だけでなく、その他の有料サービスが付随している点です。
- 2TBのクラウド保存容量
- Gemini Advanced ( 最新の最上級モデルUltra)
- GmailやGoogleドキュメントなどのGemini(Gemini for Google Workspace)
従来のプレミアムプランに含まれるその他全ての特典
- Googleカレンダー高度なスケジュール機能
- VPN保護
- Google Photoで追加の編集機能(消しゴムマジック、HDR等)
- プレミアムのビデオ通話機能:Google One プレミアム プランのメンバーは、Google Workspace プレミアムの高度なビデオ会議機能を利用できます。(最長24時間のグループビデオ通話可能)
- 最大5人でGoogle Oneのストレージを共有
- ダークウェブのモニタリング:自身の情報がダークウェブ上にあるかどうかを確認して、自身を保護するために対処することが可能。ダークウェブとは、通常の検索エンジンでは検索できない、匿名性の高いネットワーク上に存在するウェブサイト
Gemini Pro とUltraモデルの違い
文章生成
Gemini ProとGemini Advancedで記事作成の以下のようなプロンプトをして比較してみました。
前提条件:プロンプトは1度のみ。詳細条件を記載しないシンプルなプロンプト。回答3つのうち1番目の回答を比較
プロンプト:ブログの書き方についての記事を書いてください。記事構成は、SEOに強いキーワードを用いて、小見出しを使って、階層状に作成してください。
Gemini Proの回答
箇条書きでまとめてくれている点は、Geminiらしい回答です。
しかし、小見出しをつけるよう指定しているのにその指示内容が反映されていません。
文章に関しても、導入部分でプロンプトの指示内容が、記事内容にすり替えられています。
「この記事では、SEOに強いキーワードを用いた小見出しを使って、階層状にブログ記事の書き方を説明します。」
これは、回答内容としては、あまりよくありません。
Gemini Advancedの回答を見てみましょう。
プロンプトの指示の一つである記事構成を階層にするという点が守られています。
文章の内容も、「ブログの書き方」という記事を作成したいというユーザーの意図を反映し、「SEOに強く、読者を惹きつけるブログ記事の書き方」という記事を作成してくれている点が評価ポイントです。
ひとつのプロンプトのみの比較なので結論づけは難しいのですが、使用感としては、Advancedの方がプロンプトの指示内容をより的確に反映して、文章もより自然になっています。
画像生成
Gemini ProとGemini Advancedで京都の街並みを背景とした着物を着た女性の画像を作成してみます。
注意点として、画像生成については、2024年2月時点では、英語のプロンプトでのみ対応しています。
プロンプト:Create an image depicting a scene in the early morning of spring in Kyoto, where cherry blossoms are in full bloom along the Kamo River. A woman in her 20s, dressed in a casual Komon kimono, is taking a stroll. She is holding a Japanese umbrella, and the background features traditional townhouses and a cobblestone path. The image should be bright, with warm tones, conveying a welcoming feeling to those who visit
<日本語訳>
京都の春の早朝、桜が咲き乱れる鴨川のほとりを、カジュアルな小紋着物を着た20代の女性が散策している様子を描いた画像を作成してください。女性は和傘を手に持ち、背景には伝統的な町家と石畳の道が映っています。画像は明るく、温かみのある色合いで、訪れる人々への招待の気持ちを感じさせるものにしてください。
Gemini Pro
2枚目と4枚目には、和傘が含まれていない点と4枚目には石田だたみが含まれていません。
Gemini Advanced
Gemini Advancedでは、プロンプトの指示内容をより反映しているように見受けられます。
和傘がない写真が1枚ありますが、石畳は全ての写真に反映されています。1枚目の写真は太陽の映り込みが、早朝の感じが描かれています。
Geminiの画像生成は、「imagen2」というモデルにより画像生成されています。
自然言語処理という点(指示内容を反映する)においては、Gemini Advancedに利点がありましたが、同じ画像生成エンジンであるので、Gemini ProとGemini Advancedで大きく画像のクオリティ自体が変わることはありませんでした。
無料版のGemini Proでも、画像生成できるので、とりあえず画像生成使ってみたいという方は、無料版で良いでしょう。
Gemini AdvancedとChatGPT GPT-4は、どっちが良い?
Google Gemini Advancedの強み
Google Workspaceとの連携
GmaiやGoogleドキュメント、スプレッドシートへ直接連携できることが一番の強みであり主な使い方になります。
その使い方に関しては、以下の記事で詳細に解説しているので是非参考にしてみてください。
テキスト生成のスピード
Geminiのテキスト生成スピードに慣れてしまうとChatGPTGPT-4のスピードがとても遅く感じてしまいます。
Google Oneの有料プレミアムプランの内容が付随している
従来のプレミアムプランのサービスやその他特典が丸ごとついている点です。
クラウドの容量が2TBが付く点についても、写真やドキュメントの保存で容量に困っている方には、お得に感じると思います。
ChatGPT GPT-4の強み
回答の精度
回答の精度やテキスト生成に関しては、GPT-4 Turboが依然として高い印象です。
画像生成
ChatGPTのDALL-E3で作成された画像の方が高度で美しい画像を生成することができます。
現在の印象としては、Gemini→ChatGPT→MidJourneyの順番です。
カスタマイズ性
ChatGPTの有料版では、自身でGPTモデルをカスタマイズさせることや、サードパーティが作成したカスタマイズGPTを利用することができます。
目的に合わせてチューニングされたGPTを利用することでより効率的に作業を進めることができます。
動画生成が対応予定
2024年2月16日に動画生成について、今後対応させるための開発を進めていることが発表されました。この機能については、生成AI業界で初の機能になるので、高い期待が寄せられています。
結局どちらがおすすめ?
2024年2月時点において、テキスト生成と画像生成という2点と各有料プランでできることを比較して、Gemini AdvancedのUltra1.0よりも、ChatGPTの有料版を選択するでしょう。
理由としては、GPT-4 Turboのより精度の高いアウトプットと、ChatGPTのカスタムGPTがとても便利な機能になっていること。ChatGPTが現時点で、業界トップを駆け抜けるアップデートをしている点に期待ができる点です。
Googleの生成AIがリリースされた当初に比べると、飛躍的な進化を遂げておりChatGPTのGPT-4 Turboに比べても大きな違いがある訳ではないレベルになっています。
各個人の使い方によっては、Google Workspaceとの連携が便利なのでGoogle Advancedの方が良いとなるケースもあると思います。
2024年2月時点では、Gemini Advancedが使える2ヶ月のフリートライアルがありますので、2ヶ月間、使い倒してみると良いでしょう。
今後への期待について
今後Gemini 1.5 Proが、 AI StudioとVetex AIを通じてのみではなく、Geminiの無料版で使えるようになると、無料版での性能が他の生成AIに比べてもかなり良いものになると期待されます。
一方で、Gemini Pro1.5が導入されたら、期待されるのはやはりGemini Ultra 1.5バージョンになるでしょう。
今回は、発表時の内容からGemini Ultraが最上級モデルとしてどれくらいすごいのか期待があまり高かった分、そこまで目に見えるほどChatGPT GPT-4 Turboに比べて「よし、Google Advancedに切り替えよう!」決断できるほど良さを感じるほどではありませんでした。
しかし逆に言えば、当初リリースされたばかりのおもちゃのようであったGoogle Bardに比べると、ChatGPTの最新モデルと比較できるぐらいのレベルまで進化しているとも言えます。
今後は、ChatGPTもアップデートを繰り返していくと思われますが、Googleの最新モデルもライバルとして、どのような独自性を持っていくのか期待が膨らみます。
ユーザーとして、自身の利用シーンに合わせてそれぞれの生成AIを使いこなして、自分の使い方に合ったものを最大限利用していくことが重要でしょう。
当ブログでは、初心者からでもAIを学べるようAIについての知識の集約、解説、ChatGPTのおすすめスキルなどを発信して行きます。
よかったら、是非、ブックマーク&フォローしてください。