Googleの新AI「Gemini」の特徴と生成AIサービスの選び方
2024年2月にGoogle社より「Gemini(ジェミニ)」という新サービスがリリースされました。
OpenAI社のChatGPTやMicrosoft社のCopilotに肩を並べる最新対話型生成AIサービスとして、生成AI業界の新たな進歩として注目されています。「Gemini」の特徴と仕組み、プランや使い方を踏まえながら、この3つのサービスはどう違い、どのように使い分けられるのか、AIについての知識を深めていきましょう。
新AI「Gemini」とは?
まず初めに「Gemini」はGoogle社の新しい対話型生成AIサービスです。「ChatGPT」や「Copilot」と同様に、対話形式でさまざまな質問や指令を入力すれば、学習したデータをもとに回答を生成して出力します。
Gemini、ChatGPT、Copilotは現在ではほとんど同じような様式で使えるようになりましたが、違う点もあります。
まず、仕組みの上で大きく違うところは、質問/回答という表面的な機能の背後にある「大規模言語モデル(LLM)」の性能です。 3種のサービスのどれもが、膨大なデータをもとに構築されたLLMの機能・性能を、チャット形式で利用できるようにしています。もとになるLLMにより、回答の速さや精度が違ってきます。
Geminiの仕組みと3種類のプラン
Geminiは当初から「マルチモーダル」な情報を扱うことをコンセプトにしています。マルチモーダルとは、テキスト、画像、音声、動画、プログラムのコードといった異なる形式のデータをすべて扱うことができることを指します。そのためGeminiでは、テキスト、画像、音声、動画を質問の中に利用することができます。生成するのは回答としてのテキストと画像です。これが当初から可能になっていたのがGeminiの特徴の一つです。
Geminiが最も注目されている点の一つに、Googleが公表しているベンチマークの結果が、多くの評価項目でChatGPTよりも優れた数字を出していたからです。これにより、ChatGPTを脅かす存在としてにわかにクローズアップされました。
現在のところ対話型生成AIサービスは次の3種類がラインナップされています。
- Gemini Advanced(有料):高度で複雑な利用に対応する最上位の対話型生成AIサービス
- Gemini(無料):一般的な用途で利用でき応答速度も高い標準的な対話型生成AIサービス
- Gemini Nano(無料):スマートフォン向けの軽量な対話型生成AIサービス
なお、Google Workspaceユーザーなら有料となりますがGeminiアドオンが使えます。
利用プランにアドオンすれば、Gmail、Googleドキュメント、Googleスライド、Googleスプレッドシート、Google MeetでAIアシスタント機能が利用できます。こちらはユーザー入力が学習に利用されないポリシーなので、機密情報の流出が避けられ企業ユースに好適です。
ChatGPTとCopilotの仕組みとプランは?
<ChatGPT>
ChatGPTにはいくつかのバージョンがあり、バージョンが上がるほど性能・精度がよくなっています。
昨年急速に普及したのはGPT-3.5を使用する無料版のChatGPTです。2023年2月にはGPT-4も使用できる有料版のChatGPT Plusがリリースされました。さらにGPT-4の拡張版であるGPT-4 Turboもリリースし、こちらもChatGPT Plusで使用できるようになりました。年内には最新バージョンとなる「GPT-5」を使用するサービスがリリースされる予定です。
現在のところ利用プランは次の通りです。
- ChatGPT無料版:生成AI普及を進めた画期的な対話型生成AIサービス
- ChatGPT Plus(有料):機能が拡張された対話型生成AIサービス
- ChatGPT Team(有料):チームでの利用に適したプラン
- ChatGPT Enterprise(有料):企業での利用に適したプラン
<Copilot>
3大対話型生成AIサービスのもう1つである「Copilot」はチャット形式で質問と回答の対話を、対話内容を引き継ぎながら重ねていける生成AIツールです。基本的に押さえておきたいのは、CopilotはLLMにGPT-4を使用し、マイクロソフト独自にカスタム化したサービスであるという点です。Geminiとはベースが違い、ChatGPTとは共通しています。
なお、Copilot for Microsoft365は、Microsoft365 E3/E5/F1/F3、Office365 E3/E5/F3、Microsoft365 Business Basic/Standard/Premium、教職員向けMicrosoft365 A5/A3、教職員向けOffice365 A5/A3のライセンスにアドオン利用が可能。
GeminiとCopilotはWebに検索機能を加えた形で提供されています。そのため、過去から最新のWeb情報までを回答に含めることができますし、WebのURLを質問中に記すこともできます。例えば「〈URL〉の内容を要約せよ」や「〈URL〉の内容を翻訳せよ」という旨の質問に回答できるのです。さらにWeb情報の出典URLも回答するため、正確性がより高くなります。
一方、ChatGPTにはWeb検索機能がありません。またGPT-3.5は2022年1月まで、GPT-4 / GPT-4 Turboは2023年4月までのデータを学習していますが、それより後の情報は回答に含むことができません。そのため常に最新情報が得られるGeminiやCopilotにはこの面でギャップがあります。
Geminiならではの特徴と使い方は?
Gemini、ChatGPT、Copilotはそれぞれ各種アプリやシステムとの連携することができます。また公開・構築されているプラグインによって機能を拡張することも可能です。実質的に「できること」はほぼ同等になってきています。またAI開発は積極的に進められていることから、今日は難しかったことが明日には簡単に実現できるようになるようなスピードで反映されているようです。
Geminiならではの特徴としては、Google Workspaceとの連携に優れている点が挙げられます。Copilot for Microsoft365がMicrosoft365の各種アプリとスムーズに連携できるように、Googleのプラットフォームとの連携が容易です。
例えば「表を作る」ことを指示すれば、Googleスプレッドシートにすぐに送信できます。生成した文章はGoogleドキュメントやGmailに簡単に送信できます。また位置情報へのアクセスを許可していれば、回答に現在地の情報を加味した情報を含めることができます。また目的地などのGoogleマップを回答に含めることも可能です。出張先のホテル検索や、関連動画の検索もチャットで可能になります。
したがって、会社業務でGoogle Workspaceをよく使う場合ならGeminiアドオンを導入するのが有利な選択になるでしょう。Microsoft365をよく使う場合ならCopilot for Microsoft365のほうが好適です。それ以外の業務利用が多い場合や、ChatGPTが有力な選択肢になります。
対話型生成AIサービスは、今後も技術発展が期待できる分野です。他のオフィスツールや基幹システムなどと併用することでさらに価値を増すことが予想され、新たな仕事が生まれるきっかけにもなります。自社業務の中でAIを導入できるプロセスはないかを検討し、積極的に導入していきましょう。