ローコードによるスピード開発で1日でデモアプリ提供可能!
大手企業の実績も豊富なBOLTにお任せ!
⇒BOLTの資料を見てみたい
Googleは2023年12月、マルチモーダルAI「Gemini」を発表しました。GPT-4と比較して様々な点で優れた結果を残しており、大きな注目を集めています。
Googleのもつアセットと連携することで、機能・性能ともに充実させているのが特徴です。
そんななか「具体的にGeminiでは、どんなことができるのか」「既に使っているが、ちゃんと使いこなせているのか」などの疑問を持っている方は多いと思います。
そこで今回はGeminiについて、具体的にできることを紹介します。また実際の業務への活用事例も紹介しますので、参考にしたうえで毎日の業務に落とし込んでみてください。
Geminiとは
GeminiとはGoogle社がリリースしたAIモデルです。Google Deepmind、Google Researchなど、社内のAI、機械学習に関する部署をはじめとする共同チームが開発しました。
一般的な読み方は「ジェミニ」ですが「ジェミナイ」ともいわれます。
Geminiは、AI性能の高さにより、一気に注目されました。Geminiのハイスペックモデル「Gemini Ultra」は、32個の指標のうち、30個でChatGPTのLLM「GPT-4」より優れた結果を残しています。
加えて、Google製品と連携できる点が便利です。例えば調べものをする際にはGoogle検索のアセットを利用します。
またアカウント情報と連携してGoogle Workspace(旧・G Suite)の情報の抽出・活用ができます。社内でGoogle Workspaceを導入している方には、特におすすめしたい対話型AIです。
Geminiを使ってできること
ここでは、具体的にGeminiを使って効率化できる業務を紹介します。
情報収集
ChatGPTも含めた対話型AIの基本的な使い方として、日々の情報調査タスクを効率化できます。
例えば「コールセンター業務における一次受付の時間を効率化する方法は?」と質問すると、以下のような返答があります。
特筆すべきは、文末に参考サイトを添付してくれることです。
AIが提示する情報は、必ずしも正しいとはいえません。場合によっては間違った情報を提供することもあります。これを「ハルシネーション」といいます。
そのため、必ず人間の目でレビューをする必要があるのですが、参考サイトを添付してくれることで、レビューの効率が高まるのが魅力です。
またGeminiの回答欄の最下部にある「Googleアイコン」をクリックすると、AIがGoogleの検索プラットフォームをクローリングし「Google検索の結果」と「Geminiの記述」がリンクしているか、または間違っているかを確認してくれます。
容易にファクトチェックできるのは、利用者として嬉しい機能です。
コード自動生成
またプログラミングコードの生成もGeminiの強みの一つです。コード生成能力を測る「Human Eval」の項目を見ると、ChatGPTのLLM・GPT-4と比較して、7.4%も能力値が高くなっています。
Gemini上にて自然言語で質問することで、必要なコードを生成してくれます。以下はPythonコードを生成した例です。
生成したコードには「Run Code」と「Edit Code」のボタンがあり、実行・編集できます。もちろんPython意外にも様々な言語に対応できます。
プログラマー・エンジニアはもちろん、PMやマーケターなどの非エンジニアが自身で一定のタスクを完結できるのが魅力です。
画像認識
またGeminiの有料版はマルチモーダルに対応しています。
マルチモーダルとは2つ以上のデータ形式を行き来してアウトプットを出せる機能を指します。対義語はシングルモーダルで、「テキストをテキストで返す」など1つのデータ形式でしかやり取りできません。
そのため「画像データをテキストデータで説明する」といった作業が可能です。例えば、以下の「ランダムに動物の名前を記載した画像」をアップロードして説明してもらいます。
「この画像を説明してください」と指示を出すと、以下のように回答をしてくれました。
このように余すことなく、テキスト情報を読み込んで教えてくれます。このように画像を認識して説明できます。
文章の要約
また長い文章を要約する際にも使えます。
AIは文字を「トークン」として処理したうえで、回答を生成しています。つまり最大トークン数により、対応可能な文字数が決まります。
Googleは2024年2月16日に「Gemini1.5」を発表。これにより、最大100万トークンを処理できるようになりました。
例えば太宰治著『走れメロス』は10,039文字もありますが、全文をそのままペーストして要約を依頼すると、以下のようにすぐに要約結果を表示してくれます。
このように、長文の資料を要約してもらえます。
また「YouTube動画をテキストで要約してもらう」「PDFを要約してもらう」という使い方も可能です。
例えば、以下のようにYouTubeのURLを貼り付けて指示を出すと、要約してくれます。
また、PDFファイルも同様にURLを貼り付けるか、ファイル添付したうえで指示を出すと、要約できます。
Geminiの活用事例8選
続いて、Geminiの機能を具体的に業務活用する方法を事例形式で紹介します。
日常的なアイディア出し・壁打ち
いちからアイディアを考える必要があるときに、人間がもつナレッジ・ノウハウ以上のパフォーマンスを出してくれます。
例えばあなたが「未経験ながら新規事業担当者に任命された」としましょう。この場合は何から考えていいか分からないと思いますが、Geminiに質問することでステップを可視化でき、タスクレベルまで分解してくれます。
またアイディアが既に備わっている場合は、壁打ち相手として会話しながらアイディアのクオリティを高めていけるのも魅力です。
コード生成・コードレビュー
コード生成やレビューの依頼ができます。例えば「FizzBuzz問題」について、Geminiに記載をお願いすると、以下の形で問題なく生成できます。
また自分で書いたコードのレビューを依頼することも可能です。例えば、FizzBuzz問題についてあえて間違えたコードを書き、レビュー依頼をしてみます。
すると、以下のようにきちんと間違いを指摘してくれます。
こうした使い方により、初心者のプログラマー、エンジニアでも短時間で高品質なコードを書けるようになります。
難解な資料の解読
建設・建築や医療、不動産など、法的制約を受けがちな業界は、たびたび行政資料を読み解く必要性があります。
しかし行政の資料は往々にして解読が難しく、把握するのに時間を要します。
そんなときは資料のPDFデータを共有する、またはスクリーンショットを共有してGeminiに解読を依頼しましょう。
このようにパッと見て把握しにくい資料も、テキストで分かりやすく整理してくれます。
チームへの情報共有
特にマネジャー以上の役職の方、また事業開発者、マーケター、エンジニアなどは日ごろから膨大な情報をキャッチアップして処理・共有する必要があります。
この情報のキャッチアップから、テキスト化はGeminiに依頼することで大幅に工数を削減できます。
例えば「社内の技術担当者がPythonについてのアップデート情報を社内メンバーに共有する場合」を考えてみます。以下のようにGeminiに質問すると、参考サイトとともに情報を共有してくれます。
また自身が過去にGoogle Workspace上で作成したドキュメントから似た情報を抽出することもできます。
Web上からの情報の抽出
Web上のURLを読み取って調査できます。
例えば競合調査をする際などに便利です。仮にあなたが広告業界で事業戦略をしているとしましょう。
その際に「競合である電通デジタルを調査し、資料化する」とします。その際には以下のようにURLを貼って質問するだけでリストアップできます。
これを資料化に当たって表形式に直すなど、便利な使い方もできます。
コンテンツ・クリエイティブを考える
またブランディングをはじめとしたマーケティング施策を実行するにあたって、コンテンツやクリエイティブを考える際にも活用できます。
例えば、コンテンツ制作にあたって、上流の戦略を考える際には「顧客のニーズ」と「競合」を視野に入れることが多いです。
あなたがプチプラ化粧品のマーケティングを考えるとします。以下のように質問をすることで顧客ニーズ・インサイトのヒントを得られます。
またここからコンテンツ案を出してもらうことも可能です。
さらにコンテンツのクリエイティブを作成してもらうこともできます。
外出時の最適なルート・交通費を計算できる
また、営業担当者など、外出が多い方にとって役立つ機能もあります。Googleのアセットである「Google maps」を用いて、移動時間や交通費を瞬時に計算してくれる機能です。
例えば弊社・ファンリピートの住所から東京タワーに電車で移動するとしましょう。すると以下の結果を出してくれます。
ちなみにタクシーを使った場合の結果も出してくれます。
メールチェック
企業がGoogle Workspaceを導入しているか、Gmailを普段使っている場合は、Gemini上でメールチェックができます。
「昨日から今日にかけて受信したメールを一覧で教えてください」といったプロンプトを投げることで、Geminiがメールボックスをクロールして回答してくれます。
また特定のキーワードで探してくれるのも便利です。例えば月末などに「請求書にまつわるメールを一覧で教えて」と指示すると、利用者の代わりに該当のメールを見つけてくれます。
メールへのリンクURLが貼られているので、シームレスに確認できるのも魅力です。
Geminiを使う際の注意点
最後にGeminiを利用するにあたっての、潜在的なリスクや注意すべきポイントを紹介します。
事実とは異なる情報を出力することがある
Geminiだけでなく、対話型AI全体に共通する重要な注意点は、「事実と異なる情報を出力する可能性が存在する」という点です。これは専門用語で「ハルシネーション」といいます。
Geminiを利用する際は、人の目での最終確認を欠かさず行いましょう。さらに、プロンプトの精緻化を通じて、ハルシネーションのリスクを軽減できます。座学・実践でプロンプトのスキルを培うことも、対応策の一つです。
機密・秘密情報のアップロードに気を付ける
Geminiはユーザーが提供する情報を学習材料として使用します。このため、企業や関係者の機密や秘密情報のアップロードは控えるべきです。
一般的な例として、SQLの記述が得意でないマーケターが顧客データの抽出や分析を依頼する目的でCSVファイルをアップロードするケースが挙げられます。
また顧客やパートナーの情報が記載された契約書の文面を流し込んで校正してもらう、というケースも多くの場合は違反にあたります。
社内で対話型AIを導入する際には、マニュアルの整備・啓蒙を同時に進めましょう。
画像生成機能は一部停止中(2024年3月23日現在)
2024年3月現在、Gemini Advancedの画像生成が一時停止となりました。
これはGeminiが人物画を描く際に、性別・人種に箇条に適応しすぎて、ユーザーの要望とミスマッチしてしまったからです。
「Googleのコンプライアンスに対する意識」や「トレーニングデータの偏り」が原因とみられています。Googleは今後のアップデートで、画像生成を戻すことを公言しています。
まとめ
今回はGoogle社がリリースしたGeminiの具体的な使い方についてご紹介しました。単なる情報調査だけではなく、Googleのアセットを利用しながらシームレスに使えるのが魅力です。
コードを書く、情報調査をする、戦略を考えるなど、時間のかかるタスクを短時間で解決してくれるため、忙しいビジネスマンの強い味方になります。
一部機能は制限されますが無料版でも使えますので、気になった方はぜひ導入しつつ、普段の業務に活用してみてください。