本記事では、Geminiについて解説しました。
Geminiには無料プランと有料プランがあります。
本記事では、主に無料プランについて紹介します。
Geminiとは
Geminiは、Googleが開発した最新の大規模な言語モデルAIです。
https://blog.google/technology/ai/google-gemini-ai/#performance
2023年3月に最初のバージョンが公開され、最新版のGemini 1.5 Proは2024年5月にリリースされました。
Geminiの特徴は、単なる自然言語処理だけでなく、マルチモーダル機能を備えている点にあります。
つまり、テキストだけでなく画像や音声入力にも対応できるのが大きな強みです。
さらに最新のGemini 1.5モデルでは、モバイル端末でもオンデバイスで処理が可能になるなど、高速で軽量な点も評価されています。
Geminiの開発コードネームは当初「Bard」と呼ばれていましたが、2023年5月のGoogle I/Oイベントで正式に「Gemini」と命名されました。
このモデル名は「双子座」を意味するラテン語に由来しており、言語とビジョンの2つの機能を併せ持つことから名づけられました。
Geminiの特徴
- マルチモーダル
- 高度な自然言語理解
- 開発者フレンドリーな環境
特徴1: マルチモーダル
Geminiはテキスト、コード、画像、音声など、様々な形式の情報を理解し、処理することができます。
特徴2: 高度な自然言語理解
Geminiは、複雑な質問に対する高い理解力を持ち、文脈を考慮した自然な対話が可能です。テキスト生成、翻訳、要約、感情分析など、幅広いNLPタスクに優れています。
特徴3: 開発者フレンドリーな環境
APIや開発ツールが豊富に提供されており、開発者は容易にGeminiの機能を自身のアプリケーションに統合できます
充実したドキュメントとサポートにより、迅速な開発が可能です。
Geminiのデメリット
Geminiは、画像生成できますが、英語で指示しないといけないのがデメリット。
というのも、画像生成AIの Imagen2 が 日本語に対応していないからですね。
Geminiには無料と有料がある
Geminiは無料で使えます。
有料プランに入ると、AIの性能がアップしたり、機能がアドオンします。
有料プランとは、Gemini Advancedと呼ばれるサブスクリプションのことで、月額2,900円。
無料と有料との違いを簡単にまとめると以下のとおり。
無料 | 有料(Gemini Advanced) | |
---|---|---|
言語モデル | Gemini Pro | Gemini 1.5 pro Gemini Ultra |
文章作成 | ◯ | ◯ |
ファイルのアップロード | ◯ | ◯ |
画像の読み込み | ◯ | ◯ |
画像生成 | ◯ (英語のみ) | ◯(英語のみ) |
Webブラウジング | ◯ | ◯ |
ダブルチェック (回答の再確認) | ◯ | ◯ |
特典 | – | ・100万トークン ・Googleサービスとの連携 (Gmail、Googleドライブ、 YouTubeとの連携) |
料金 | 無料 | 月に2900円 (最初の2か月無料) |
有料プランでは、Gemini 1.5 Proモデルの高度な機能を利用できます。
100万トークンのコンテキストウィンドウを持ち、35以上の言語で自然な対話やタスク処理が可能です。
Gemini(無料版)の使い方:実用編
使い方1: 文章のやりとり
Geminiは、Google社の公式ウェブサイトから無料で利用することができます。
「ログイン」をクリックします。
以下の画面がでるので、お持ちのGoogleアカウントを選択してログインします。
ログインできると、以下のようなが画面になります。
赤枠のコマンド入力欄にコマンド(質問したいこと)を入力してEnterキーを押します。
すると、以下のように回答が返ってきます。
Geminiは他の回答案を3つ作ってくれています。
他の2つの回答案を見るには、右上の「回答案を表示」をクリックします。
すると、以下のように3つの回答案のボタンが表示されます。
残りの2つの回答案を見たいときは、そのボタンを押すと、回答が表示されます。
たとえば回答案2をクリックしたときは以下の感じに。
もし回答を読み上げてもらいたいときは、右上の「音量アイコン」をクリックすればOK。
使い方2:画像生成
Geminiの場合、画像生成AIを利用するには英語で指示する必要があります。
具体的には「create an image of 〜」と指示します。
「create an image of cat」としたら、以下のような画像を作ってくれました。
なお、「Please draw 〜」の指示でもOKです。
「Please draw cat」としたら、以下のような画像を作ってくれました。
使い方3:ファイルのアップロード
コマンド入力欄の右端にあるアイコンをクリックします。
その後、アップロードしたファイルを選ぶと、アップロードされます。
コマンド入力欄に指示を送ります。
たとえば、STEP1で猫の画像をアップロードして、STEP2で「これはなんの画像ですか?」と質問すると以下のように回答してくれました。
使い方4:音声のやりとり
コマンド入力欄の右端にある音声アイコンをクリックします。
すると、音声アイコンが点滅し、音声モードになります。
Geminiに向かって話しかけてください。
たとえば、「日本の首都はどこ?」と話すと、以下のようにテキストに変換してくれます。
質問をうまく聞き取ってくれたら、Enterキーを押すか、送信ボタンをクリックします。
すると以下のように回答してくれます。
もし回答を読み上げてもらいたいときは、右上の「音量アイコン」をクリックすればOK。
使い方5:回答の再確認(ダブルチェック)
Geminiに回答してもらった後、Googleのボタンを押します。
すると、以下のようにハイライトしてくれます。
ハイライトの意味は以下のとおり。
- 緑のハイライト:
-
Google検索で、この記述に類似したコンテンツが見つかった。
- オレンジのハイライト:
-
Google検索で、この記述と異なる可能性のあるコンテンツが見つかった。
- ハイライトされていないテキスト:
-
これらの記述を評価するための十分な情報がない
ダブルチェックした後は、たとえば、緑のハイライトの文の最後にある「v」のマークをクリックすると、類似したコンテンツを具体的に表示してくれます。
使い方6:@メンション機能
コマンド入力欄に「@」マークを入力することで、Googleサービスと接続して、検索することができます。
コマンド入力欄に「@」を入力します。
すると、Googleサービスの一覧が表示されるので、使いたいサービスを選択します。
例えばGoogleマップを選ぶと、以下のように表示に変わります。
通常のやりとりと同様に、質問を投げてみましょう。
たとえば、「広島から東京での行き方は?」と質問してみます。
すると、以下のようにGoogleマップを使って回答してくれます。
使い方7:回答を書き換える
Geminiの回答を書き換えるように指示できます。
たとえば「日本の首都は?」に対して以下を回答されたとします。
回答の下にある「回答を書き換える」アイコンをクリックしてみましょう。
すると以下のようなメニューが表示されます。
- 短くする
- 長くする
- シンプルにする
- カジュアルな表現にする
- 専門的な表現にする
上記のメニューのなかから希望の書き換え内容をクリックします。
たとえば、「カジュアルな表現にする」を選ぶと、以下のような回答に変わります。
使い方8:エクスポート
Geminiからの回答をGoogleドキュメントやGmailにエクスポート(出力)できます。
たとえば、「日本の首都は?」に対して以下を回答されたとします。
回答の下にある「共有」アイコンをクリックし、「Googleドキュメントにエクスポート」をクリックします。
すると、以下のようにGoogleドキュメントにGeminiの回答をエクスポートしてくれます。
同様に、「Gmailにエクスポート」をクリックすると、
以下のようにGmailにGeminiの回答をエクスポートしてくれます。
Gemini(無料版)の使い方:設定編
設定1: 履歴の管理
左メニューから「アクティビティ」をクリックします。
すると、過去のやりとの履歴を確認できます。
履歴をまとめて削除するときは、以下の箇所で行えます。
設定2: UIのカラー
左メニューから「設定」をクリックします。
ダークモードをオンにすると、
以下のように、背景が暗くなります。
設定3: 拡張機能
左メニューから「設定」>「拡張機能」をクリックします。
Gemininiの拡張機能のオンオフを設定できます。
Googleマップの利用
上述した設定画面でGoogleマップをオンにすると、たとえば、以下のような質問をすると、Googleマップを活用できます。
質問:広島から東京まで、電車や新幹線を使った場合の移動時間を教えて下さい
Googleフライトの利用
上述した設定画面でGoogleフライトをオンにすると、たとえば、以下のような質問をすると、Googleフライトを活用できます。
質問:質問:広島から東京まで、飛行機を使った場合の移動時間を教えて下さい
Googleホテルの利用
上述した設定画面でGoogleホテルをオンにすると、たとえば、以下のような質問をすると、Googleホテルを活用できます。
質問:広島市に家族4人で旅行したい。広島市近郊でおすすめの高級ホテルを教えて下さい
YouTubeの利用
上述した設定画面でYouTubeをオンにすると、たとえば、以下のような質問をすると、Youtubeを活用できます。
質問:Geminiについて説明したYouTube動画のおすすめを教えて下さい
Google Workspaceの利用
上述した設定画面でGoogle WorkSpaceをオンにすると、たとえば、以下のような質問をすると、お使いのGmailを活用できます。
質問:WordPressからのメールで、プラグインの更新連絡あった?
Gemini(無料版)の使い方:アプリ
スマホでアプリの使い方を紹介します。
アプリを起動し、最上部の「Search」をタップします。
すると、最上部の表示が「Gemini」に変わります。
赤枠あたりをタップして、コマンドを入力します。このあたりの使い方はPCと同じです。
音声入力するときは「マイク」のアイコンをタップ、画像をとりこむときは「カメラ」のアイコンをタップします。
参考
カメラのアイコンをタップして、私が使っているマウスを撮影し、「これは何?」とコマンドを入力すると、製品名まで答えてくれました。
う〜ん、こりゃすごい!!
まとめ:Geminiは無料版でも十分使える!
Gemini(無料版)の特徴や使い方を紹介しました。
Geminiは、無料版でも十分使えます!
Geminiを使い倒して、業務の効率化に活用してみてください。
有料版
Geminiの有料版に加入すると、処理能力が向上します。
興味ある方は以下の記事をご覧ください。