Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

他の写真を見る

Googleは5月14日~15日(現地時間)、年次開発者会議イベント Google I/Oを開催しました。スマートフォンのPixel 8aはイベント直前に発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーに身近に感じられそうなのが、有料サービス Gemini Advancedに加わった多数のアップデートでしょう。

画像生成AI「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第2回)を5月22日開催。参加者募集します

Google One AI Premium加入者が利用できるGemini Advancedについて、高性能な Gemini 1.5 Proの解禁など、新機能を発表しています。

Gemini 1.5 Proが利用可能に

まず大きなところでは、最新のAIモデル「Gemini 1.5 Pro」が、日本語を含む35以上の言語・150か国以上において、Gemini Advancedで利用可能となります。

Gemini 1.5 Pro自体は2月に発表されており、開発者が試用できるよう、Google AI StudioやAPI経由で提供されていました。今後は、Gemini Advancedのユーザーであれば、だれでもGemini 1.5 Proを利用できます。

Gemini 1.5 Proは、一般ユーザー向けの会話型AIでは最長となる100万トークン以上に拡張されたコンテキストウインドウに対応。最大1500ページのドキュメントを理解したり、100件の電子メールを要約したりといったことが可能になります。

間もなく1時間の動画コンテンツの理解や、3万行を超えるコードベースの処理にも対応するとのことです。

コンテキストウインドウの拡大に伴い、Googleドライブ経由、またはデバイスから直接ファイルをアップロード可能になります。複数の文章の比較や、まとめて要約なども行えるとのこと。

なお、アップロードされたファイルは非公開で、データがモデルのトレーニングに利用されることはないとしています。

Gemini 1.5 Proでは画像理解も大きく進化しており、たとえば料理を撮影してレシピを調べたり、数学の問題を撮影して解き方を段階的に説明といったこともできるようになります。

Geminiと自然に会話ができるGemini Live

Gemini Advanced向けには、Geminiと自然に会話が行えるライブチャットGemini Liveが今後数か月以内にリリースされます。

モバイル向けの機能で、Gemini Liveを利用することで、Geminiに音声で話しかけ、自然な音声で応答できるようになるとのこと。

たとえば、面接の前にGemini Liveとリハーサルを行うことができ、Geminiは面接担当者にアピールできるスキルまで提案します。

今年後半にはライブチャットでカメラもサポートされ、周囲のものについても訊ねることができるようになる予定。

ただ、Gemini Liveを利用できるのは、当面は英語のみとなるようです。

なお、これに近い内容は、Chat-4oですでに利用可能。こちらは日本語にも対応します。

いまのところChatGPT Plusの購読者向けですが、今後数週間以内に無料ユーザーにも提供される予定です。

カスタマイズバージョンを作成できるGem

Google One AI Premium Planでは、間もなくGeminiのカスタマイズバージョンであるGemを作成できるようになります。

たとえば、「ランニング コーチとして、毎日のランニング計画を提案して。ポジティブで、明るく、やる気に満ちた感じで」のように指示することで、Geminiはワンクリックで内容を強化して、特定のニーズを満たすGemを作成します。

ようするに、Geminiに果たして欲しい役割(編集者やトレーニングコーチ、料理人など)をあらかじめ設定しておくことが可能になるわけです。

拡張機能も強化

ほかにも、拡張機能が強化され、旅行計画などより複雑なタスクもこなせるようになるほか、Googleカレンダー、Google ToDoリスト、Google Keepなど、より多くの GoogleツールをGeminiに接続できるようになります。

これにより、レシピを撮影して買いもにリストをGoogle Keepに追加したり、子供の予定表を撮影してカレンダーに予定を追加するといったことも可能になります。ただし、これは当面英語のみとなるようです。

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能

生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久)

Logic Pro 11の新機能を試して理解した、AI作曲と楽器パート別音源分離「Stem Splitter」の相性(CloseBox)

© TechnoEgde