グーグルは2023年12月7日に生成系AIのGeminiを発表しました。
私が把握している生成系AIは下記ですがここにGeminiが追加されることになります。
・OpenAI社のChatGPT
・LINE社のHyperCLOVA
・グーグルのBard
生成系AIのGeminiがどういったものなのか調査しましたのでご紹介いたします。
Geminiの概要
伝達できるメディアが豊富
・音声
・テキスト
・画像
・動画
を生成系AIにインプットすることで回答を得られるそうです。
マルチモーダル性
更にはこれらのメディアを複数インプットさせて回答を得ることもできるようです。複数の情報を同時に扱える要素をマルチモーダル性というそうです。
PCのチャットAIとピクセルに導入予定
グーグルのチャットAIであるBardやグーグルのスマートフォンのPixelへの組み込みを進めるそうです。
2024年から「Bard」は「Bard Advanced」に
既存のBardについては2024年のGemini公開タイミングから最先端の機能を組み込んだ「Bard Advanced」を提供するそうです。
ユーザー側からみた中身の変化を感じずに精度が進化する感じでしょうかね。画像や動画、音声もできるとなるとGUIもかわり全く違うものになりそうです。
グーグルの検証ではGeminiはChatGPTを上回る能力
グーグルの報告によればGeminiはChatGPT4を上回る能力をもっているようです。
数学、歴史、医学、倫理などの57科目において能力がうわまったということです。
私の知る限りではChatGPTのデータは何年か前のデータで学習されていますがBardは比較的リードタイムに学習データが更新されているので精度もよくなるとGeminiを搭載したBardは凄いですね。
Gemini今後の考察
現在の生成系AIはもっともらしく回答してくれますが平気でうそをつきます。判断がつかないレベルなので困るレベルです。
数値を用いた回答はかなり苦手なようで回答で数字が出てきた場合は全く信じることができません。
ですが、上記の数学などで高得点を挙げたということであれば今後でてくる生成系AIの回答に希望がもてると感じました。
人間では対応できない膨大な知識を用いて大量データを高い精度で回答してくれる日が楽しみです。
コメント