Googleが新たな技術革新を遂げ、その最前線に「Gemini Pro」というAIモデルを位置付けました。12月13日、GoogleはこのGemini Proの提供開始を発表し、企業と開発者向けに新たなツールを提供します。これは、先に発表された「Gemini 1.0」のミドルサイズモデルであり、特にテキスト生成に特化しています。
Gemini Proは、企業には「Vertex AI」、開発者には「AI Studio」というプラットフォームで提供されます。当初は無料での提供を予定しており、将来的には有償サービスに移行する計画ですが、その価格は競争力があり、既存のGPT-4ベースの企業向けサービスよりも低価格に設定される見込みです。
この新AIモデルは、テキストのみをサポートするものの、画像をプロンプトとして使用することが可能な「Gemini Pro Vision」も提供される予定です。また、Python、Android(Kotlin)、Node.js、Swift、JavaScriptなどの複数のプログラミング言語をサポートするSDKも利用可能となり、アプリ開発の幅が広がります。
企業顧客には、ノーコードで自社データを活用したアプリの構築が可能です。Googleは、不動産企業がGemini Pro Visionを使って住宅の写真からWebサイト用の紹介テキストを生成するデモを披露しました。また、Googleは顧客のデータを基にモデルをトレーニングすることはないと明言しています。
Gemini Proは、既にBardの英語版にも搭載されており、より高度でマルチモーダルな「Gemini Ultra」の提供も2024年に予定されています。現在、Googleは微調整、安全性テスト、パートナーからのフィードバック収集を行っています。
さらに、Googleは文章から画像を生成する「Imagen 2」という新しい拡散モデルも発表しました。これにより、テキストと画像の生成能力を持つAI技術がさらに進化していることがわかります。
このような進化は、技術の進歩を示すと同時に、私たちの生活やビジネスへの応用可能性を広げています。特にGemini Proのようなツールは、企業や開発者に新たな機会を提供し、AIの活用範囲を拡大しています。私は、この技術がどのように私たちの日常やビジネスプラクティスを変えていくのか、興味深く見守っています。AIの可能性は無限大であり、これからの展開に大きな期待を寄せています。