AIアプリ Help Me Gemini
Gemini APIは、Googleが開発した最新の生成AI「Gemini」を、アプリケーション、ウェブサービス、および業務ツールに統合するための仕組みです。
このAPIを使用すると、AIとのチャット機能、高度なテキスト生成、データ分析、画像や動画の理解といった機能を自作のプログラムから呼び出すことができます。
主な特徴
- マルチモーダル対応: テキストだけでなく、画像、音声、動画、PDFドキュメントなどを組み合わせて処理と生成ができます。
- 長大なコンテキスト: 一度に処理できる情報量が多く(モデルにより最大100万〜200万トークン)、大量の資料に基づいた回答やコード分析が可能です。
- Googleサービスとの連携: Google Apps Script(GAS)などを使って、スプレッドシートやドキュメントの操作を自動化するツールも作成できます。
- 関数の呼び出し(Function Calling): AIが自分で外部ツールやリアルタイムの情報を取得し、より正確なアクションを実行できます。
利用可能な主要モデル
用途に合わせて、以下のようなモデルを選択できます。
- Gemini 1.5 Pro: 複雑な推論や高度なコーディング、大量のデータ処理に適した最高性能モデル。
- Gemini 1.5 Flash: 軽量でレスポンスが速く、コストパフォーマンスに優れたモデル。リアルタイム性が求められる用途に向いています。
料金と始め方
- 料金体系: 使用量に応じた従量課金制ですが、一定の制限内であれば無料で試用できるプランも提供されています。
- APIキーの取得: Google AI Studio にログインし、APIキーを発行するだけで、Pythonなどのプログラミング言語からすぐに使い始めることができます。
実行画面

音声ファイルの文字起こしです。英語と日本語翻訳をどのように文字起こしするかを指示します。指示の内容によって回答がかわります。定型ではない非定型の命令になります。今までのアプリとは異なります。添付ファイル付きで指示ができます。いろいろなことが可能となります。利用方法は、使用者によって決まります。いままでとは、異なるソフトになります。無料枠は、1日20回までです。google api を利用して音声読み上げにも対応しました。