Gemini 3.1 Flash-Lite は、費用対効果に優れた Gemini モデルで、トラフィックが多く、コスト重視の LLM における低レイテンシのユースケース向けに最適化されています。Gemini 2.0 Flash-Lite モデルと Gemini 2.5 Flash-Lite モデルよりも品質が大幅に向上し、主要な機能領域で Gemini 2.5 Flash のパフォーマンスに匹敵します。
- 回答の質の向上: 2.5 Flash のパフォーマンスに匹敵することを目指しています。
- 指示の実行の改善: 複雑なチャットボットや指示の多いワークフローの信頼性の高い移行パスとして機能するように、対象を絞った改善が行われています。
- 音声入力の改善: 自動音声認識(ASR)などのタスクの音声入力の品質が向上しました。
- 思考サポートの拡張: 最小、低、中、高の思考レベルから選択して、モデルが実行する推論の量を制御できます。この機能を使用すると、特定のユースケースに合わせて回答の品質と速度のバランスを取ることができます。
Agent Studio で試す サンプルアプリをデプロイする
| モデル ID | gemini-3.1-flash-lite |
|
|---|---|---|
| モダリティ |
|
|
| トークンの上限 | コンテキスト ウィンドウ | 1,048,576 |
| 最大出力トークン | 65,535(デフォルト) | |
| 機能 | ||
| 使用オプション | ||
| 詳細については、消費オプションをご覧ください。 | ||
| 技術仕様 | テキスト |
|
| 画像 |
|
|
| 音声 |
|
|
| 動画 |
|
|
| パラメータのデフォルト |
|
|
| サポートされるリージョン |
モデルの提供 |
|
|
ML 処理 |
|
|
| 詳細については、デプロイとエンドポイントをご覧ください。 | ||
| ナレッジ カットオフ日 | 2025 年 1 月 | |
| バージョン |
|
|
| セキュリティ管理 | オンライン予測 |
|
| バッチ推論 |
|
|
| コンテキストのキャッシュ保存 |
|
|
| 詳細については、セキュリティ管理をご覧ください。 | ||
| 料金 | 料金をご覧ください。 | |