このページでは、プロビジョンド スループットを定期購入する前に考慮すべき詳細、プロビジョンド スループットの注文やその表示に必要な権限、標準プロビジョンド スループットの注文とその表示の手順について説明します。
シングルゾーン プロビジョンド スループットを購入する場合は、 アカウント担当者 にお問い合わせください。Google Cloud シングルゾーン プロビジョンド スループットの詳細については、 シングルゾーン プロビジョンド スループットをご覧ください。
購入前に考慮すべきこと
プロビジョンド スループットを購入するかどうかを判断する際は、次の点を考慮してください。
期間の途中で注文をキャンセルすることはできません。
プロビジョンド スループットの購入はコミットメントであるため、期間中に注文をキャンセルすることはできません。ただし、購入した GSU の数は増やすことができます。コミットメントを誤って購入した場合や、構成に問題がある場合は、アカウント担当者にお問い合わせください。Google Cloud
サブスクリプションは自動更新できます。
注文を送信する際に、サブスクリプションの期間の終了時に自動更新するか、サブスクリプションを終了するかを選択できます。特定の状況下では、注文の自動更新の動作を変更することもできます。注文を変更できないシナリオについては、 注文を変更できない場合をご覧ください。
月単位のサブスクリプションは、毎月自動的に更新するように構成できます。 週単位のプランでは自動更新はサポートされていません。
詳細については、標準の プロビジョンド スループットの注文を変更するをご覧ください。アカウント担当者にお問い合わせいただくこともできます。 Google Cloud
自動更新の動作、モデル、モデル バージョン、リージョンは、通知の送信後に変更されます。
プロジェクト、リージョン、モデル、モデル バージョン、自動更新の動作を選択して注文が承認され、有効になると、プロビジョンド スループットが有効になります(使用可能な容量が上限となります)。 自動更新の動作、モデル、モデル バージョン、リージョンを変更するには、 コンソールを使用して既存のプロビジョンド スループット の注文を変更します。 Google Cloud
変更はすべて商業上合理的な努力に基づいて処理され、通常は最初のリクエストから 10 営業日以内に完了します。
モデルの変更は特定のパブリッシャーに限定されます。たとえば、プロビジョンド スループットのモデル割り当てを Google Gemini 2.0 Pro から Google Gemini 2.0 Flash に切り替えることはできますが、Google Gemini 2.0 Flash から Anthropic Claude 3.5 Sonnet v2 に切り替えることはできません。
デフォルトでは、超過分は従量課金制で請求されます。
スループットがプロビジョンド スループットの注文量を超えると、超過分は標準の従量課金制で処理され、請求されます。超過分はリクエストごとに制御できます。詳細については、プロビジョンド スループットを使用するをご覧ください。
料金については、プロビジョンド スループットをご覧ください。
プレビュー モデルのプロビジョンド スループットを購入する
モデルの一般提供バージョンがリリースされていない場合は、プレビュー版の Google モデルのプロビジョンド スループットを購入できます。
プレビュー版モデルのプロビジョンド スループットの注文が有効で、モデルの一般提供版がリリースされた場合は、次のいずれかを行うことができます。
注文をモデルの一般提供版に切り替えます。注文を一般提供モデルに切り替えた後、注文をプレビュー モデルに戻すことはできません。注文の変更の詳細については、 標準のプロビジョンド スループットの注文を変更するをご覧ください。
プレビュー版が安定している間は、モデルのプレビュー版でプロビジョンド スループットを引き続き使用します。 安定版モデルと提供終了モデルの詳細については、 モデルのバージョンとライフサイクルをご覧ください。
ロールと権限
次のロールは、Gemini Enterprise Agent Platform プロビジョンド スループットの管理に対する完全アクセス権を付与します。
roles/aiplatform.provisionedThroughputAdmin: Gemini Enterprise Agent Platform プロビジョンド スループット リソースにアクセスできます。
このロールには次の権限が含まれます。
| 権限 | 説明 |
|---|---|
aiplatform.provisionedThroughputs.create |
新しいプロビジョンド スループットの注文を送信します。 |
aiplatform.provisionedThroughputs.get |
特定のプロビジョンド スループットの注文を表示します。 |
aiplatform.provisionedThroughputs.list |
プロビジョンド スループットの注文をすべて表示します。 |
aiplatform.provisionedThroughputs.update |
プロビジョンド スループットの注文を変更します。 |
aiplatform.provisionedThroughputs.cancel |
保留中の注文または保留中の更新をキャンセルします。 |
プロビジョンド スループットの注文を計画する
プロビジョンド スループットの注文を計画する際は、次の点を考慮してください。
割り当て
QPM が 30,000 を超えると予想される場合は、 プロビジョンド スループットの注文 を最大化するために、次の情報を使用して デフォルトの Agent Platform システム割り当ての割り当て調整をリクエストします。
- サービス: Agent Platform API。
- 名前:
Online prediction requests per minute per region - サービスタイプ: 割り当て。
- ディメンション: プロビジョンド スループットを注文したリージョン。
- 値: 選択したオンライン予測トラフィックの上限。
注文
プロビジョンド スループットの注文は、注文のサイズと利用可能な容量に基づいて処理されます。リクエストされた GSU の数と利用可能な容量によっては、注文の処理に数分から数週間かかることがあります。プロビジョンド スループットの注文時に、生成 AI スケール ユニットの見積もりツールを使用して、購入が必要な GSU の数を計算できます。見積もりを確認した後、そのまま進めるか、購入する GSU の数を変更できます。
標準のプロビジョンド スループットを注文する
標準のプロビジョンド スループットを購入する手順は次のとおりです。 シングルゾーン プロビジョンド スループットの購入についてサポートが必要な場合は、 アカウント担当者にお問い合わせください。 Google Cloud
コンソールで、 [**プロビジョンド スループット**] ページに移動します。 Google Cloud
新しい注文を開始するには、[新しい注文] をクリックします。
注文名を入力します。
モデルを選択します。
リージョンを選択します。
[見積もりツール] をクリックします。
[生成 AI スケール ユニット見積もりツール] ペインで、次の手順に沿って必要な GSU の数を見積もります。
- モデルを選択します。
選択したモデルに基づいて、必要な GSU の数を見積もるための詳細を入力します。各モデルの GSU の最小購入額と購入 単位については、 サポートされているモデルをご覧ください。 モデルの機能と入出力の制限については、モデルのドキュメントをご覧ください。
Gemini 3 Pro、 Gemini 2.5 Pro、 Gemini 2.5 Flash、および Gemini 2.5 Flash-Lite モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- 平均キャッシュ ヒット率(%)
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力推論テキスト トークン数
Gemini 3 Pro Image モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力推論テキスト トークン数
- クエリあたりの出力画像トークン数
Gemini 2.5 Flash Image モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力画像トークン数
Gemini 2.5 Flash with Gemini Live API ネイティブ音声) モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりのセッション メモリ(キャッシュ化)トークン数
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力音声トークン数
Gemini 2.5 Flash with Gemini Live API の場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりのセッション メモリ(キャッシュ化)トークン数
- クエリあたりの出力レスポンス テキスト トークン数
- クエリあたりの出力音声トークン数
Gemini 2.0 Flash モデルとGemini 2.0 Flash-Lite モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりの出力テキスト トークン数
Veo 3 と Veo 3 Fast モデルの場合は、次のように入力します。
- 頻度 \- 出力が生成される頻度を 秒単位で指定します。これはレイテンシではありません。
- クエリあたりの出力動画の秒数 - リクエストされた動画の合計秒数を入力します。たとえば、12 秒は
3x4または2x6の動画秒数の合計を表します。 - クエリあたりの出力動画と音声の秒数 - リクエストされた動画と音声の合計秒数を入力します。たとえば、12 秒は
3x4または2x6の動画と音声の秒数の合計を表します。
オープンモデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン
- クエリあたりの入力画像トークン数 (画像入力をサポートするオープンモデルの場合)
- クエリあたりの出力レスポンス テキスト トークン数
[GSU の見積もりと月額料金] セクションで、必要な GSU の見積もり数と料金を確認します。
[計算された値を使用] をクリックします。
省略可: [月あたりの生成 AI スケール ユニット(GSU)数] の値を変更します。
期間を選択します。これらの料金は、その期間中はキャンセルできません。また、実際の使用状況に関係なく、モデルが廃止された場合でも支払いが発生します。Google では、モデルの廃止日までに、割り当てられたモデルを変更することをおすすめします。廃止モデルの自動更新が事前にキャンセルされることはありません。
次のオプションが用意されています。
- 1 週間(Google モデルでのみ利用可能)
- 1 か月
- 3 か月
- 1 年
省略可: 期間の開始日時 を選択します。
注文から 2 週間以内の開始日時を指定できます。開始日時を指定しない場合、容量が確保でき次第、注文が処理されます。リクエストされた開始日時は、商業上合理的な努力に基づいて処理されます。また、注文のステータスが [承認済み] に設定されるまでは、注文がこれらの日時までに処理されるとは限りません。
リクエストした開始日が現在の日付に近すぎる場合、注文が承認されて有効化されるまでにリクエストした開始日を過ぎてしまうことがあります。この場合、選択した期間の長さに基づいて、有効化日から終了日が調整されます。保留中の注文のキャンセルについては、標準のプロビジョンド スループットの注文を変更するをご覧ください。
[更新] リストで、期間の終了時に注文を自動更新するかどうかを指定します。更新オプションを指定できるのは、期間として [1 か月]、[3 か月]、[1 年] のいずれかを選択した場合のみです。
[続行] をクリックします。
[確認して送信] セクションで、注文の価格とスループットの見積もりを確認します。フォームに記載されている利用規約とリンク先の利用規約をお読みください。
注文を確定して送信するには、[注文確認] フィールドに「
CONFIRM」と入力し、[注文を送信] をクリックします。注文の処理には、注文のサイズと利用可能な容量に応じて、数分から数週間かかることがあります。注文が処理されると、 Google Cloud コンソールに表示されるステータスが「有効」に変わります。注文が有効になってから、その注文に対する請求が行われます。
標準のプロビジョンド スループットの注文を変更する
注文のステータスと既存の条件に基づいて、 コンソールを使用してプロビジョンド スループットの注文を変更できます。 Google Cloud 注文の変更は、コンソールからオンラインで注文した Google モデルでのみ使用できます。オフライン注文または オープンモデルの注文の変更については、 Google Cloud アカウント担当者 にお問い合わせください。Google モデルのプロビジョンド スループットの注文をオープンモデルに変更することはできません。
コンソールを使用してモデルまたはモデル バージョンを変更すると、既存の注文のモデルまたはモデル バージョンが更新されますが、サブスクリプションの終了日は同じままになります。 Google Cloud
変更リクエストの開始日時として、次の 2 週間以内の日時を指定できます。開始日時を指定しない場合、容量が確保でき次第、変更リクエストが処理されます。リクエストされた開始日時は、商業上合理的な努力に基づいて処理されます。また、変更ステータスが [承認済み] に設定されるまでは、注文の変更がこれらの日時までに処理されるとは限りません。
リクエストした開始日が現在の日付に近すぎる場合、変更注文が承認されて有効化されるまでにリクエストした開始日を過ぎてしまうことがあります。 保留中の候補のキャンセルについては、次の表をご覧ください。
次の表に、 プロビジョンド スループットの注文を Google Cloud コンソールを使用して変更する方法を示します。
| 注文ステータス | アクション | 注 | Google Cloud コンソールでの手順 |
|---|---|---|---|
| 確認待ち | 注文をキャンセルできます。 |
注文内容をさらに変更する場合は、保留中の注文をキャンセルして、新たに注文してください。 複数のモデルがある場合、各モデルに同時に設定できる保留中の注文の変更または保留中の注文は 1 つのみです。 |
Google Cloud コンソールで保留中の注文をキャンセルする手順は次のとおりです。
|
| 承認済み | 注文を変更することはできません。 | 注文は有効化待ちです。 現時点では、注文を変更することはできません。 | 該当なし |
| 有効 |
次の変更は、注文が 5 日以内に期限切れにならない場合、または自動更新される場合にのみ行うことができます。
|
有効期限が 5 日未満で、自動更新が設定されていない有効な注文は変更できません。 | Google Cloud コンソールで有効な注文を変更するには、次のいずれかの方法を使用します。
|
注文を分割する
有効な注文を 2 つの注文に分割できます。モデル、リージョン、期間、有効期限、更新ポリシーは同じままなので、部分的な移行が容易になります。
注文を分割する手順は次のとおりです。
コンソールで、 [**プロビジョンド スループットの注文**] ページに移動します。 Google Cloud
注文 ID をクリックします。
[注文の詳細] ページで、[分割] ボタンをクリックします。
作成する分割注文の注文名 を入力します。
元の注文からこの新しい注文に移動する GSU の数を入力します。
[変更の概要] 表で、この操作が既存の注文に与える影響を確認します。
[変更を送信] をクリックします。
[オーダーの概要] ページが開きます。[オーダーの概要] ページに、新しい分割注文が [承認済み] ステータスで表示されます。
10 分以内に、分割注文が [有効] ステータスに変わり、元の注文の GSU 数が、新しく作成された注文で有効になった GSU の数だけ減ります。この変更によって、サービスが失われたり、請求額が増加したりすることはありません。
注文を変更できない場合
次のいずれかの条件に該当する場合、 コンソールからプロビジョンド スループットの注文を変更またはキャンセルすることはできません。 Google Cloud
モデルの制限: 注文が、変更をサポートしていないモデルに対するものである。
注文ステータス: 注文ステータスが
Activeではない。有効期限が 5 日未満: 注文ステータスは
Activeですが、有効期限が 5 日未満で、自動更新が構成されていない。既存の注文変更リクエスト: 保留中または承認済みの既存の注文変更リクエストがある。
注文ステータスを確認する
プロビジョンド スループットの注文を送信すると、注文ステータスが次のいずれかになります。
- 審査待ち: 注文は完了しています。承認は、注文をプロビジョニングするための利用可能な容量に依存するため、注文は審査/ 承認待ち状態になります。保留中の注文のステータスについて詳しくは、 Google Cloud アカウント担当者にお問い合わせください。
- 承認済み: Google が注文を承認しました。注文は有効化待ちです。注文が承認された後は変更できません。
- 有効: Google が注文を有効にしました。請求が開始されます。
- 期限切れ: 注文の有効期限が切れています。
標準のプロビジョンド スループットの注文を表示する
プロビジョンド スループットの注文を表示する手順は次のとおりです。
コンソールで、[プロビジョンド スループット] ページに移動します。 Google Cloud
リージョンを選択します。注文のリストが表示されます。