Backport: feat(provider/google): add support for service tier parameter (#13916)

vercel-ai-sdk[bot] · felixarntz · web-flow · commit 4e22c2c0760a · 2026-03-30T17:04:35.000Z
This is an automated backport of #13915 to the release-v6.0 branch. FYI @felixarntz Co-authored-by: Felix Arntz <felix.arntz@vercel.com>
diff --git a/.changeset/cyan-pears-allow.md b/.changeset/cyan-pears-allow.md
@@ -0,0 +1,5 @@
+---
+"@ai-sdk/google": patch
+---
+
+feat(provider/google): add support for service tier parameter
diff --git a/content/providers/01-ai-sdk-providers/15-google-generative-ai.mdx b/content/providers/01-ai-sdk-providers/15-google-generative-ai.mdx
@@ -245,6 +245,12 @@ The following optional provider options are available for Google Generative AI m
   Optional. Defines labels used in billing reports. Available on Vertex AI only.
   See [Google Cloud labels documentation](https://cloud.google.com/vertex-ai/generative-ai/docs/multimodal/add-labels-to-api-calls).
 
+- **serviceTier** _'SERVICE_TIER_STANDARD' | 'SERVICE_TIER_FLEX' | 'SERVICE_TIER_PRIORITY'_
+
+  Optional. The service tier to use for the request.
+  Set to 'SERVICE_TIER_FLEX' for 50% cheaper processing at the cost of increased latency.
+  Set to 'SERVICE_TIER_PRIORITY' for ultra-low latency at a 75-100% price premium over 'SERVICE_TIER_STANDARD'.
+
 - **threshold** _string_
 
   Optional. Standalone threshold setting that can be used independently of `safetySettings`.
diff --git a/examples/ai-functions/src/generate-text/google/service-tier.ts b/examples/ai-functions/src/generate-text/google/service-tier.ts
@@ -0,0 +1,18 @@
+import { google, type GoogleLanguageModelOptions } from '@ai-sdk/google';
+import { generateText } from 'ai';
+import { run } from '../../lib/run';
+
+run(async () => {
+  const result = await generateText({
+    model: google('gemini-3.1-pro-preview'),
+    prompt: 'What color is the sky in one word?',
+    providerOptions: {
+      google: {
+        serviceTier: 'SERVICE_TIER_FLEX',
+      } satisfies GoogleLanguageModelOptions,
+    },
+  });
+
+  console.log(result.text);
+  console.log('serviceTier:', result.providerMetadata?.google?.serviceTier);
+});
diff --git a/examples/ai-functions/src/stream-text/google/service-tier.ts b/examples/ai-functions/src/stream-text/google/service-tier.ts
@@ -0,0 +1,23 @@
+import { google, type GoogleLanguageModelOptions } from '@ai-sdk/google';
+import { streamText } from 'ai';
+import { run } from '../../lib/run';
+
+run(async () => {
+  const result = streamText({
+    model: google('gemini-3.1-pro-preview'),
+    prompt: 'What color is the sky in one word?',
+    providerOptions: {
+      google: {
+        serviceTier: 'SERVICE_TIER_FLEX',
+      } satisfies GoogleLanguageModelOptions,
+    },
+  });
+
+  await result.consumeStream();
+
+  console.log(await result.text);
+  console.log(
+    'serviceTier:',
+    (await result.providerMetadata)?.google?.serviceTier,
+  );
+});
diff --git a/packages/google/src/__snapshots__/google-generative-ai-language-model.test.ts.snap b/packages/google/src/__snapshots__/google-generative-ai-language-model.test.ts.snap
@@ -25,6 +25,7 @@ Here is the breakdown: st**r**awbe**rr**y.",
       "groundingMetadata": null,
       "promptFeedback": null,
       "safetyRatings": null,
+      "serviceTier": null,
       "urlContextMetadata": null,
       "usageMetadata": {
         "candidatesTokenCount": 29,
@@ -63,6 +64,7 @@ Here is the breakdown: st**r**awbe**rr**y.",
       },
       "labels": undefined,
       "safetySettings": undefined,
+      "serviceTier": undefined,
       "systemInstruction": undefined,
       "toolConfig": undefined,
       "tools": undefined,
@@ -155,6 +157,7 @@ Here is the breakdown: st**r**awbe**rr**y.",
       "groundingMetadata": null,
       "promptFeedback": null,
       "safetyRatings": null,
+      "serviceTier": null,
       "urlContextMetadata": null,
       "usageMetadata": {
         "candidatesTokenCount": 28,
@@ -193,6 +196,7 @@ Here is the breakdown: st**r**awbe**rr**y.",
       },
       "labels": undefined,
       "safetySettings": undefined,
+      "serviceTier": undefined,
       "systemInstruction": undefined,
       "toolConfig": undefined,
       "tools": undefined,
@@ -307,6 +311,7 @@ exports[`doGenerate > tool-call > should extract tool calls 1`] = `
       "groundingMetadata": null,
       "promptFeedback": null,
       "safetyRatings": null,
+      "serviceTier": null,
       "urlContextMetadata": null,
       "usageMetadata": {
         "candidatesTokenCount": 15,
@@ -345,6 +350,7 @@ exports[`doGenerate > tool-call > should extract tool calls 1`] = `
       },
       "labels": undefined,
       "safetySettings": undefined,
+      "serviceTier": undefined,
       "systemInstruction": undefined,
       "toolConfig": undefined,
       "tools": [
@@ -461,6 +467,7 @@ exports[`doGenerate > tool-call-gemini3 > should extract tool call with thoughtS
       "groundingMetadata": null,
       "promptFeedback": null,
       "safetyRatings": null,
+      "serviceTier": null,
       "urlContextMetadata": null,
       "usageMetadata": {
         "candidatesTokenCount": 15,
@@ -499,6 +506,7 @@ exports[`doGenerate > tool-call-gemini3 > should extract tool call with thoughtS
       },
       "labels": undefined,
       "safetySettings": undefined,
+      "serviceTier": undefined,
       "systemInstruction": undefined,
       "toolConfig": undefined,
       "tools": undefined,
@@ -620,6 +628,7 @@ Here is the breakdown: st**r**awbe**rr**y.",
         "groundingMetadata": null,
         "promptFeedback": null,
         "safetyRatings": null,
+        "serviceTier": null,
         "urlContextMetadata": null,
         "usageMetadata": {
           "candidatesTokenCount": 29,
@@ -703,6 +712,7 @@ exports[`doStream > reasoning-gemini3 > should stream reasoning with thoughtSign
         "groundingMetadata": null,
         "promptFeedback": null,
         "safetyRatings": null,
+        "serviceTier": null,
         "urlContextMetadata": null,
         "usageMetadata": {
           "candidatesTokenCount": 23,
@@ -891,6 +901,7 @@ st**r**awbe**rr**y",
         "groundingMetadata": null,
         "promptFeedback": null,
         "safetyRatings": null,
+        "serviceTier": null,
         "urlContextMetadata": null,
         "usageMetadata": {
           "candidatesTokenCount": 23,
@@ -981,6 +992,7 @@ exports[`doStream > tool-call > should stream tool call 1`] = `
         "groundingMetadata": null,
         "promptFeedback": null,
         "safetyRatings": null,
+        "serviceTier": null,
         "urlContextMetadata": null,
         "usageMetadata": {
           "candidatesTokenCount": 15,
@@ -1071,6 +1083,7 @@ exports[`doStream > tool-call-gemini3 > should stream tool call with thoughtSign
         "groundingMetadata": null,
         "promptFeedback": null,
         "safetyRatings": null,
+        "serviceTier": null,
         "urlContextMetadata": null,
         "usageMetadata": {
           "candidatesTokenCount": 15,
diff --git a/packages/google/src/google-generative-ai-language-model.test.ts b/packages/google/src/google-generative-ai-language-model.test.ts
@@ -555,6 +555,74 @@ describe('doGenerate', () => {
     expect(providerMetadata?.google.finishMessage).toBeNull();
   });
 
+  it('should send serviceTier in request body when specified', async () => {
+    prepareJsonResponse({ content: 'test response' });
+
+    await model.doGenerate({
+      prompt: TEST_PROMPT,
+      providerOptions: {
+        google: {
+          serviceTier: 'SERVICE_TIER_FLEX',
+        },
+      },
+    });
+
+    expect(await server.calls[0].requestBodyJson).toMatchObject({
+      serviceTier: 'SERVICE_TIER_FLEX',
+    });
+  });
+
+  it('should not send serviceTier in request body when not specified', async () => {
+    prepareJsonResponse({ content: 'test response' });
+
+    await model.doGenerate({
+      prompt: TEST_PROMPT,
+    });
+
+    const body = await server.calls[0].requestBodyJson;
+    expect(body).not.toHaveProperty('serviceTier');
+  });
+
+  it('should expose serviceTier in provider metadata', async () => {
+    server.urls[TEST_URL_GEMINI_PRO].response = {
+      type: 'json-value',
+      body: {
+        candidates: [
+          {
+            content: {
+              parts: [{ text: 'test response' }],
+              role: 'model',
+            },
+            finishReason: 'STOP',
+            safetyRatings: SAFETY_RATINGS,
+          },
+        ],
+        usageMetadata: {
+          promptTokenCount: 1,
+          candidatesTokenCount: 2,
+          totalTokenCount: 3,
+        },
+        serviceTier: 'SERVICE_TIER_FLEX',
+      },
+    };
+
+    const { providerMetadata } = await model.doGenerate({
+      prompt: TEST_PROMPT,
+    });
+
+    expect(providerMetadata?.google.serviceTier).toBe('SERVICE_TIER_FLEX');
+  });
+
+  it('should expose null serviceTier in provider metadata when not present', async () => {
+    prepareJsonResponse({ content: 'test response' });
+
+    const { providerMetadata } = await model.doGenerate({
+      prompt: TEST_PROMPT,
+    });
+
+    expect(providerMetadata?.google.serviceTier).toBeNull();
+  });
+
   describe('tool-call', () => {
     beforeEach(() => {
       prepareJsonFixtureResponse('google-tool-call');
@@ -3745,6 +3813,60 @@ describe('doStream', () => {
     ).toBeNull();
   });
 
+  it('should expose serviceTier in provider metadata on finish', async () => {
+    server.urls[TEST_URL_GEMINI_PRO].response = {
+      type: 'stream-chunks',
+      chunks: [
+        `data: ${JSON.stringify({
+          candidates: [
+            {
+              content: {
+                parts: [{ text: 'test response' }],
+                role: 'model',
+              },
+              finishReason: 'STOP',
+              safetyRatings: SAFETY_RATINGS,
+            },
+          ],
+          usageMetadata: {
+            promptTokenCount: 1,
+            candidatesTokenCount: 2,
+            totalTokenCount: 3,
+          },
+          serviceTier: 'SERVICE_TIER_FLEX',
+        })}\n\n`,
+      ],
+    };
+
+    const { stream } = await model.doStream({
+      prompt: TEST_PROMPT,
+    });
+
+    const events = await convertReadableStreamToArray(stream);
+    const finishEvent = events.find(event => event.type === 'finish');
+
+    expect(
+      finishEvent?.type === 'finish' &&
+        finishEvent.providerMetadata?.google.serviceTier,
+    ).toBe('SERVICE_TIER_FLEX');
+  });
+
+  it('should expose null serviceTier in provider metadata on finish when not present', async () => {
+    prepareStreamResponse({ content: ['test'] });
+
+    const { stream } = await model.doStream({
+      prompt: TEST_PROMPT,
+    });
+
+    const events = await convertReadableStreamToArray(stream);
+    const finishEvent = events.find(event => event.type === 'finish');
+
+    expect(
+      finishEvent?.type === 'finish' &&
+        finishEvent.providerMetadata?.google.serviceTier,
+    ).toBeNull();
+  });
+
   it('should stream code execution tool calls and results', async () => {
     server.urls[TEST_URL_GEMINI_2_0_PRO].response = {
       type: 'stream-chunks',
@@ -4354,6 +4476,7 @@ describe('doStream', () => {
                   "probability": "NEGLIGIBLE",
                 },
               ],
+              "serviceTier": null,
               "urlContextMetadata": null,
               "usageMetadata": null,
             },
@@ -4815,6 +4938,7 @@ describe('doStream', () => {
               "groundingMetadata": null,
               "promptFeedback": null,
               "safetyRatings": null,
+              "serviceTier": null,
               "urlContextMetadata": null,
               "usageMetadata": {
                 "candidatesTokenCount": 18,
@@ -4977,6 +5101,7 @@ describe('doStream', () => {
                   "probability": "NEGLIGIBLE",
                 },
               ],
+              "serviceTier": null,
               "urlContextMetadata": null,
               "usageMetadata": null,
             },
diff --git a/packages/google/src/google-generative-ai-language-model.ts b/packages/google/src/google-generative-ai-language-model.ts
@@ -207,6 +207,7 @@ export class GoogleGenerativeAILanguageModel implements LanguageModelV3 {
           : googleToolConfig,
         cachedContent: googleOptions?.cachedContent,
         labels: googleOptions?.labels,
+        serviceTier: googleOptions?.serviceTier,
       },
       warnings: [...warnings, ...toolWarnings],
       providerOptionsName,
@@ -364,6 +365,7 @@ export class GoogleGenerativeAILanguageModel implements LanguageModelV3 {
           safetyRatings: candidate.safetyRatings ?? null,
           usageMetadata: usageMetadata ?? null,
           finishMessage: candidate.finishMessage ?? null,
+          serviceTier: response.serviceTier ?? null,
         } satisfies GoogleGenerativeAIProviderMetadata,
       },
       request: { body: args },
@@ -405,6 +407,7 @@ export class GoogleGenerativeAILanguageModel implements LanguageModelV3 {
     let providerMetadata: SharedV3ProviderMetadata | undefined = undefined;
     let lastGroundingMetadata: GroundingMetadataSchema | null = null;
     let lastUrlContextMetadata: UrlContextMetadataSchema | null = null;
+    let serviceTier: string | null = null;
 
     const generateId = this.config.generateId;
     let hasToolCalls = false;
@@ -447,6 +450,10 @@ export class GoogleGenerativeAILanguageModel implements LanguageModelV3 {
               usage = usageMetadata;
             }
 
+            if (value.serviceTier != null) {
+              serviceTier = value.serviceTier;
+            }
+
             const candidate = value.candidates?.[0];
 
             // sometimes the API returns an empty candidates array
@@ -685,6 +692,7 @@ export class GoogleGenerativeAILanguageModel implements LanguageModelV3 {
                   safetyRatings: candidate.safetyRatings ?? null,
                   usageMetadata: usageMetadata ?? null,
                   finishMessage: candidate.finishMessage ?? null,
+                  serviceTier,
                 } satisfies GoogleGenerativeAIProviderMetadata,
               };
             }
@@ -1028,6 +1036,7 @@ const responseSchema = lazySchema(() =>
           safetyRatings: z.array(getSafetyRatingSchema()).nullish(),
         })
         .nullish(),
+      serviceTier: z.string().nullish(),
     }),
   ),
 );
@@ -1083,6 +1092,7 @@ const chunkSchema = lazySchema(() =>
           safetyRatings: z.array(getSafetyRatingSchema()).nullish(),
         })
         .nullish(),
+      serviceTier: z.string().nullish(),
     }),
   ),
 );
diff --git a/packages/google/src/google-generative-ai-options.ts b/packages/google/src/google-generative-ai-options.ts
diff --git a/packages/google/src/google-generative-ai-prompt.ts b/packages/google/src/google-generative-ai-prompt.ts

-Original file line number
+Diff line change
@@ @@ -0,0 +1,5 @@ @@
 +---
 +"@ai-sdk/google": patch
 +---
++
 +feat(provider/google): add support for service tier parameter