Backport: feat(bedrock): add support for service tier for model inference (#14024)

vercel-ai-sdk[bot] · heiwen · aayush-kapoor · web-flow · commit df099b993456 · 2026-04-01T21:22:55.000Z
This is an automated backport of #13242 to the release-v6.0 branch. FYI @heiwen Co-authored-by: Heinrich Wendel <heinrich.wendel@gmail.com> Co-authored-by: Aayush Kapoor <83492835+aayush-kapoor@users.noreply.github.com> Co-authored-by: Aayush Kapoor <aayushkapoor34@gmail.com>
diff --git a/.changeset/hip-suits-tie.md b/.changeset/hip-suits-tie.md
@@ -0,0 +1,5 @@
+---
+"@ai-sdk/amazon-bedrock": patch
+---
+
+feat(bedrock): add support for service tier for model inference
diff --git a/content/providers/01-ai-sdk-providers/08-amazon-bedrock.mdx b/content/providers/01-ai-sdk-providers/08-amazon-bedrock.mdx
@@ -514,6 +514,37 @@ console.log(amazonResult.text); // text response
 See [AI SDK UI: Chatbot](/docs/ai-sdk-ui/chatbot#reasoning) for more details
 on how to integrate reasoning into your chatbot.
 
+## Service Tiers
+
+Amazon Bedrock supports selecting an inference service tier per request via the `serviceTier` provider option.
+
+```ts
+import {
+  bedrock,
+  type AmazonBedrockLanguageModelOptions,
+} from '@ai-sdk/amazon-bedrock';
+import { generateText } from 'ai';
+
+const result = await generateText({
+  model: bedrock('us.anthropic.claude-sonnet-4-20250514-v1:0'),
+  prompt: 'Summarize this support ticket backlog.',
+  providerOptions: {
+    bedrock: {
+      serviceTier: 'priority',
+    } satisfies AmazonBedrockLanguageModelOptions,
+  },
+});
+```
+
+Supported values are:
+
+- `reserved`
+- `priority`
+- `default`
+- `flex`
+
+See the [Amazon Bedrock service tiers documentation](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html) for model availability and behavior.
+
 ## Extended Context Window
 
 Claude Sonnet 4 models on Amazon Bedrock support an extended context window of up to 1 million tokens when using the `context-1m-2025-08-07` beta feature.
diff --git a/examples/ai-functions/src/generate-text/bedrock/service-tier.ts b/examples/ai-functions/src/generate-text/bedrock/service-tier.ts
@@ -0,0 +1,23 @@
+import {
+  bedrock,
+  type AmazonBedrockLanguageModelOptions,
+} from '@ai-sdk/amazon-bedrock';
+import { generateText } from 'ai';
+import { run } from '../../lib/run';
+
+run(async () => {
+  const result = await generateText({
+    model: bedrock('openai.gpt-oss-120b-1:0'),
+    prompt: 'Invent a new holiday and describe its traditions.',
+    providerOptions: {
+      bedrock: {
+        serviceTier: 'flex',
+      } satisfies AmazonBedrockLanguageModelOptions,
+    },
+  });
+
+  console.log(result.text);
+  console.log();
+  console.log('Token usage:', result.usage);
+  console.log('Finish reason:', result.finishReason);
+});
diff --git a/packages/amazon-bedrock/src/bedrock-api-types.ts b/packages/amazon-bedrock/src/bedrock-api-types.ts
@@ -13,6 +13,9 @@ export interface BedrockConverseInput {
   };
   additionalModelRequestFields?: Record<string, unknown>;
   additionalModelResponseFieldPaths?: string[];
+  serviceTier?: {
+    type: string;
+  };
   guardrailConfig?:
     | BedrockGuardrailConfiguration
     | BedrockGuardrailStreamConfiguration
diff --git a/packages/amazon-bedrock/src/bedrock-chat-language-model.test.ts b/packages/amazon-bedrock/src/bedrock-chat-language-model.test.ts
@@ -2137,6 +2137,41 @@ describe('doStream', () => {
     });
   });
 
+  it('should pass serviceTier provider option in stream requests', async () => {
+    setupMockEventStreamHandler();
+    server.urls[streamUrl].response = {
+      type: 'stream-chunks',
+      chunks: [
+        JSON.stringify({
+          messageStop: {
+            stopReason: 'stop_sequence',
+          },
+        }) + '\n',
+      ],
+    };
+
+    await model.doStream({
+      prompt: TEST_PROMPT,
+      includeRawChunks: false,
+      providerOptions: {
+        bedrock: {
+          serviceTier: 'priority',
+        },
+      },
+    });
+
+    const requestBody = await server.calls[0].requestBodyJson;
+
+    expect(requestBody).toMatchObject({
+      serviceTier: {
+        type: 'priority',
+      },
+    });
+    expect(
+      requestBody.additionalModelRequestFields?.serviceTier,
+    ).toBeUndefined();
+  });
+
   it('should handle JSON response format in streaming', async () => {
     setupMockEventStreamHandler();
     prepareChunksFixtureResponse('bedrock-json-tool.1');
@@ -4231,6 +4266,30 @@ describe('doGenerate', () => {
     });
   });
 
+  it('should pass serviceTier provider option in generate requests', async () => {
+    prepareJsonFixtureResponse('bedrock-text');
+
+    await model.doGenerate({
+      prompt: TEST_PROMPT,
+      providerOptions: {
+        bedrock: {
+          serviceTier: 'priority',
+        },
+      },
+    });
+
+    const requestBody = await server.calls[0].requestBodyJson;
+
+    expect(requestBody).toMatchObject({
+      serviceTier: {
+        type: 'priority',
+      },
+    });
+    expect(
+      requestBody.additionalModelRequestFields?.serviceTier,
+    ).toBeUndefined();
+  });
+
   it('maps maxReasoningEffort for Nova without thinking (generate)', async () => {
     server.urls[novaGenerateUrl].response = {
       type: 'json-value',
diff --git a/packages/amazon-bedrock/src/bedrock-chat-language-model.ts b/packages/amazon-bedrock/src/bedrock-chat-language-model.ts
@@ -368,6 +368,7 @@ export class BedrockChatLanguageModel implements LanguageModelV3 {
     const {
       reasoningConfig: _,
       additionalModelRequestFields: __,
+      serviceTier: ___,
       ...filteredBedrockOptions
     } = providerOptions?.bedrock || {};
 
@@ -387,6 +388,11 @@ export class BedrockChatLanguageModel implements LanguageModelV3 {
         ...(Object.keys(inferenceConfig).length > 0 && {
           inferenceConfig,
         }),
+        ...(bedrockOptions.serviceTier != null && {
+          serviceTier: {
+            type: bedrockOptions.serviceTier,
+          },
+        }),
         ...filteredBedrockOptions,
         ...(toolConfig.tools !== undefined && toolConfig.tools.length > 0
           ? { toolConfig }
diff --git a/packages/amazon-bedrock/src/bedrock-chat-options.test.ts b/packages/amazon-bedrock/src/bedrock-chat-options.test.ts
@@ -0,0 +1,44 @@
+import { describe, expect, it } from 'vitest';
+import {
+  amazonBedrockLanguageModelOptions,
+  AmazonBedrockLanguageModelOptions,
+} from './bedrock-chat-options';
+
+describe('amazonBedrockLanguageModelOptions', () => {
+  describe('serviceTier', () => {
+    it('accepts valid service tier values', () => {
+      const validValues = ['reserved', 'priority', 'default', 'flex'] as const;
+
+      validValues.forEach(value => {
+        const result = amazonBedrockLanguageModelOptions.safeParse({
+          serviceTier: value,
+        });
+
+        expect(result.success).toBe(true);
+        expect(result.data?.serviceTier).toBe(value);
+      });
+    });
+
+    it('rejects invalid service tier values', () => {
+      const invalidValues = ['on-demand', 'auto', 'standard', '', 'PRIORITY'];
+
+      invalidValues.forEach(value => {
+        const result = amazonBedrockLanguageModelOptions.safeParse({
+          serviceTier: value,
+        });
+
+        expect(result.success).toBe(false);
+      });
+    });
+  });
+
+  describe('type inference', () => {
+    it('infers AmazonBedrockLanguageModelOptions type correctly', () => {
+      const options: AmazonBedrockLanguageModelOptions = {
+        serviceTier: 'priority',
+      };
+
+      expect(options.serviceTier).toBe('priority');
+    });
+  });
+});
diff --git a/packages/amazon-bedrock/src/bedrock-chat-options.ts b/packages/amazon-bedrock/src/bedrock-chat-options.ts
@@ -122,6 +122,16 @@ export const amazonBedrockLanguageModelOptions = z.object({
    * Anthropic beta features to enable
    */
   anthropicBeta: z.array(z.string()).optional(),
+  /**
+   * Service tier for the request.
+   * @see https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html
+   *
+   * - 'reserved': Uses provisioned throughput capacity
+   * - 'priority': Prioritizes low-latency inference when capacity is available
+   * - 'default': Standard on-demand tier
+   * - 'flex': Lower-cost tier for flexible latency workloads
+   */
+  serviceTier: z.enum(['reserved', 'priority', 'default', 'flex']).optional(),
 });
 
 export type AmazonBedrockLanguageModelOptions = z.infer<

-Original file line number
+Diff line change
@@ @@ -0,0 +1,5 @@ @@
 +---
 +"@ai-sdk/amazon-bedrock": patch
 +---
++
 +feat(bedrock): add support for service tier for model inference