Optimize w8a8 kernel vmem limit by kyuyeunk · Pull Request #9508 · pytorch/xla

kyuyeunk · 2025-07-24T21:49:01Z

Use tighter lower bound for vmem limit to allow better pipelining.

vanbasten23

LGTM. Thanks Kyuyeun.

vanbasten23 reviewed Jul 24, 2025

View reviewed changes

Comment thread torch_xla/experimental/pallas_kernels/quantized_matmul_kernel.py Outdated

vanbasten23 reviewed Jul 24, 2025

View reviewed changes

Comment thread torch_xla/experimental/pallas_kernels/quantized_matmul_kernel.py Outdated

vanbasten23 reviewed Jul 24, 2025

View reviewed changes

Comment thread torch_xla/experimental/pallas_kernels/quantized_matmul_kernel.py

kyuyeunk force-pushed the optimize_w8a8_vmem_limit branch from c775f23 to 77a8a75 Compare July 25, 2025 00:37

kyuyeunk changed the title ~~Optimize w8a8 kernel vmem limit.~~ Optimize w8a8 kernel vmem limit Jul 25, 2025

kyuyeunk force-pushed the optimize_w8a8_vmem_limit branch 2 times, most recently from 3db386d to c87d78d Compare July 25, 2025 01:49

vanbasten23 reviewed Jul 25, 2025

View reviewed changes

Comment thread torch_xla/experimental/pallas_kernels/quantized_matmul_kernel.py Outdated

vanbasten23 reviewed Jul 25, 2025

View reviewed changes

Comment thread torch_xla/experimental/pallas_kernels/quantized_matmul_kernel.py Outdated

vanbasten23 reviewed Jul 25, 2025

View reviewed changes

Comment thread torch_xla/experimental/pallas_kernels/quantized_matmul_kernel.py Outdated

kyuyeunk force-pushed the optimize_w8a8_vmem_limit branch from c87d78d to 924c68a Compare July 25, 2025 21:48

vanbasten23 mentioned this pull request Jul 26, 2025

Optimize w8a8 kernel vmem limit vllm-project/tpu-inference#315

Merged

3 tasks

Optimize w8a8 kernel vmem limit

de47e49

Use tighter lower bound for vmem limit to allow better pipelining.

kyuyeunk force-pushed the optimize_w8a8_vmem_limit branch from 924c68a to de47e49 Compare July 26, 2025 00:13

vanbasten23 enabled auto-merge (squash) July 26, 2025 05:16

vanbasten23 approved these changes Jul 26, 2025

View reviewed changes

vanbasten23 merged commit 29ae4c7 into pytorch:master Jul 26, 2025
23 of 24 checks passed

kyuyeunk deleted the optimize_w8a8_vmem_limit branch July 26, 2025 06:25

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Optimize w8a8 kernel vmem limit#9508

Optimize w8a8 kernel vmem limit#9508
vanbasten23 merged 1 commit intopytorch:masterfrom
kyuyeunk:optimize_w8a8_vmem_limit

kyuyeunk commented Jul 24, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

vanbasten23 left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

kyuyeunk commented Jul 24, 2025

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

vanbasten23 left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants