[Data] `AutoscalingCoordinator` double-allocates resources if there are multiple datasets

https://github.com/ray-project/ray/blob/6dc66d4b7da62e93093b98190c064d50d5c1905f/python/ray/data/_internal/cluster_autoscaler/default_autoscaling_coordinator.py#L401-L411

TODO: Scope this fix

	# Allocate remaining resources.
	# NOTE, to handle the case where multiple datasets are running concurrently,
	# now we double-allocate remaining resources to all requesters with
	# `request_remaining=True`.
	# This achieves parity with the behavior before Ray Data was integrated with
	# AutoscalingCoordinator, where each dataset assumes it has the whole cluster.
	# TODO(hchen): handle multiple request_remaining requests better.
	for ongoing_req in ongoing_reqs:
	if ongoing_req.request_remaining:
	ongoing_req.allocated_resources.extend(cluster_node_resources)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Data] `AutoscalingCoordinator` double-allocates resources if there are multiple datasets #59685

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

[Data] AutoscalingCoordinator double-allocates resources if there are multiple datasets #59685

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

[Data] `AutoscalingCoordinator` double-allocates resources if there are multiple datasets #59685