dask.dataframe quantile fails spectacularly in some edge cases

```
s = pd.Series([-1, 0, 0, 0, 1, 1])
print(s.median())  # 0.0
print(dd.from_pandas(s, 2).quantile(0.5).compute())  # 1.0
```

This is also true for arbitrarily large repetitions of this data, e.g.,

```
s = pd.Series([-1] * 1000 + [0, 0, 0] * 1000 + [1, 1] * 1000)
# also holds for all different chunk sizes that I tested other than 20
dd.from_pandas(s, 20).quantile(0.5).compute()  # 1.0
```

cc @ogrisel 


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

dask.dataframe quantile fails spectacularly in some edge cases #731

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Uh oh!

dask.dataframe quantile fails spectacularly in some edge cases #731

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions