memdb: use btree for storage by erikgrinaker · Pull Request #53 · tendermint/tm-db

erikgrinaker · 2020-03-03T18:33:07Z

Fixes #52 (see also tendermint/tendermint#4520). Uses a B-tree for storage, which should significantly improve range scan performance. No breaking changes.

Haven't had time to benchmark this yet, will do so shortly.

backend_test.go

mem_db.go

erikgrinaker · 2020-03-03T21:13:34Z

Benchmarks, doing range scans of 10.000 keys on databases with 1 million and 10 million keys:

Benchmark	Map (ns/op)	B-tree (ns/op)	Change
`BenchmarkMemDBRangeScans1M-4`	90 239 121	1 477 749	-98.36%
`BenchmarkMemDBRangeScans10M-4`	1 006 363 039	1 469 495	-99.86%
`BenchmarkMemDBRandomReadsWrites-4`	816	3 314	+306.17%

For these database sizes, B-trees have a speedup of 2-3 orders of magnitude. More importantly, and as expected, the old map-based database has a dependence on the number of keys in the database while B-trees do not.

The tradeoff is that read/write operations are three times more costly, but I think that's well worth it.

common_test.go

mem_db.go

common_test.go

melekes · 2020-03-04T11:23:38Z

erikgrinaker · 2020-03-09T11:41:53Z

I ran some Cosmos SDK benchmarks using the B-tree MemDB, via make test-sim-benchmark. These used SIM_NUM_BLOCKS=250, SIM_BLOCK_SIZE=200, and LevelDB with pruning strategies PruneNothing (persist every version to disk) and PruneSyncable (persist every 100 blocks to disk). I believe the SDK currently uses PruneSyncable by default.

`tm-db`	`PruneNothing`	`PruneSyncable`	`MemDB` + `PruneNothing`
0.4.1	191 s	114 s	691 s
btree	189 s	117 s	138 s

It appears that IAVLs use of MemDB in PruneSyncable mode, as a temporary working set that's periodically flushed to disk, does not trigger the slow path in MemDB. It is unclear why, but appears to be related to cleanup of orphaned nodes, which possibly hits LevelDB instead of MemDB. In this case the new B-tree appears to have a slight slowdown, as expected. However, when we use MemDB as the main database we do hit the slow path, and the B-tree version is five times faster.

Overall memory usage is about the same in both cases.

* Create SECURITY.md * Update SECURITY.md * Apply suggestions from code review --------- Co-authored-by: Thane Thomson <connect@thanethomson.com>

memdb: use btree for storage

60a834a

erikgrinaker added the S:wip Status: Work In Progress label Mar 3, 2020

erikgrinaker self-assigned this Mar 3, 2020

erikgrinaker mentioned this pull request Mar 3, 2020

Any plan to improve the performance of memory db tendermint/tendermint#4520

Closed

golangcibot reviewed Mar 3, 2020

View reviewed changes

backend_test.go Outdated Show resolved Hide resolved

mem_db.go Outdated Show resolved Hide resolved

erikgrinaker added 3 commits March 3, 2020 19:35

Appease linter

f253ebd

Minor tweaks

5fe3042

Added range scan benchmark

3fa3c74

erikgrinaker removed the S:wip Status: Work In Progress label Mar 3, 2020

erikgrinaker marked this pull request as ready for review March 3, 2020 21:14

erikgrinaker requested review from melekes and tessr as code owners March 3, 2020 21:14

melekes reviewed Mar 4, 2020

View reviewed changes

common_test.go Show resolved Hide resolved

common_test.go Show resolved Hide resolved

mem_db.go Outdated Show resolved Hide resolved

mem_db.go Outdated Show resolved Hide resolved

erikgrinaker added 3 commits March 4, 2020 10:44

Added constants for MemDB parameters

f919587

Added performance comments in tests

3a9fb9a

Use a Mutex rather than RWMutex for strict backwards compatibility

2b2bff6

erikgrinaker mentioned this pull request Mar 4, 2020

memdb: API cleanups and improvements #56

Merged

melekes reviewed Mar 4, 2020

View reviewed changes

common_test.go Outdated Show resolved Hide resolved

melekes approved these changes Mar 4, 2020

View reviewed changes

Use b.Fatal() instead of require.NoError()

c71e173

Updated changelog

471cafd

erikgrinaker merged commit a2b9135 into master Mar 9, 2020

erikgrinaker deleted the erik/memdb-btree branch March 9, 2020 15:22

erikgrinaker mentioned this pull request Mar 10, 2020

Fix concurrent database access when deleting orphans cosmos/iavl#219

Merged

faddat pushed a commit to faddat/tm-db that referenced this pull request Feb 21, 2024

Create SECURITY.md (tendermint#53)

317cc9f

* Create SECURITY.md * Update SECURITY.md * Apply suggestions from code review --------- Co-authored-by: Thane Thomson <connect@thanethomson.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

memdb: use btree for storage#53

memdb: use btree for storage#53
erikgrinaker merged 9 commits intomasterfrom
erik/memdb-btree

erikgrinaker commented Mar 3, 2020

Uh oh!

Uh oh!

Uh oh!

erikgrinaker commented Mar 3, 2020

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

melekes commented Mar 4, 2020

Uh oh!

erikgrinaker commented Mar 9, 2020

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

erikgrinaker commented Mar 3, 2020

Uh oh!

Uh oh!

Uh oh!

erikgrinaker commented Mar 3, 2020

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

melekes commented Mar 4, 2020

Uh oh!

erikgrinaker commented Mar 9, 2020

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants