| A | B | C | D | E | F | G | H | I | J | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | AA | AB | ||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | This document is partially derived from compilations by Justin Salamon (https://bioacousticsdatasets.weebly.com/) and Dan Morris (https://lila.science/otherdatasets) For a complete list of machine learning-ready bioacoustics datasets, please refer to the excellent compilation by Céline Angonin (https://bioacoustic-ai.github.io/bioacoustics-datasets/) Questions/additions? Please contact Tessa Rhinehart (tessa.rhinehart@pitt.edu) | |||||||||||||||||||||||||||
2 | Dataset Name (link) | Publication | Source | Classes (e.g. bird species, non-bird species, "bird or not", sound type) | Number of bird species | Recording type | Weak or strong labeled | Audio files | Labels | Duration (hours) | Sites | Location | Comments | Summarized annotation file location | ||||||||||||||
3 | BirdVox-full-night | Lostanlen 2018 | NYU/Cornell | 2 | [detections only] | Continuous | Strong | 6 | 35,402 | 62 | 6 | Ithaca, NY, USA | Derivative datasets: BirdVox-70k, BirdVox-DCASE-20k; also included at least in part in BirdVox-ANAFCC and BirdVox-14SD | |||||||||||||||
4 | CLO-43SD | Salamon 2016 | NYU/Cornell | 43 | 43 | Clips | Strong | 5,428 | 5,428 | Ithaca, NY and New York, NY | Included at least in part in BirdVox-ANAFCC and BirdVox-14SD | |||||||||||||||||
5 | CLO-SWTH | Salamon 2016 | NYU/Cornell | 2 | 1 | Clips | Strong | 179,111 | 179,111 | Ithaca, NY and New York, NY | Included at least in part in BirdVox-ANAFCC and BirdVox-14SD | |||||||||||||||||
6 | CLO-WTSP | Salamon 2016 | NYU/Cornell | 2 | 1 | Clips | Strong | 16,703 | 16,703 | Ithaca, NY and New York, NY | Included at least in part in BirdVox-ANAFCC and BirdVox-14SD | |||||||||||||||||
7 | ff1010bird | Stowell 2018 | QMUL | 2 | [detections only] | Clips | Strong | 7,690 | 7,690 | 21.4 | ||||||||||||||||||
8 | NIPS4Bplus | Morfi 2019 | QMUL | 87 | 61 | Clips | Strong | 674 | 5,878 | 1 | 39 | Central France, Southern France, Spain | ||||||||||||||||
9 | PicidaeDataset | Vidaña-Vila 2017 | Universitat Ramon Llull | 13 | 7 | Clips | Strong | 1,669 | 1,669 | 1.4 | Source is Xeno-Canto | |||||||||||||||||
10 | warblrb10k | Stowell 2018 | QMUL | 2 | [detections only] | Clips | Strong | 8,000 | 8,000 | 22 | ||||||||||||||||||
11 | Powdermill | Chronister 2022 | University of Pittsburgh | 48 | Continuous | Strong | 4 | 16,052 | 6.4 | 4 | Rector, PA, USA | None; see /media/emu/datasets/annotated/pnre_ecy3329/annotation_Files for individual files | ||||||||||||||||
12 | Ithaca | Kahl 2022 | Cornell | 81 | Continuous | Strong | 50,760 | 285 | 30 | Ithaca, NY, USA | Used in BirdCLEF | /media/emu/datasets/annotated/cornell_ithaca/annotations.csv | "Species eBird Code" | |||||||||||||||
13 | Coffee Farms | Vega-Hidalgo 2023 | Cornell, Universidad de Costa Rica, Universidad de Antioquia | 89 | Continuous | Strong | 34 | 6,952 | 34 | Jardín, Colombia and San Ramon, Costa Rica | Used in BirdCLEF | /media/emu/datasets/annotated/cornell_coffeefarm/annotations.csv | ||||||||||||||||
14 | Sierra Nevada | Clapp 2023 | Cornell, IBP, NPS | 21 | Continuous | Strong | 100 | 10,296 | 16.7 | 10 | Sequoia & Kings Canyon NP, CA, USA | Used in BirdCLEF/Kaggle | /media/emu/datasets/annotated/cornell_sierranevada/annotations.csv | |||||||||||||||
15 | Southwestern Amazon Basin | Hopping 2022 | Cornell | 132 | Continuous | Strong | 21 | 14,798 | 21 | 7 | Inkaterra Reserva Amazonica, Madre de Dios, Peru | /media/emu/datasets/annotated/cornell_amazon/annotations.csv | ||||||||||||||||
16 | Western United States | Kahl 2022 | Cornell, San Jose State Research Foundation, University of Wisconsin-Madison | 56 | Continuous | Strong | 33 | 20,147 | 33 | Lassen and Plumas National Forests, CA, USA | Used in BirdCLEF 2021 | /media/emu/datasets/annotated/cornell_western/annotations.csv | ||||||||||||||||
17 | Hawaii | Navine 2022 | University of Hawai'i at Hilo, Cornell | 27 | Continuous | Strong | 59,583 | 51 | Hawai'i, USA | Used in BirdCLEF 2022 | /media/emu/datasets/annotated/cornell_hawaii/annotations.csv | |||||||||||||||||
18 | PNW | Weldy 2023 | Oregon State University, Google DeepMind, Conservation Metrics | 118 | 58 | Continuous | Strong | 141 | 39,717 | 11.75 | 525 | California, Oregon, & Washington | Includes township and range identifications, 38 environmental covariates, 215 partially annotated files, and ~1200 unlabeled recordings | |||||||||||||||
19 | ArcticBirdSounds | Christin 2023 | University of Moncton, ECCC, USFWS, Aaerhug University, McGill University | 49 | Continuous | Strong | 12,933 | 20 | 15 | Arctic from Alaska to Greenland | ||||||||||||||||||
20 | WildTrax | N/A | University of Alberta, many collaborators | Continuous, Clips | Strong | 750,000 | Worldwide, focus on Canada | Has 750,000 clips with first label | ||||||||||||||||||||
21 | Xeno-canto | N/A | Xeno-canto Foundation, Naturalis Biodiversity Center | Clips | Weak | N/A | Worldwide | |||||||||||||||||||||
22 | Macaulay Library | N/A | Cornell | Clips | Weak | N/A | Worldwide | |||||||||||||||||||||
23 | ||||||||||||||||||||||||||||
24 | ||||||||||||||||||||||||||||
25 | ||||||||||||||||||||||||||||
26 | ||||||||||||||||||||||||||||
27 | ||||||||||||||||||||||||||||
28 | ||||||||||||||||||||||||||||
29 | ||||||||||||||||||||||||||||
30 | ||||||||||||||||||||||||||||
31 | ||||||||||||||||||||||||||||
32 | ||||||||||||||||||||||||||||
33 | ||||||||||||||||||||||||||||
34 | ||||||||||||||||||||||||||||
35 | ||||||||||||||||||||||||||||
36 | ||||||||||||||||||||||||||||
37 | ||||||||||||||||||||||||||||
38 | ||||||||||||||||||||||||||||
39 | ||||||||||||||||||||||||||||
40 | ||||||||||||||||||||||||||||
41 | ||||||||||||||||||||||||||||
42 | ||||||||||||||||||||||||||||
43 | ||||||||||||||||||||||||||||
44 | ||||||||||||||||||||||||||||
45 | ||||||||||||||||||||||||||||
46 | ||||||||||||||||||||||||||||
47 | ||||||||||||||||||||||||||||
48 | ||||||||||||||||||||||||||||
49 | ||||||||||||||||||||||||||||
50 | ||||||||||||||||||||||||||||
51 | ||||||||||||||||||||||||||||
52 | ||||||||||||||||||||||||||||
53 | ||||||||||||||||||||||||||||
54 | ||||||||||||||||||||||||||||
55 | ||||||||||||||||||||||||||||
56 | ||||||||||||||||||||||||||||
57 | ||||||||||||||||||||||||||||
58 | ||||||||||||||||||||||||||||
59 | ||||||||||||||||||||||||||||
60 | ||||||||||||||||||||||||||||
61 | ||||||||||||||||||||||||||||
62 | ||||||||||||||||||||||||||||
63 | ||||||||||||||||||||||||||||
64 | ||||||||||||||||||||||||||||
65 | ||||||||||||||||||||||||||||
66 | ||||||||||||||||||||||||||||
67 | ||||||||||||||||||||||||||||
68 | ||||||||||||||||||||||||||||
69 | ||||||||||||||||||||||||||||
70 | ||||||||||||||||||||||||||||
71 | ||||||||||||||||||||||||||||
72 | ||||||||||||||||||||||||||||
73 | ||||||||||||||||||||||||||||
74 | ||||||||||||||||||||||||||||
75 | ||||||||||||||||||||||||||||
76 | ||||||||||||||||||||||||||||
77 | ||||||||||||||||||||||||||||
78 | ||||||||||||||||||||||||||||
79 | ||||||||||||||||||||||||||||
80 | ||||||||||||||||||||||||||||
81 | ||||||||||||||||||||||||||||
82 | ||||||||||||||||||||||||||||
83 | ||||||||||||||||||||||||||||
84 | ||||||||||||||||||||||||||||
85 | ||||||||||||||||||||||||||||
86 | ||||||||||||||||||||||||||||
87 | ||||||||||||||||||||||||||||
88 | ||||||||||||||||||||||||||||
89 | ||||||||||||||||||||||||||||
90 | ||||||||||||||||||||||||||||
91 | ||||||||||||||||||||||||||||
92 | ||||||||||||||||||||||||||||
93 | ||||||||||||||||||||||||||||
94 | ||||||||||||||||||||||||||||
95 | ||||||||||||||||||||||||||||
96 | ||||||||||||||||||||||||||||
97 | ||||||||||||||||||||||||||||
98 | ||||||||||||||||||||||||||||
99 | ||||||||||||||||||||||||||||
100 | ||||||||||||||||||||||||||||