Skip to content

Releases: openvpi/dataset-tools

hfa-v5-cpu

17 Jan 09:57

Choose a tag to compare

Python版HubertFA

HfaModel_new_dict (ds-zh-pinyin-lite)
附词典迁移脚本,详见 Migrate CSV Transcription Files

HfaModel_old_dict (opencpop-expression)

将1218_hfa_model_new_dict.zip解压至Dataset-tool根目录,文件夹改名为hfa_model

   Dataset-tool
   └── hfa_model
       ├── *.onnx
       └── *.json

wav文件拖放到界面,勾选AP/EP(推荐只选AP),选择语言,runHfa

   wav_folder
       ├── x_001.wav
       └── x_001.lab (与wav同名的lab,内容为"ce shi wen jian",空格隔开的拼音)

SomeModel

18 Mar 15:31

Choose a tag to compare

将some_model.zip中的some_model文件夹拖放至Dataset-tool根目录即可(结构层次为Dataset-tool/some_model/model.onnx),fbl_model文件夹包括model.onnx文件。

也可使用其他版本的some onnx:
input:
waveform: float32[1,n_samples]
output:
note_midi: float32[1,n_notes]
note_rest: boolean[1,n_notes]
note_dur: float32[1,n_notes]

AsrModel

20 Apr 11:55

Choose a tag to compare

LyricFA目前仅支持中文。

Paraformer模型出自阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-onnx
本仓库仅添加了vocab.txt(funasr导出onnx时生成)。

将model.zip中的model文件夹拖放至Dataset-tool根目录即可(结构层次为Dataset-tool/model/model.onnx),model文件夹包括model.onnx、vocab.txt两个文件。