Releases: openvpi/dataset-tools
Releases · openvpi/dataset-tools
hfa-v5-cpu
Python版HubertFA
HfaModel_new_dict (ds-zh-pinyin-lite)
附词典迁移脚本,详见 Migrate CSV Transcription Files
HfaModel_old_dict (opencpop-expression)
将1218_hfa_model_new_dict.zip解压至Dataset-tool根目录,文件夹改名为hfa_model
Dataset-tool
└── hfa_model
├── *.onnx
└── *.json
wav文件拖放到界面,勾选AP/EP(推荐只选AP),选择语言,runHfa
wav_folder
├── x_001.wav
└── x_001.lab (与wav同名的lab,内容为"ce shi wen jian",空格隔开的拼音)
SomeModel
将some_model.zip中的some_model文件夹拖放至Dataset-tool根目录即可(结构层次为Dataset-tool/some_model/model.onnx),fbl_model文件夹包括model.onnx文件。
也可使用其他版本的some onnx:
input:
waveform: float32[1,n_samples]
output:
note_midi: float32[1,n_notes]
note_rest: boolean[1,n_notes]
note_dur: float32[1,n_notes]
AsrModel
LyricFA目前仅支持中文。
Paraformer模型出自阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-onnx。
本仓库仅添加了vocab.txt(funasr导出onnx时生成)。
将model.zip中的model文件夹拖放至Dataset-tool根目录即可(结构层次为Dataset-tool/model/model.onnx),model文件夹包括model.onnx、vocab.txt两个文件。