Портативное улучшение и суперразрешение аудио для Windows — LavaSR, установка в один клик, 100% офлайн.
Портативная русская версия LavaSR — ультрабыстрой модели улучшения речи.
- Повышение частоты дискретизации — апсемплинг с 8-48 кГц до чистых 48 кГц
- Шумоподавление — удаление фонового шума из речи
- Пакетная обработка — обработка множества файлов за раз с сохранением в output/
- Запись с микрофона — улучшение записи в реальном времени
- Полная изоляция — ничего не устанавливается в систему
- Поддержка GPU и CPU — NVIDIA GTX 10xx и новее, или CPU
| Параметр | Требование |
|---|---|
| ОС | Windows 10/11 (64-bit) |
| GPU | NVIDIA GTX 10xx+ (рекомендуется) или CPU |
| VRAM | ~500 МБ |
| ОЗУ | 4 ГБ+ |
| Диск | ~2 ГБ (Python + зависимости + модель) |
| Интернет | Для первой установки и загрузки модели |
| Серия | Архитектура | CUDA |
|---|---|---|
| GTX 10xx | Pascal | 11.8 |
| RTX 20xx | Turing | 11.8 |
| RTX 30xx | Ampere | 12.6 |
| RTX 40xx | Ada Lovelace | 12.8 |
| RTX 50xx | Blackwell | 12.8 |
-
Скачайте или клонируйте репозиторий:
git clone <URL_РЕПОЗИТОРИЯ>Или скачайте ZIP-архив и распакуйте.
-
Запустите установщик:
install.batСледуйте инструкциям — выберите вашу видеокарту, всё остальное автоматически.
-
Для запуска используйте:
run.batИнтерфейс откроется в браузере автоматически по адресу http://127.0.0.1:7860
- Запустите
run.bat - Загрузите аудиофайл или запишите с микрофона
- Настройте параметры (частота дискретизации, шумоподавление)
- Нажмите «Улучшить аудио»
- Прослушайте результат и сохраните при необходимости
WAV, MP3, FLAC, OGG, M4A и другие (через librosa/ffmpeg)
LavaSR_portable_ru/
├── app.py # Приложение
├── install.bat # Установщик
├── run.bat # Запуск
├── update.bat # Обновление
├── requirements.txt # Зависимости
├── python/ # Портативный Python (создаётся при установке)
├── models/ # Кэш моделей HuggingFace (создаётся при установке)
├── ffmpeg/ # Портативный FFmpeg (создаётся при установке)
├── output/ # Сохранённые результаты
├── temp/ # Временные файлы
└── cache/ # Кэш
Приложение полностью изолировано от системы:
- Портативный Python (не требует установки)
- Все кэши (HuggingFace, PyTorch, temp) хранятся локально
- Ничего не записывается в системные папки пользователя
- Можно перенести на USB-накопитель
Ошибка «CUDA out of memory»:
- Закройте другие приложения, использующие GPU
- Попробуйте переустановить с выбором CPU
Ошибка при загрузке модели:
- Проверьте интернет-соединение
- Удалите папку
models/и запустите заново
Не открывается браузер:
- Откройте http://127.0.0.1:7860 вручную
Ошибка установки PyTorch:
- Обновите драйверы NVIDIA
- Переустановите с другой версией CUDA
| Устройство | Скорость |
|---|---|
| GPU (NVIDIA) | ~5000x реального времени |
| CPU | ~60x реального времени |
Размер модели: ~50 МБ, потребление VRAM: ~500 МБ.
- LavaSR — оригинальная модель (Yatharth Sharma)
- Vocos — нейровокодер
- UL-UNAS — архитектура шумоподавления
Apache 2.0 (следует лицензии оригинального LavaSR)
Другие проекты @timoncool
| Проект | Описание |
|---|---|
| ACE-Step Studio | AI-студия музыки — песни, вокал, каверы, клипы |
| Foundation Music Lab | Генерация музыки + редактор таймлайна |
| VibeVoice ASR | Портативное распознавание речи |
| Qwen3-TTS | Портативный TTS с клонированием голоса |
| SuperCaption Qwen3-VL | Портативное описание изображений |
| VideoSOS | AI-видеопродакшн в браузере |
- Nerual Dreming (t.me/nerual_dreming) — neuro-cartel.com | основатель ArtGeneration.me
- Нейро-Софт (t.me/neuroport) — репаки и портативки нейросетей
Я создаю опенсорс софт и занимаюсь исследованиями в области ИИ. Большая часть всего, что я делаю, находится в открытом доступе. Ваши пожертвования позволяют мне создавать и исследовать больше, не отвлекаясь на поиск еды для продолжения существования =)
Все способы поддержки | dalink.to/nerual_dreming | boosty.to/neuro_art
- BTC:
1E7dHL22RpyhJGVpcvKdbyZgksSYkYeEBC - ETH (ERC20):
0xb5db65adf478983186d4897ba92fe2c25c594a0c - USDT (TRC20):
TQST9Lp2TjK6FiVkn4fwfGUee7NmkxEE7C