UVR - MaHivka/ultimate-voice-models-FAQ GitHub Wiki

UVR

UVR (Ultimate Vocal Remover) - ИИ для разделения вокала и инструментала, использующий глубокое обучение.

Установка

  1. В релизах UVR листаете ниже и выбираете версию под вашу ОС
  2. Запустите установщик UVR
  3. Выполните процедуру установки
  4. Запустите UVR

Общие настройки

  • Select Input - Файл из которого вы хотите получить вокал и/или инструментал
  • Select Output - Директория, в которую нужно поместить разделенные файлы
  • Choose process method - Выбор нейросети
  • Choose {method} model - Модель, которую вы используете (method указывается согласно выбранной нейросети)
  • Select saved settings - Позволяет открыть все сохраненные настройки или сохранить текущие настройки приложения

VR Architecture

  • Window size - Балансировка качества и скорости
    • 320 - лучшее качество конвертации
    • 512 - среднее качество конвертации, среднее время конвертации
    • 1024 - низкое качество конвертации, минимальное время конвертации

  • Aggression setting - При более высоких значениях производится более глубокая экстракция, но может повлиять на конечный результат
    • Диапазон составляет 0-100
    • При больших значениях происходит более глубокое извлечение
    • Значения более 10 могут привести к мутному звучанию инструментала

MDX-Net

  • Batch Size - Большие значения используют больше RAM, но скорость будет чуть быстрее и наоборот
    • Значение не влияет на качество вывода

  • Volume Compensation - Компенсирует первичный звук, чтобы обеспечить лучшее звучание вторичного

MDX23C

  • Segment Size - Меньшие значения занимают меньше времени и ресурсов, а большие - больше, но возможны результаты получше

  • Overlap - То же самое, но значения выше точно дадут результат лучше

Demucs

  • Choose Stem(s) - Что будет извлечено в конечном итоге
    • All Stems - Извлекает все
    • Vocals - Извлечение вокала
    • Other - Извлечение всего, что не может извлечь модель
    • Bass - Извлечение баса
    • Drums - Извлечение барабанов

  • Segment - Чем больше значение, тем больше использование RAM или V-RAM и быстрее скорость и наоборот

Ensemble Mode

Позволяет использовать несколько ИИ и моделей сразу, может пригодится для экономии времени

  • Main Stem Pair - Это то, что вы хотите получить в конечном итоге (Первичное/Вторичное)
    • Vocals/Instrumental - Вокал/Инструментал
    • Other/No Other - Иное (то что не может обработать ИИ)/Не иное
    • Bass/No Bass - Бас/Не бас
    • Drums/No Drums - Барабаны/Не барабаны
    • 4 Stem Ensemble - Эта опция соберет все модели Demucs и объединит их в ансамбль.

  • Ensemble Algorithm - Позволяет выбрать алгоритм ансамбля, который будет использоваться для получения конечного результата.
    • Max Spec - этот алгоритм объединяет конечные результаты и генерирует из них максимально возможный выход
    • Min Spec - этот алгоритм объединяет результаты и генерирует из них минимально возможный выходной сигнал
    • Average - этот алгоритм объединяет результаты и усредняет их

  • Available Models - Список всех моделей, доступных для выбранной пары в Main Stem Pair

Разделение вокала и инструментала

  1. Укажите нужный файл в Select Input
  2. Укажите выходную директорию в Select Output
  3. Выберите нужный метод в Choose process method и нужные опции
  4. Нажмите кнопку Start Processing

Рекомендации для каверов

Данные рекомендации очень сильно пригодятся вам, если вы захотите сделать кавер при помощи RVC

Рекомендованные модели

Структура модели в Download Center: {название ИИ}:{название модели} (пример: VR Arch Single Model v5: 5_HP-Karaoke)
Сразу скажу, что в рекомендованных моделях указаны только их названия

для VR Architecture

  1. 5_HP-Karaoke/6_HP-Karaoke - Модель для разделения разных голосов*
  2. DeEcho-DeReverb - Модель для удаления реверберации и эха*
  3. DeEchoNormal - Модель для удаления эха (вроде чуть лучше работает с эхом)*
  4. DeEchoAggressive - Модель для удаления эха(крайне сильная)*

для MDX-Net

  1. UVR-MDX-NET Voc FT - Модель для разделения вокала
  2. UVR-MDX-NET Inst HQ 3 - Модель для разделения инструментала
  3. MDX23C-InstVoc HQ - Модель для разделения вокала и инструментала со своей спецификой
    • Она работает лучше других только в том случае, если значение параметра Overlap больше 8
    • Намного потребительнее других моделей, для обычных целей лучше использовать Voc FT и Inst HQ 3
    • Не обрезает частоты до 16-18к, а делает все 22к и выше (плюс)

* - Если в песне имеется данный эффект, то он может очень сильно повлиять на качество итогового аудио

Установка моделей

  1. Нажмите на кнопку с гаечным ключом
  2. Перейдите на вкладку Download Center
  3. Выберите нужный метод
  4. В выпадающем меню выберите нужную модель
  5. Нажмите на кнопку загрузки (на ней нет текста)
  6. Ждите окончания загрузки

Доп. информация


Дата последнего обновления: 11.02.2024 (ДД.ММ.ГГГГ)
Специальное спасибо Электроебану за предоставление информации

⚠️ **GitHub.com Fallback** ⚠️