Рецепты - это скрипты, которые выполняют некие работы в соответствии с тем, что описано в выбранной конфигурации.

Рецепт `compose_dataset`

Данный рецепт вызывает скрипт compose_dataset.py, который предназначен для автоматизации процесса подготовки данных для обучения моделей машинного обучения. Этот скрипт загружает датасеты из различных источников, конвертирует их в необходимый формат, токенизирует и фильтрует дубликаты, а затем сохраняет готовые данные в файлы для дальнейшего использования.

Рецепт выполняет следующие шаги:

Читает параметры из YAML файла, который определяет источники данных, методы преобразования и другие настройки.
Загружает токенизатор, используя библиотеку transformers для последующей токенизации текстовых данных. Если у токенизатора нет шаблона чата, используется стандартный.
Использует библиотеку datasets для загрузки датасетов из различных источников, указанных в конфигурации.
Применяет пользовательские функции преобразования (если они указаны в конфигурации) и токенизирует текстовые данные.
Использует технику MinHash для удаления дубликатов среди загруженных записей.
Делит готовые данные на два набора - тренировочный и валидационный, сохраняя их в указанные файлы.

Запустить его можно следующим образом:

impruver run compose_dataset \
  --config <путь_к_конфигурационному_файлу>
  --train_path=<путь_до_файла_с_тренировочными_данными> \
  --val_path=<путь_до_файла_с_валидационными_данными>

Параметры:

config - (обязательный) путь к YAML файлу с конфигурацией.
train_path - (опционально) путь до JSONL-файла, в который будут сохранены тренировочные данные.
val_path - (опционально) путь до JSONL-файла, в который будут сохранены валидационные данные.

Пример использования:

impruver run compose_dataset --config ruGPT-3.5/13B_lora_saiga2.yaml

Или если конфигурация в файле:

impruver run compose_dataset --config ./rugpt35_lora_saiga2.yaml

Рецепты `finetune` и `unsloth`

Рецепт finetune вызывает скрипт finetune_transformers.py, а рецепт unsloth - finetune_unsloth.py.

Оба этих скрипта предназначены для тонкой настройки предобученной модели с использованием собственных данных. Они позволяют дообучить параметры существующей модели или же обучать модель с нуля. Оба скрипта поддерживают возможность использования Low-Rank Adaptation (LoRA) для обучения адаптеров.

Рецепты выполняет следующие шаги:

Получить путь к файлу конфигурации, который содержит все необходимые параметры для запуска и настройки модели.
Токенизатор подгружается из предобученной модели и сохраняется в output_put.
Данные для тренировки и валидации загружаются из JSONL-файлов. Порядок элементов в тренировочном наборе случайно перемешивается (с учётом значения seed). Используется DataCollatorForTokenClassification для добавления токенов заполнения.
Модель загружается из предобученной или инициализируется с нуля на основе конфигурации. Если включена поддержка LoRA, добавляются соответствующие адаптеры.
Конфигурируется объект TrainingArguments для управления процессом обучения. Создается и инициализируется объект Trainer, который управляет циклом обучения.
Запускается основной цикл обучения, в котором модель обучается на предоставленных данных.
После завершения обучения модель и все связанные с ней конфигурации сохраняются в указанную директорию вывода.

Запустить его можно следующим образом:

impruver run finetune \
  --config <путь_к_конфигурационному_файлу>
  --train_path=<путь_до_файла_с_тренировочными_данными> \
  --val_path=<путь_до_файла_с_валидационными_данными> \
  --output_dir=<путь_к_директории_с_весами_модели> \
  --report_to=<куда_шлём_отчёт> \
  --seed=<сеем_сеем_посеваем>

Параметры:

config - Путь к YAML-файлу с конфигурацией.
train_path - (опционально) путь до JSONL-файла, из которого будут прочитаны тренировочные данные.
val_path - (опционально) путь до JSONL-файла, из которого будут прочитаны валидационные данные.
output_dir - (опционально) путь к директории, в которой будут сохранены веса и конфигурации обученной модели.
report_to - (опционально) куда слать отчёт, на данный момент доступно только wandb, если ничего не указать, то отчёт никуда не отправляется. По умолчанию отключено.
seed - (опционально) семя для фиксации рандомизатора, чтобы результаты были воспроизводимые. По умолчанию 42.

Пример использования:

impruver run finetune --config ruGPT-3.5/13B_lora_saiga2.yaml

Или если конфигурация в файле:

impruver run finetune --config ./rugpt35_lora_saiga2.yaml

Рецепт `convert_gguf`

Данный рецепт вызывает скрипт convert_gguf.py для преобразования обученной модели PyTorch в формат GGUF. Если конфигурация содержит настройки используемы для обучения LoRA-адаптер (Low-Rank Adaptation), тогда рецепт сначала объединяет адаптер с моделью (мерджит), а затем выполняет преобразование в GGUF. После преобразования модель квантуется до указанных уровней, и генерируются файлы конфигурации для импорта моделей в Ollama.

Принимает путь к файлу конфигурации, который содержит все необходимые параметры для запуска и конвертации модели.
Конвертирует модель в формат GGUF, используя скрипт преобразования из каталога проекта llama.cpp, затем генерирует файл конфигурации Modelfile.f16 для модели GGUF FP16.
Для каждого заданного уровня квантования данный рецепт:
- Квантует модель с помощью двоичного файла llama-quantize (предполагается, что вы его уже скомпилировали заранее)
- Генерирует соответствующий файл конфигурации Modelfile.qX_Y для каждой квантованной модели.

Пример использования:

impruver run convert_gguf --config ruGPT-3.5/13B_lora_saiga2.yaml

Или если конфигурация в файле:

impruver run convert_gguf --config ./rugpt35_lora_saiga2.yaml

Результат будет в директории <output_dir>/gguf.

Рецепт `chat`

Данный рецепт вызывает скрипт chat_transformers.py, который позволяет вести чат с предобученной языковой моделью.

Рецепт выполняет следующие шаги:

Считывает настройки из YAML-файла.
Создает объекты для токенизации текста и работы с моделью, учитывая параметры квантизации и оптимизаций (LoRA).
Ведет бесконечный цикл общения, где пользователь вводит сообщения, а модель генерирует ответы.
Хранит ограниченное количество предыдущих сообщений для использования в контексте текущего разговора.

Параметры:

config - Путь к YAML-файлу с конфигурацией.
output_dir - (опционально) Директория, где хранится модель и токенизатор.
history_limit - (опционально) Максимальное количество предыдущих сообщений в истории чата.
system_prompt - (опционально) Системный промпт для модели.
seed - (опционально) Значение для генерации случайных чисел.
max_new_tokens, repetition_penalty, do_sample, temperature, top_p, top_k- (опционально) Параметры генерации текста.

Пример использования:

impruver run chat --config ruGPT-3.5/13B_lora_saiga2.yaml

Или если конфигурация в файле:

impruver run chat --config ./rugpt35_lora_saiga2.yaml

Запустится интерактивная оболочка чата, для того чтобы выйти из неё, используйте комбинацию клавиш Ctrl+D или Ctrl+C.

Рецепты - EvilFreelancer/impruver GitHub Wiki

Рецепт `compose_dataset`

Рецепты `finetune` и `unsloth`

Рецепт `convert_gguf`

Рецепт `chat`

⚠️ GitHub.com Fallback ⚠️

Рецепты - EvilFreelancer/impruver GitHub Wiki

Рецепт compose_dataset

Рецепты finetune и unsloth

Рецепт convert_gguf

Рецепт chat

⚠️ **GitHub.com Fallback** ⚠️

Рецепт `compose_dataset`

Рецепты `finetune` и `unsloth`

Рецепт `convert_gguf`

Рецепт `chat`

⚠️ GitHub.com Fallback ⚠️