UGENE - ryavorsky/RuBioMed GitHub Wiki
UGENE — свободное биоинформационное программное обеспечение.
UGENE может работать на персональном компьютере с Windows, Mac OS X или Linux.
UGENE предоставляет графический интерфейс для работы с последовательностями, аннотациями, множественными выравниваниями, филогенетическими деревьями, данными Секвенирование (NGS) и т.д. Данные могут храниться как локально (на персональном компьютере), так и в общем хранилище (в базе данных лаборатории).
В состав UGENE включены десятки популярных биоинформационных алгоритмов и инструментов, а также собственные разработки для работы с этими данными в контексте геномика, эволюционная биология, вирусологии и других дисциплин. Для всех инструментов также предоставляется графический интерфейс, что облегчает анализ этих данных биологами без опыта программирования.
UGENE предоставляет возможность потокового анализа большого количества данных с помощью “Дизайнера вычислительных схем”. Вычислительная схема при этом составляется из различных блоков: считывания данных, применения встроенных алгоритмов/инструментов, записи данных. При необходимости, в схему могут быть добавлены блоки произвольных инструментов командной строки, скриптовые блоки и т. п. В дизайнере имеются уже готовые примеры схем (для аннотирования последовательностей, конвертирования форматов, анализа данных секвенирования и другие).
Помимо графического интерфейса UGENE предоставляет интерфейс командной строки. В частности, составленная в дизайнере вычислительная схема также может быть запущена из командной строки.
Чтобы обеспечить максимальное быстродействие вычислений, UGENE использует возможности многоядерных ЦПУ и графических процессоров для оптимизации некоторых вычислительных задач.
Основные возможности
Создание, редактирование и аннотирование нуклеотидных и белковых последовательностей.
Быстрый поиск в последовательности
Множественное выравнивание последовательностей: ClustalW, ClustalO, MUSCLE, Kalign, MAFFT, T-Coffee
Создание и редактирование биоинформационной базы данных с общим доступом
Поиск в онлайн базах данных: NCBI, PDB, UniProtKB/Swiss-Prot, UniProtKB/TrEMBL, серверы DAS
Онлайн и локальный BLAST поиск
Поиск открытых рамок считывания
Рестрикционный анализ со встроенной базой данных ферментов рестрикции REBASE
Интегрированный пакет Primer3 для дизайна ПЦР праймеров
Аннотирование плазмид
Клонирование in silico
Выравнивание на геном с помощью Bowtie, BWA или UGENE Genome Aligner
Визуализация выравненных коротких прочтений с помощью UGENE Assembly Browser
Поиск геномных вариаций с помощью SAMtools
Обработка сырых данных NGS
Анализ RNA-Seq данных с помощью TopHat и инструментов Cufflinks
Анализ ChIP-Seq данных с помощью MACS, CEAS и других инструментов
Поиск гомологов с HMMER2 и HMMER3
Работа с хроматограммами
Поиск сайтов связывания транскрипционных факторов с использованием весовых матриц или алгоритма SITECON
Поиск повторов в последовательности ДНК: прямых, обратных, тандемных
Локальное выравнивание последовательности с использованием оптимизированной версии алгоритма Смита-Ватермана
Построение филогенетических деревьев (с помощью PHYLIP Neighbor Joining, MrBayes или PhyML Maximum Likelyhood) и редактирование деревьев
Комбинирование различных алгоритмов в вычислительную схему с помощью Дизайнера вычислительных схем
Сборки контигов (CAP3)
Отображение 3D структуры белков для форматов PDB и MMDB formats, поддержка стереоэффекта
Предсказание вторичной структуры белка с помощью алгоритмов GOR IV и PSIPRED
Конструирование точечных графиков для ДНК последовательностей
Выравнивание мРНК (Spidey)
Поиск комплексных сигналов с ExpertDiscovery
Поиск шаблона результатов различных алгоритмов в нуклеотидной последовательности с помощью дизайнера запросов