Programação em R - lmigueel/Bioinformatica GitHub Wiki
Linguagem R
R é a principal linguagem para análises estatísticas e, ao lado do Python, para análise de dados. R é uma linguagem de programação e ambiente de software livre para computação estatística e gráficos com suporte da R Foundation for Statistical Computing.
O RStudio oferece ferramentas gratuitas e de código aberto para software profissional pronto para R e corporativo para equipes de ciência de dados desenvolverem e compartilharem seu trabalho em escala. Um software maravilhoso!
Instalação
A instalação do R você pode fazer por:
Download R: https://cran.r-project.org/bin/windows/base/
Pode escolher o servidor da USP - Brazil quando executar.
Download Rstudio Desktop (instalar após o R): https://rstudio.com/products/rstudio/download/
Se você possui uma versão do Windows antiga, cuidado que o R.4.0 pode ser que dê erro na execução. Então teria que instalar um R mais antigo (gosto do 3.6.3 - https://cran.r-project.org/bin/windows/base/old/).
==========================================================================
Aos usuários Mac. Segue:
Binário do R: https://cran.r-project.org/bin/macosx/
Rstudio basta você escolher a versão desktop do Mac:
https://www.rstudio.com/products/rstudio/download/ " macOS 10.13+"
Caso você não tenha essa versão do MacOS, você pode pegar aqui versões do Rstudio antes do 1.4: https://www.rstudio.com/products/rstudio/older-versions/
Dicas para programação em R
O site STHDA é o melhor para conteúdo de estatística com R.
Comece por aqui: http://www.sthda.com/english/wiki/r-basics-quick-and-easy
Depois, no painel de cima do site (ao lado de Home), você pode ir avançando em Data/Visualize/Analyze ...
O canal da Fernanda no Youtube é um bom começo em análises estatísticas no R. Recomendo fazer ele TODO!
https://www.youtube.com/watch?v=WVogdSlk7gY&list=PLOw62cBQ5j9VE9X4cCCfFMjW_hhEAJUhU
E depois começar um curso no DataCamp no Youtube. Você pode até fazer antes.
https://www.youtube.com/watch?v=SWxoJqTqo08&list=PLjgj6kdf_snYBkIsWQYcYtUZiDpam7ygg
======================================
De modo geral, você tem que aprender, nesta ordem:
- R básico - variáveis e loops
http://www.sthda.com/english/wiki/r-basics-quick-and-easy
- Estatística básica (media, mediana, moda, desvio padrão, boxplots, Até a seção 15.2.2
https://bookdown.org/mikemahoney218/LectureBook/basic-statistics-using-r.html
- shapiro.test()
http://www.sthda.com/english/wiki/normality-test-in-r
- manipulação de datasets
https://www.datanovia.com/en/courses/data-manipulation-in-r/
- leitura de arquivos
https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/R/R1_GettingStarted/R1_GettingStarted8.html
- limpeza de dados e outliers
https://dataanalyticsedge.com/2018/05/02/data-cleaning-using-r/
- Dplyr e Tidyverse
https://livro.curso-r.com/7-2-dplyr.html
- Funções
https://www.tutorialspoint.com/r/r_functions.htm
- ggplot - gráficos
http://r-statistics.co/ggplot2-Tutorial-With-R.html
- teste-t
http://www.sthda.com/english/wiki/unpaired-two-samples-t-test-in-r
- ANOVAs
http://www.sthda.com/english/wiki/one-way-anova-test-in-r
- Testes não paramétricos
http://www.sthda.com/english/wiki/kruskal-wallis-test-in-r https://www.datanovia.com/en/lessons/wilcoxon-test-in-r/
- Regressão linear e múltipla
http://www.sthda.com/english/articles/40-regression-analysis/167-simple-linear-regression-in-r/
- heatmaps
https://www.datanovia.com/en/lessons/heatmap-in-r-static-and-interactive-visualization/
- dendrograma
- clustering (kmeans)
https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/
- Principal Component Analysis (PCA)
Espero ter ajudado!