Programação em R - lmigueel/Bioinformatica GitHub Wiki

Linguagem R

R é a principal linguagem para análises estatísticas e, ao lado do Python, para análise de dados. R é uma linguagem de programação e ambiente de software livre para computação estatística e gráficos com suporte da R Foundation for Statistical Computing.

O RStudio oferece ferramentas gratuitas e de código aberto para software profissional pronto para R e corporativo para equipes de ciência de dados desenvolverem e compartilharem seu trabalho em escala. Um software maravilhoso!

Instalação

A instalação do R você pode fazer por:

Download R: https://cran.r-project.org/bin/windows/base/

Pode escolher o servidor da USP - Brazil quando executar.

Download Rstudio Desktop (instalar após o R): https://rstudio.com/products/rstudio/download/

Se você possui uma versão do Windows antiga, cuidado que o R.4.0 pode ser que dê erro na execução. Então teria que instalar um R mais antigo (gosto do 3.6.3 - https://cran.r-project.org/bin/windows/base/old/).

==========================================================================

Aos usuários Mac. Segue:

Binário do R: https://cran.r-project.org/bin/macosx/

Rstudio basta você escolher a versão desktop do Mac:

https://www.rstudio.com/products/rstudio/download/ " macOS 10.13+"

Caso você não tenha essa versão do MacOS, você pode pegar aqui versões do Rstudio antes do 1.4: https://www.rstudio.com/products/rstudio/older-versions/

Dicas para programação em R

O site STHDA é o melhor para conteúdo de estatística com R.

Comece por aqui: http://www.sthda.com/english/wiki/r-basics-quick-and-easy

Depois, no painel de cima do site (ao lado de Home), você pode ir avançando em Data/Visualize/Analyze ...

O canal da Fernanda no Youtube é um bom começo em análises estatísticas no R. Recomendo fazer ele TODO!

https://www.youtube.com/watch?v=WVogdSlk7gY&list=PLOw62cBQ5j9VE9X4cCCfFMjW_hhEAJUhU

E depois começar um curso no DataCamp no Youtube. Você pode até fazer antes.

https://www.youtube.com/watch?v=SWxoJqTqo08&list=PLjgj6kdf_snYBkIsWQYcYtUZiDpam7ygg

======================================

De modo geral, você tem que aprender, nesta ordem:

  1. R básico - variáveis e loops

http://www.sthda.com/english/wiki/r-basics-quick-and-easy

  1. Estatística básica (media, mediana, moda, desvio padrão, boxplots, Até a seção 15.2.2

https://bookdown.org/mikemahoney218/LectureBook/basic-statistics-using-r.html

  1. shapiro.test()

http://www.sthda.com/english/wiki/normality-test-in-r

  1. manipulação de datasets

https://www.datanovia.com/en/courses/data-manipulation-in-r/

  1. leitura de arquivos

https://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/R/R1_GettingStarted/R1_GettingStarted8.html

  1. limpeza de dados e outliers

https://dataanalyticsedge.com/2018/05/02/data-cleaning-using-r/

  1. Dplyr e Tidyverse

https://livro.curso-r.com/7-2-dplyr.html

  1. Funções

https://www.tutorialspoint.com/r/r_functions.htm

  1. ggplot - gráficos

http://r-statistics.co/ggplot2-Tutorial-With-R.html

  1. teste-t

http://www.sthda.com/english/wiki/unpaired-two-samples-t-test-in-r

  1. ANOVAs

http://www.sthda.com/english/wiki/one-way-anova-test-in-r

  1. Testes não paramétricos

http://www.sthda.com/english/wiki/kruskal-wallis-test-in-r https://www.datanovia.com/en/lessons/wilcoxon-test-in-r/

  1. Regressão linear e múltipla

http://www.sthda.com/english/articles/40-regression-analysis/167-simple-linear-regression-in-r/

  1. heatmaps

https://www.datanovia.com/en/lessons/heatmap-in-r-static-and-interactive-visualization/

  1. dendrograma

http://www.sthda.com/english/wiki/beautiful-dendrogram-visualizations-in-r-5-must-known-methods-unsupervised-machine-learning

  1. clustering (kmeans)

https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/

  1. Principal Component Analysis (PCA)

http://www.sthda.com/english/articles/31-principal-component-methods-in-r-practical-guide/118-principal-component-analysis-in-r-prcomp-vs-princomp/

Espero ter ajudado!