Fundamentos de estatistica - RuiOrey/Stats-studies GitHub Wiki
#Fundamentos ##Estatistica inferencial
Estatistica inferencial é o acto de usar os dados observados para concluir as propriedades e caracteristicas desconhecidas da distribuição de probabilidade da qual os dados foram recolhidos. O conjunto de dados usado para fazer inferencia chama-se amostra.
###Amostras No caso mais simples, observamos as realizações (valor atribuido a uma variavel aleatória) x1,x2,...,xn das variaveis aleatorias independentes X1,X2,...,XN como tendo uma função de distribuição em comum FX(x) e usamos as realizações observadas para inferir algumas caracteristicas da distribuição Fx(X). Abusando da linguagem, costuma-se dizer "n realizações independentes da variavel aleatória X".
Exemplo O tempo de vida de um determinado dispositivo electrónico é dado por uma variável aleatória X, cuja função de distribuição Fx(x) é desconhecida. Supondo que se observou independentemente 10 tempos de vida de componentes. Chamemos essas realizações de x1,x2,...,xn. Estamos interessados no valor esperado, E[X], que é uma caracteristica desconhecida de Fx. Infere-se E[X] dos dados, usando a media amostral. Neste simples caso, as realizações são a amostra e E[X] é a quantidade acerca da qual se está a fazer inferencia estatistica.
Embora no caso mais simples, X1,X2,...,XN são variáveis aleatórias independentes, nem sempre isso pode ocorrer. Por exemplo:
- X1,..., Xn não serem independentes;
- X1,..., Xn são vectores aleatórios (variável aleatória multidimensional);
- X1,..., Xn não tem uma distribuição de probabilidade comum. Existe uma definição de amostra que generaliza todos os casos gerais acima? Felizmente existe um e é extremamente simples:
Definição Uma amostra ζ é uma realização do vector aleatorio Ξ.
Quando a amostra é feita de n realizações de n variaveis aleatorias (ou vectores), diz-se que a amostra tem tamanho n (tamanho amostral n). Uma realização individual é chamada observação da amostra.
Modelos estatisticos
Na secção anterior definiu-se a amostra ζ como a realização de um vector Ξ tendo função de distribuição conjunta FΞ(ζ). A amostra ζ é usada para inferir algumas caracteristicas de FΞ(ζ) que não completamente conhecidas pelo estatistico. As propriedades e caracteristicas FΞ(ζ) que já são conhecidas ou assumidamente conhecidas antes de se observar a amostra chamam-se modelo para Ξ. Em termos matemáticos, um modelo para Ξ é um conjunto de funções de probabilidade desconhecida.