INFERENCIA ESTADÍSTICA - bimasusi/bimasusi GitHub Wiki

📘 Bienvenida

¡Bienvenidas y bienvenidos a la wiki del curso Inferencia Estadística!
Este espacio reúne los contenidos, actividades, referencias y herramientas de apoyo para el desarrollo del curso dentro de la Maestría en Matemática Aplicada.

Aquí encontrarás documentación estructurada para facilitar tu comprensión, profundización y aplicación de los temas fundamentales de la inferencia estadística tanto en contextos teóricos como prácticos.


🧭 Objetivos del curso

  • Comprender los fundamentos teóricos de la inferencia estadística clásica.
  • Formular y contrastar hipótesis estadísticas en diversos contextos.
  • Aplicar métodos de estimación puntuales y por intervalos.
  • Analizar el comportamiento de estimadores y pruebas bajo diferentes supuestos.
  • Evaluar críticamente los alcances y limitaciones de los métodos inferenciales.

🧱 Estructura de contenidos

Índice General

1. Introducción

1.1 Datos y modelos

En esta sección establecemos la base conceptual para el análisis estadístico, diferenciando claramente entre el fenómeno aleatorio observado y la medida de probabilidad que lo describe.

1.1.1 Fenómeno aleatorio y variable observada

“Se observa una realización de un fenómeno aleatorio, digamos X. Este puede ser un elemento aleatorio de varios tipos: número (variable aleatoria), un vector de dimensión finita (vector aleatorio), una función, etc.
La premisa principal es que el carácter aleatorio de X se concibe como una realización de un fenómeno aleatorio que tiene una distribución de probabilidad P, donde la distribución P es desconocida ya sea en su totalidad o en algún detalle específico (por ejemplo, su soporte, su media, etc.). Es de interés conocer P. Si la medida de probabilidad P fuese conocida, entonces no hay problema estadístico propiamente, pues el problema estadístico tiene que ver con inferir la propiedad desconocida de P con base en X.” [Ver referencia 1]

  • Definición de X
    • X puede ser un valor real $X \in \mathbb{R}$, un vector en $\mathbb{R}^n$, o incluso una función $;X: [0,1]\to\mathbb{R}$.
  • Medida de probabilidad P
    • Desconocida: soporte, media, varianza, etc.
    • Objetivo estadístico: inferir características de (P) a partir de la muestra (la realización de X).

1.1.2 Incertidumbre inductiva vs. estocástica

“La observación X está dada, por lo que no hay incertidumbre tal como la hay en la teoría de probabilidad desarrollada anteriormente en el curso. Antes, fue concebida una estructura $(\Omega, \mathcal{F}, P)$ para enfrentar el que haya incertidumbre acerca del valor de X. En el problema estadístico, el valor de X ha sido observado, y la incertidumbre radica en otro punto: radica en que existe duda acerca de cuál P es la que produjo el valor X. En algunas ocasiones se utilizan los términos incertidumbre estocástica e incertidumbre inductiva para distinguir estos dos tipos. Es común que estos se confundan entre sí, porque en estadística matemática la teoría de probabilidad constituye también una de las maneras naturales de afrontar la cuantificación de incertidumbre inductiva. En cualquier caso, el concebir a P como medida de probabilidad es la base para formular soluciones a la incertidumbre inductiva. Con este lenguaje, probabilidad y estadística son problemas diferentes y de cierta manera inversos. Teoría de probabilidad tiene que ver con cuantificar incertidumbre acerca de X y teoría estadística con cuantificar incertidumbre acerca de P a la luz de haber ya observado X.”[Ver referencia 1]

  • Incertidumbre estocástica: duda previa sobre el valor de X, modelada por $(\Omega,\mathcal{F},P)$.
  • Incertidumbre inductiva: tras observar X, la incertidumbre se desplaza a la ley generadora P.

1.1.3 Ejemplos en Matemática Aplicada e Ingeniería de Sistemas

  1. Modelado de tiempos de respuesta en redes

    • $X$: tiempo de llegada de paquetes (variable continua).
    • $P$: distribución de retardo desconocida; objetivo: estimar parámetros de una ley de colas M/M/1.
  2. Estimación de parámetros en ecuaciones diferenciales estocásticas

    • $X(t)$: trayectoria observada de un proceso de Itô.
    • $P$: ley del proceso (por ejemplo, coeficientes de difusión y deriva), inferidos a partir de trayectorias discretas.
  3. Calibración de sensores en sistemas de control

    • $X$: lecturas del sensor (vector aleatorio).
    • $P$: distribución conjunta desconocida de ruido; se estima para diseñar filtros de Kalman óptimos.

Con esta distinción clara entre dato observado y modelo probabilístico, estamos listos para construir estimadores y desarrollar la inferencia estadística en las secciones siguientes.


1.2 Variable aleatoria

1.2.1 Variables y vectores aleatorios

Consideramos un experimento aleatorio cuyos resultados pertenecen al espacio muestral Ω. Modelamos este proceso suponiendo que existe una terna $(\Omega, \mathcal{A}, P),$ donde:

  • $\Omega$ es el espacio muestra,
  • $\mathcal{P}(\Omega)$ es el conjunto de partes de Ω,
  • $\mathcal{A}\in\mathcal{P}(\Omega)$ es una σ-álgebra,
  • $P\colon \mathcal{A} \to [0,1]$ es una medida de probabilidad que refleja las características aleatorias del experimento realizado.

A esta terna se le llama espacio de probabilidad.

Los resultados de un experimento aleatorio no son analizados “en bruto”, sino que se les da una representación numérica que facilita su tratamiento. Esto se logra introduciendo variables aleatorias, que asocian cada resultado $\omega\in \Omega$ con un valor numérico o vectorial, y sobre las cuales luego aplicamos técnicas de inferencia estadística.

En todo estudio estadístico partimos de un experimento aleatorio cuyo conjunto de resultados posibles se denomina espacio muestral Ω. Para cuantificar dichos resultados definimos las siguientes estructuras:

Definición: Variables Aleatorias

Sea $(\Omega,\mathcal{A},P)$ un espacio de probabilidad. Una variable aleatoria es una función $X\colon (\Omega,\mathcal{A});\longrightarrow; (\mathbb{R},\mathcal{B}),$ tal que para todo $B\in\mathcal{B}$ (la $\sigma$-álgebra de Borel en ℝ), $X^{-1}(B);=;{\omega\in\Omega : X(\omega)\in B};\in;\mathcal{A}.$

  • Si el espacio muestral Ω es finito o numerable, diremos que es un espacio discreto y las variables aleatorias asociadas al experimento normalmente estarán definidas como $X\colon \Omega ;\longrightarrow; \mathbb{Z}.$
  • Si $\Omega$ es no numerable, entonces diremos que es un espacio continuo y $X\colon \Omega ;\longrightarrow; \mathbb{R}.$

Definición: Vector aleatorio

Un vector aleatorio de dimensión $n$ es $\mathbf{X} = (X_1,\dots,X_n)\colon(\Omega,\mathcal{A})\longrightarrow(\mathbb{R}^n,\mathcal{B}^n),$ donde cada componente $X_i$ es variable aleatoria y $\mathcal{B}^n$ la $\sigma$-álgebra de Borel en ℝⁿ.


Ejemplos

Lanzamiento de dos monedas

Sea $\Omega = {,CC,;C-,;-C,;--}, $ donde $C$ = “cara” y $-$ = “cruz”. Podemos definir:
$X_1(\omega) = \text{número de caras en }\omega.$ $X_2(\omega) = 2 - X_1(\omega);=; \text{número de cruces}.$ $X_3(\omega) = \bigl(X_1(\omega)\bigr)^2.$

Entonces $(X_1,X_2,X_3)$ es un vector aleatorio de dimensión 3.

Tiempos de servicio en un servidor

Sean $T_i$ los tiempos de servicio (en segundos) de las peticiones $i=1,2,3$. Definimos
$\mathbf{T}=(T_1,T_2,T_3),\quad S = T_1 + T_2 + T_3,\quad M = \max{T_1,T_2,T_3}.$

Lecturas de sensores en red distribuida

En tres nodos $i=1,2,3$ medimos temperatura $X_{i,1}$, presión $X_{i,2}$ y humedad $X_{i,3}$. El vector global es $\mathbf{X} = (X_{1,1},X_{1,2},X_{1,3},,X_{2,1},\dots,X_{3,3}) \in \mathbb{R}^9.$


Con estas definiciones rigurosas disponemos ya de los objetos básicos para, en las siguientes secciones, construir estimadores, estudiar su comportamiento asintótico y contrastar hipótesis sobre la distribución subyacente $P$.

1.2.2 Distribución de una variable aleatoria. Funciones de distribución, de probabilidad y de densidad

Distribución de una Variable Aleatoria

La realización de un experimento aleatorio da lugar a un resultado $\omega\in\Omega$ que es aleatorio. Por lo tanto, $X(\omega)$ es un valor de $\mathbb{R}$ también aleatorio. Es decir, la variable aleatoria $X$ induce una medida de probabilidad en $\mathbb{R}$. A esa medida de probabilidad se le llama distribución de $X$ o ley de $X$. Una de las formas de caracterizar la distribución de una variable aleatoria es dar su función de distribución $F_X$, que está definida así:

$F_X(x) ;=; P(X \le x);=; P\bigl({\omega \in \Omega : X(\omega) \le x}\bigr);=; P\bigl(X^{-1}((-\infty, x])\bigr).$$

En el caso de que $X$ sea una variable aleatoria discreta, es decir, en el caso de que $X$ solo tome una cantidad finita o numerable de valores de $\mathbb{R}$, su distribución también puede caracterizarse por su función de probabilidad (o función de masa de probabilidad) $f_X$, definida como

$$f_X : \mathbb{R} \longrightarrow [0,1],\qquad f_X(x) = P(X = x).$$

Esa función solo es no nula en un conjunto finito o numerable. Supondremos en adelante, sin pérdida de generalidad, que ese conjunto está contenido en $\mathbb{Z}$. A partir de la función de masa de probabilidad se puede calcular la probabilidad de que la variable aleatoria $X$ tome valores en cualquier elemento $A \subseteq \mathbb{B}$:

$P(X \in A) = \sum_{x \in A} f_X(x).$

La función de distribución y la función de masa de probabilidad se relacionan de la siguiente forma:

$F_X(x) = \sum_{u \leq x} f_X(u), \quad f_X(x) = F_X(x) - F_X(x^-),$ donde $F_X(x^-) = \lim_{h \to 0^+} F_X(x - h)$.

Una clase relevante de variables aleatorias no discretas son las que poseen función de densidad, es decir, aquellas cuya distribución de probabilidad puede caracterizarse por una función $f_X(x) \geq 0$ que cumple que:

$P(X \in A) = \int_{x \in A} f_X(x) , dx, \quad \text{para todo } A \subseteq \mathbb{B}.$

La relación entre $F_X$ y $f_X$ es la siguiente:

$F_X(x) = \int_{-\infty}^{x} f_X(u) , du, \quad f_X(x) = \frac{d}{dx} F_X(x),$

salvo quizás en un número finito de puntos $x \in \mathbb{R}$. Las variables aleatorias que poseen función de densidad se llaman variables aleatorias absolutamente continuas. Abusando del lenguaje, aquí nos referiremos a ellas como variables aleatorias continuas.

1.2.3 Esperanza y varianza

Si se desea describir totalmente la distribución de probabilidad de una variable aleatoria $X$ acabamos de ver que podemos dar su función de distribución o su función de masa o de densidad, según el caso. Una descripción parcial puede efectuarse calculando algunas características de la variable aleatoria $X$, como por ejemplo medidas de posición o de dispersión. Estudiaremos algunas de ellas.

Se define la esperanza de una variable aleatoria $X$ como la integral de Lebesgue de $X$:

$E(X) = \int_{\Omega} X(w) dP(w).$

En el caso de variables aleatorias discretas la esperanza puede calcularse como:

$E(X) = \sum_{w \in \Omega} X(w) P(w) = \sum_{k \in \mathbb{Z}} k P(X = k) = \sum_{k \in \mathbb{Z}} k f_X(k).$

Por otro lado, la esperanza de una variable aleatoria continua se puede calcular así:

$E(X) = \int_{\mathbb{R}} x f_X(x) dx.$

La esperanza de una variable aleatoria $X$ es una medida de posición de $X$: es el centro de gravedad de la distribución de probabilidad de $X$.

Si $h$ es una función medible $h : \mathbb{R} \rightarrow \mathbb{R}$, entonces $Y = h(X)$ es también variable aleatoria y su esperanza se puede calcular a partir de la distribución de $X$:

$E(h(X)) = \int_{\Omega} h(X(w)) dP(w)$ que en el caso de que $X$ sea discreta puede reescribirse como

$E(h(X)) = \sum_{k \in \mathbb{Z}} h(k) f_X(k).$

Si $X$ es una variable aleatoria continua entonces

$E(h(X)) = \int_{\mathbb{R}} h(x) f_X(x) dx.$

Si existe $\mu = E(X)$ y es finita puede definirse una medida de dispersión de la variable aleatoria $X$ a partir de una transformación $h$ de $X$. Es lo que se denomina varianza de $X$ y se define así:

$V(X) = E((X - \mu)^2) = E(X^2) - \mu^2 = E(X^2) - (E(X))^2.$

1.2.4 Función generadora de momentos

Dada una variable aleatoria $X$, o su función de distribución $F$, vamos a definir otra función generadora, como

$M_X(t) = \mathbb{E}(e^{tX}),$ siempre que este valor esperado exista.

Notemos que cuando $X$ toma valores en los enteros no-negativos, $M_X(t) = \phi_X(e^t)$, donde $\phi_X(s)=E[s^X]=\sum_{k=0}^{\infty}p_ks^k$ para $s\in[0,1]$ es la función generadora de probabilidad (f.g.p.) de la variable $X$, con $p_k=P(X=k)$. Si $X$ está acotada, $M_X$ está bien definida para todo $t$ real; en cambio, si $X$ no está acotada, es posible que el dominio de $M_X$ no sea el conjunto de todos los reales. En todo caso, $\phi$ siempre está definida en cero, y $M(0) = 1$.

Es posible demostrar que si la f.g.m. de la v.a. $X$ existe en un entorno de 0, entonces para todo $k > 0$,

$\mathbb{E}[|X|^k] < \infty.$

Más aún, la serie

$M_X(t) = \mathbb{E}(e^{tX}) = \mathbb{E}\left(1 + \sum_{k=1}^{\infty} \frac{t^k X^k}{k!}\right) = 1 + \sum_{n=1}^{\infty} \frac{t^k}{k!} \mathbb{E}(X^k) \tag{5.1}$

es convergente y se puede derivar término a término. Obtenemos

$M'_X(0) = \mathbb{E}(X); \quad M''_X(0) = \mathbb{E}(X^2)$

y en general

$M_X^{(k)}(0) = \mathbb{E}(X^k).$

Es por esta última propiedad que esta función se conoce como función generadora de momentos (f.g.m.).

🎲 Ejemplo: f.g.m. de la distribución Binomial

Sea $X \sim \text{Binomial}(n, p)$, es decir, la suma de $n$ ensayos de Bernoulli con probabilidad de éxito $p$. La función generadora de momentos es:

$M_X(t) = \mathbb{E}[e^{tX}] = (1 - p + p e^t)^n$

 ```r #
mgf_binomial <- function(t, n = 10, p = 0.3) {
  (1 - p + p * exp(t))^n
}

t_vals <- seq(-3, 3, length.out = 300)
mgf_vals <- sapply(t_vals, mgf_binomial)

plot(t_vals, mgf_vals, type = "l", lwd = 2,
     main = expression("F.G.M. para X ~ Binomial(10, 0.3)"),
     xlab = "t", ylab = expression(M[X](t)))
grid()
``` 

📈 Ejemplo: f.g.m. de la distribución Normal Estándar

Sea $X \sim \mathcal{N}(0, 1)$. Su función generadora de momentos es:

$M_X(t) = \mathbb{E}[e^{tX}] = e^{\frac{t^2}{2}}$

Esta expresión se obtiene usando la forma cerrada del momento de una normal estándar.

 ```r #
mgf_normal <- function(t) {
  exp(t^2 / 2)
}

t_vals <- seq(-3, 3, length.out = 300)
mgf_vals <- sapply(t_vals, mgf_normal)

plot(t_vals, mgf_vals, type = "l", lwd = 2,
     main = expression("F.G.M. para X ~ N(0, 1)"),
     xlab = "t", ylab = expression(M[X](t)))
grid()
``` 

❓ Preguntas guía sobre la gráfica de la función generadora de momentos

📌 ¿Qué representa la gráfica de la f.g.m. $M_X(t)$?

La gráfica muestra cómo evoluciona el valor esperado de $e^{tX}$ cuando $t$ varía. Esta función codifica todos los momentos de la variable aleatoria $X$, y por tanto, contiene información completa sobre su distribución (si existe un entorno donde la f.g.m. es finita).


🧭 ¿Qué se observa en la f.g.m. de una distribución Binomial?

mgf_binomial

![Gráfica MGF Binomial]

Preguntas y respuestas

  • ¿Cómo es el comportamiento de la f.g.m. cerca de $t = 0$?

    En $t = 0$, siempre se cumple que $M_X(0) = 1$, ya que:

    $M_X(0) = \mathbb{E}[e^{0 \cdot X}] = \mathbb{E}[1] = 1$

  • ¿Qué indica la curvatura de la gráfica?

    La curvatura refleja el crecimiento exponencial de los momentos. Si la curva crece rápidamente hacia la derecha, significa que los momentos (media, varianza, etc.) también crecen con rapidez.

  • ¿Por qué la gráfica es convexa?

    Todas las funciones generadoras de momentos son estrictamente convexas en el intervalo donde están definidas. Esto es una consecuencia de que derivadas sucesivas representan momentos positivos.

  • ¿Qué pasa si cambio los parámetros $n$ y $p$?

    Aumentar $ n $ o $p$ tiende a elevar la f.g.m. en el lado derecho, reflejando una mayor media y varianza.


📈 ¿Cómo se comporta la f.g.m. para la Normal Estándar?

mgf_normal

![Gráfica MGF Normal]

Preguntas y respuestas

  • ¿Por qué es simétrica respecto al eje $ t = 0 $?

    Porque la normal estándar es simétrica alrededor de su media $ \mu = 0 $, y su f.g.m. tiene la forma:

$M_X(t) = e^{t^2 / 2}$

lo cual es una función par: $M_X(-t)= M_X(t)$.

  • ¿Qué tan rápido crece la función?

    Muy rápido. El crecimiento es exponencial cuadrático. Esto implica que los momentos de la normal crecen rápidamente en magnitud.

  • ¿Cómo se relaciona esta gráfica con los momentos de la normal?

    Derivando sucesivamente la f.g.m. en $ t = 0 $, se obtiene:

    $\mathbb{E}[X^k] = M_X^{(k)}(0)$

    Por tanto, la gráfica "encierra" toda la información sobre los momentos.


🧠 Conclusión

Estas gráficas te permiten visualizar la información estadística codificada en una variable aleatoria. La f.g.m. no es solo una herramienta algebraica para obtener momentos, sino una forma poderosa de describir el comportamiento global de la variable.

¿Qué pasa si dos variables tienen la misma f.g.m.?
¡Tienen la misma distribución! (si la f.g.m. está definida en un entorno de 0).

Ejemplo: Distribución uniforme $U(a,b)$

Si $$X \sim U(a,b),$$
su densidad es
$$f(x) = \frac{1}{b - a}\quad\text{para }a &lt; x &lt; b,$$
y su función generadora de momentos viene dada por

$$M(t)= \int_a^b \frac{e^{t x}}{b - a}\,dx= \frac{e^{b t} - e^{a t}}{t\,(b - a)}.$$ (5.2)

En el caso particular de la distribución uniforme en $(0,1)$ se obtiene
$$M(t) = \frac{e^t - 1}{t}.$$


Para derivar la fórmula #(5.2) y obtener los momentos, podemos usar el desarrollo en serie de la función exponencial:

$$M(t)= \frac{1}{t,(b - a)}\bigl(e^{b t} - e^{a t}\bigr) \\ = \frac{1}{t,(b - a)}\Bigl[\bigl(1 + \sum_{n=1}^\infty \tfrac{(b t)^n}{n!}\bigr) -\bigl(1 + \sum_{n=1}^\infty \tfrac{(a t)^n}{n!}\bigr)\Bigr] \\ = \frac{1}{b - a}\sum_{n=1}^\infty \frac{b^n - a^n}{n!},t^{n-1}. $$

Este es el desarrollo de Maclaurin de $M(t)$ en $t=0$; por tanto, sus derivadas en cero satisfacen

$$M^{(k)}(0)= \frac{b^{k+1} - a^{k+1}}{(k+1)\,(b - a)}.$$ (5.3)
En particular:
  • $$M'(0)= \frac{b^2 - a^2}{2,(b - a)}= \frac{a + b}{2},$$ que coincide con $\mathbb{E}(X)$.

  • $$M''(0)= \frac{b^3 - a^3}{3,(b - a)}= \frac{a + a b + b^2}{3},$$

y un cálculo directo muestra que la varianza es

$$\mathrm{Var}(X)= \mathbb{E}(X^2) - \bigl(\mathbb{E}(X)\bigr)^2= \frac{(a + b)^2}{12}.$$

Teorema 5.1

Si $X$ tiene función generadora de momentos $M(t)$ que está definida en un entorno $(-a,a)$ de 0, entonces $M(t)$ caracteriza a la distribución de $X$; es decir, si otra variable $Y$ tiene la misma función generadora de momentos, las distribuciones de $X$ e $Y$ coinciden.


Si $X,Y$ son variables aleatorias con funciones generadoras de momentos respectivas $M_X$ y $M_Y$ que existen en un dominio común $|t| &lt; d$, entonces la f.g.m. de la suma $X+Y$ está dada por

$$M_{X+Y}(t)= \mathbb{E}\bigl[e^{t(X+Y)}\bigr]= \mathbb{E}\bigl[e^{tX}\,e^{tY}\bigr]=\mathbb{E}\bigl[e^{tX}\bigr]\;\mathbb{E}\bigl[e^{tY}\bigr]= M_X(t)\,M_Y(t). \tag{5.5} $$ (5.5)

Este resultado se extiende a la suma de $n$ variables aleatorias independientes. Si

$$S_n = X_1 + \cdots + X_n,$$

entonces

$$M_{S_n}(t)= \mathbb{E}\bigl[e^{tS_n}\bigr]= \mathbb{E}\Bigl[e^{t\sum_{i=1}^n X_i}\Bigr]= \prod_{i=1}^n\mathbb{E}\bigl[e^{tX_i}\bigr]= \prod_{i=1}^n M_{X_i}(t).$$

La función generadora de momentos resulta particularmente útil cuando consideramos sucesiones de variables aleatorias, como lo muestra el siguiente teorema que enunciamos sin demostración:


Teorema 5.2 (de Continuidad)

Sea $F_n(x)$, $n\ge1$, una sucesión de funciones de distribución con funciones generadoras de momentos respectivas $M_n(t)$, definidas en $|t|&lt;b$. Supongamos que cuando $n\to\infty$,

$$ M_n(t),\longrightarrow,M(t) \quad\text{para }|t|\le a, $$

donde $M(t)$ es la función generadora de momentos de la distribución límite $F(x)$. Entonces

$$ F_n(x),\longrightarrow,F(x) \quad\text{cuando }n\to\infty $$

para todo punto $x$ en el cual $F$ es continua.

1.2.5 Muestra aleatoria simple

1.2.6 Modelo paramétrico

1.2.7 Sumas de variables aleatorias

1.3 Dos familias de distribuciones importantes

1.3.1 Familias de localización y escala

1.3.2 Familias exponenciales

1.4 Muestreo de una distribución normal

1.4.1 Distribuciones asociadas a la normal

1.5 Leyes de los Grandes Números y Teorema Central del Límite

1.5.1 Leyes de los grandes números

1.5.2 Teorema central del límite

1.5.3 Versiones multivariantes

1.6 Lista de problemas


Referencias

  1. Reveles, F., Pérez-Abreu, V., Nakamura, M., & Biscay, R. (2016). Persistencia, Probabilidad e Inferencia Estadística para Análisis Topológico de Datos. Centro de Investigación en Matemáticas, A.C.
  2. Gómez, Guadalupe, & Delicado, Pedro (2006). Curso de Inferencia y Decisión. Departament d’Estadística i Investigació Operativa, Universitat Politècnica de Catalunya.

2. Principios para reducir los datos

2.1 Principio de suficiencia

2.1.1 Estadísticos suficientes r-dimensionales

2.1.2 Estadísticos suficientes mínimos

2.1.3 Estadísticos auxiliares

2.1.4 Estadísticos completos

2.2 Principio de verosimilitud

2.3 Lista de problemas

3. Estimación puntual 1: Construcción de estimadores

3.1 La función de distribución empírica y el método de los momentos

3.1.1 Teorema de Glivenko–Cantelli

3.1.2 Principio de sustitución

3.1.3 El método de los momentos

3.2 Estimadores de máxima verosimilitud

3.2.1 Cálculo del estimador máximo verosímil

3.2.2 Cálculo numérico de los estimadores de máxima verosimilitud

3.2.3 Principio de invariancia del estimador máximo verosímil

3.3 Estimación Bayesiana

3.3.1 Distribuciones a priori y a posteriori

3.3.2 Distribuciones conjugadas

3.3.3 Funciones de pérdida

3.3.4 Estimadores de Bayes

3.4 Lista de problemas

4. Estimación puntual 2: Evaluación de estimadores

4.1 Error cuadrático medio

4.1.1 Eficiencia relativa

4.2 Mejor estimador insesgado

4.2.1 Teorema de Cramér–Rao. Información de Fisher

4.2.2 Versión multivariante del teorema de Cramér–Rao

4.2.3 Teorema de Rao–Blackwell. Lehmann–Scheffé

4.3 Comportamiento asintótico

4.3.1 Consistencia

4.3.2 Normalidad asintótica

4.3.3 Método delta

4.3.4 Eficiencia relativa asintótica

4.4 Teoría asintótica para el estimador máximo verosímil

4.5 Lista de problemas

5. Contrastes de hipótesis

5.1 Definiciones básicas. Contraste de hipótesis simples

5.1.1 Tipos de errores

5.1.2 Lema de Neyman–Pearson

5.1.3 Conclusiones de un contraste: el p-valor

5.2 Contrastes uniformemente más potentes

5.2.1 Lema de Neyman–Pearson para alternativas compuestas

5.2.2 Razón de verosimilitud monótona. Teorema de Karlin–Rubin

5.3 Contrastes insesgados. Contrastes localmente más potentes

5.4 Consistencia y eficiencia para contrastes

5.5 Test de la razón de verosimilitudes

5.5.1 Relación con el lema de Neyman–Pearson

5.5.2 Propiedades de los contrastes de razón de verosimilitudes

5.6 Contrastes relacionados con el de máxima verosimilitud

5.6.1 Test del score

5.6.2 Test de Wald

5.6.3 Contrastes en presencia de parámetros secundarios

5.7 Contrastes bayesianos

5.7.1 Ventaja a priori y a posteriori. Factor de Bayes

5.7.2 Contraste de dos hipótesis simples

5.7.3 Contraste de dos hipótesis compuestas

5.7.4 Contraste de hipótesis nula simple frente a alternativa compuesta

5.8 Lista de problemas

6. Estimación por intervalos

6.1 Intervalos de confianza

6.2 Métodos para construir intervalos de confianza

6.2.1 Inversión de un contraste de hipótesis

6.2.2 Cantidades pivotales

6.2.3 Intervalos bayesianos

6.2.4 Intervalos de verosimilitud

6.3 Evaluación de estimadores por intervalos

6.3.1 Intervalos de longitud mínima

6.3.2 Relación con contrastes de hipótesis y optimalidad

6.4 Intervalos de confianza asintóticos

6.4.1 Intervalos basados en el estimador de máxima verosimilitud

6.4.2 Intervalos basados en la función score

6.5 Lista de problemas

📦 Recursos

Bibliografía recomendada

  • Casella, G., & Berger, R. L. Statistical Inference
  • Rice, J. A. Mathematical Statistics and Data Analysis
  • Wasserman, L. All of Statistics

Herramientas computacionales

  • R y RStudio
  • Jupyter Notebooks (opcionalmente con Python)
  • LaTeX para reportes técnicos

📝 Evaluación

  • Participación y ejercicios dirigidos (20%)
  • Tareas individuales y/o grupales (30%)
  • Proyecto aplicado con sustentación (20%)
  • Examen final teórico-práctico (30%)

🧑‍🏫 Docente

Dra. Biviana M. Suárez Sierra
Profesora del Área de Computación y Analítica
EAFIT – Escuela de Ciencias Aplicadas e Ingeniería
✉️ [email protected] 🌐 [Enlace a perfil académico]


🤝 Colaboración y Ética

Este curso promueve el trabajo colaborativo, la discusión crítica y el aprendizaje autónomo. Se espera que todas las contribuciones respeten la honestidad académica y reconozcan las fuentes utilizadas.

Los aportes a esta wiki son bienvenidos: correcciones, resúmenes, ejemplos adicionales y recursos compartidos enriquecen el aprendizaje colectivo.

⚠️ **GitHub.com Fallback** ⚠️