Un intervalo de confianza es un rango de valores que probablemente contiene el verdadero parámetro de la población (media, proporción, diferencia entre grupos, etc.) basado en una muestra — y entender lo que los intervalos de confianza realmente significan es uno de los conceptos más comúnmente malinterpretados en estadística. Un intervalo de confianza del 95% no significa que haya un 95% de probabilidad de que el valor verdadero esté dentro del intervalo (una afirmación errónea común); significa que si repitieras el proceso de muestreo muchas veces, alrededor del 95% de los intervalos resultantes contendrían el verdadero parámetro. Las secciones siguientes cubren lo que los intervalos de confianza cuantifican y por qué son esenciales para un reporte científico honesto, cómo el tamaño de la muestra y el nivel de confianza se contraponen al ancho del intervalo, y las fórmulas específicas para los intervalos de confianza de la media y la proporción con sus supuestos.

Lo Que los Intervalos de Confianza Realmente Significan

Un intervalo de confianza cuantifica la incertidumbre en una estimación derivada de una muestra. Cuando calculamos un IC del 95% de [48.2, 51.8] para una media, la interpretación técnica es esta: el procedimiento usado para generar este intervalo tiene la propiedad de que, a través de muchas muestras repetidas hipotéticas, el 95% de los intervalos producidos por este procedimiento contendrán la verdadera media de la población. El intervalo en sí mismo es una variable aleatoria — cambia a medida que cambia la muestra — mientras que la verdadera media de la población es fija y desconocida.

Esta distinción importa porque la frase común "hay un 95% de probabilidad de que la media verdadera esté en este intervalo" es técnicamente incorrecta en la estadística clásica (frecuentista) — una vez que has calculado un intervalo específico, o contiene la media verdadera (probabilidad 1) o no la contiene (probabilidad 0), y no sabemos cuál. El 95% se aplica al comportamiento a largo plazo del procedimiento, no a ningún intervalo individual. Los intervalos creíbles bayesianos, una construcción matemática diferente, sí admiten la interpretación intuitiva de "probabilidad en el intervalo" pero requieren especificar una distribución previa. Para el trabajo práctico, los IC frecuentistas son adecuados y ampliamente entendidos a pesar del sutil problema de interpretación.

Tamaño de la Muestra, Nivel de Confianza y Contraposiciones de Ancho

El ancho de un intervalo de confianza está determinado por tres factores: el tamaño de la muestra (n), la variabilidad en los datos (desviación estándar s) y el nivel de confianza elegido (90%, 95%, 99%, etc.). Las muestras más grandes producen intervalos más estrechos porque el error estándar de la media (s/√n) se reduce a medida que n crece — duplicar el tamaño de la muestra reduce el ancho del intervalo en aproximadamente un 30% (factor de √2). Cuadruplicar el tamaño de la muestra reduce el ancho a la mitad. Esta relación de rendimientos decrecientes es la razón por la que la planificación del tamaño de la muestra importa — pasar de n=100 a n=400 es una gran ganancia, pero de n=400 a n=1600 agrega menos precisión incremental por 4× el costo de recolección de datos.

Los niveles de confianza más altos producen intervalos más anchos porque necesitas un margen de error mayor para estar más seguro de que el intervalo captura el parámetro verdadero. Un IC del 99% es aproximadamente un 31% más ancho que un IC del 95% de los mismos datos; un IC del 99.9% es aproximadamente un 59% más ancho. Elige el nivel de confianza según las consecuencias de estar equivocado — la investigación médica y las aprobaciones regulatorias típicamente usan el 95% o el 99%, mientras que el análisis empresarial exploratorio puede usar el 80% o el 90% para intervalos más estrechos y más accionables. La calculadora muestra cómo responde el ancho del intervalo a estas decisiones para que puedas elegir un equilibrio apropiado a tu contexto de decisión específico.

Fórmulas y Supuestos

El IC para una media de la población usa la fórmula x̄ ± t*(s/√n), donde t* es el valor t crítico de la distribución t con n−1 grados de libertad a tu nivel de confianza elegido. Para n ≥ 30 la distribución t es esencialmente idéntica a la distribución normal y puedes usar valores z en su lugar (1.96 para un IC del 95%, 2.576 para un IC del 99%). Para muestras más pequeñas los valores t son ligeramente más grandes que los valores z, ampliando el intervalo para considerar la incertidumbre adicional sobre la verdadera desviación estándar.

Para una proporción de la población, la fórmula es p̂ ± z*·√(p̂(1−p̂)/n), donde p̂ es la proporción muestral. Esta fórmula de proporción requiere np̂ ≥ 10 Y n(1−p̂) ≥ 10 para que la aproximación normal funcione — si lo violas, usa métodos binomiales exactos en su lugar. Ambas fórmulas asumen un muestreo aleatorio independiente de la población; los sesgos sistemáticos (muestras por conveniencia, autoselección) invalidan la interpretación del IC sin importar el tamaño de la muestra. Cuando se violan los supuestos, la salida de la calculadora puede ser técnicamente válida pero engañosa sobre la incertidumbre real — verifica siempre los supuestos antes de confiar en el intervalo.

Intervalos de Confianza: Cuantificando la Incertidumbre

Lo Que Realmente Significa un Intervalo de Confianza

Un intervalo de confianza del 95% no significa que haya un 95% de probabilidad de que el parámetro verdadero esté dentro del intervalo específico que calculaste. En cambio, describe el desempeño del procedimiento: si repitieras el mismo estudio 100 veces, aproximadamente 95 de los intervalos resultantes contendrían el valor verdadero. Cualquier intervalo individual o contiene el valor verdadero o no lo contiene — la aleatoriedad está en el muestreo, no en el parámetro.

Cuándo Usar Z vs T

Usa la distribución Z cuando la desviación estándar de la población (σ) es conocida o cuando n es grande (≥ 30). Para muestras pequeñas con σ desconocida, la distribución T considera la incertidumbre adicional produciendo intervalos ligeramente más anchos. Los valores t críticos convergen a los valores z a medida que aumentan los grados de libertad — para df = 30, la diferencia es menor al 1%.

Tamaño de la Muestra y Precisión

El margen de error es proporcional a 1/√n. Para reducir a la mitad el margen de error, debes cuadruplicar el tamaño de la muestra. Esta relación explica por qué las encuestas políticas encuestan a aproximadamente 1,000–1,500 personas: más allá de ese punto, las ganancias en precisión disminuyen rápidamente en relación con el costo de la recolección de datos adicional. El Solucionador de Tamaño de Muestra de arriba muestra exactamente qué n necesitas para cualquier margen de error objetivo.