El tamaño de muestra es el factor más controlable en la calidad de la investigación. Demasiado pequeño y desperdicias recursos recopilando datos no concluyentes. Demasiado grande y gastas innecesariamente en una pregunta que un estudio más pequeño podría haber respondido. Acertar con el tamaño de muestra antes de que comience la recopilación de datos es una de las decisiones estadísticas más importantes que toma un investigador.
Por Qué Importa el Tamaño de Muestra
Un estudio de tamaño insuficiente carece de la potencia estadística para detectar efectos reales — desperdicia recursos y produce falsos negativos que pueden retrasar descubrimientos importantes. En los ensayos clínicos, un estudio con poca potencia puede no detectar un tratamiento genuinamente efectivo, causando que se abandone prematuramente. A la inversa, un estudio de tamaño excesivo es innecesariamente caro y, en la investigación clínica, expone a más participantes a condiciones experimentales de lo necesario — lo que plantea preocupaciones éticas bajo el principio de equipoise. Para las encuestas y los sondeos de opinión, una muestra demasiado pequeña produce márgenes de error tan amplios que los resultados son ininterpretables: un sondeo de n = 30 con 95% de confianza tiene un margen de ±18%, haciendo que incluso grandes cambios políticos sean estadísticamente indistinguibles. El cálculo adecuado del tamaño de muestra equilibra la precisión estadística, la potencia y las restricciones prácticas — y el cálculo debe hacerse antes de que comience la recopilación de datos, no después, porque los ajustes posteriores del tamaño de muestra introducen sesgo. Los estándares modernos de replicación ahora requieren el preregistro de los cálculos del tamaño de muestra, haciendo de este paso tanto un requisito metodológico como una obligación ética en la investigación financiada.
Los Rendimientos Decrecientes de las Muestras Más Grandes
El margen de error disminuye con la raíz cuadrada del tamaño de muestra. Cuadruplicar n solo reduce el margen a la mitad. Pasar de n = 100 a n = 400 reduce a la mitad el margen de error, pero pasar de n = 400 a n = 1,600 solo lo reduce a la mitad de nuevo, y el costo se ha cuadruplicado cada vez. Esta relación de raíz cuadrada significa que las mejoras de precisión se vuelven progresivamente más caras a medida que crecen las muestras. Para la fórmula estándar de proporciones n = z²p(1−p)/E², reducir E a la mitad requiere 4× los encuestados. Con 95% de confianza y ±5% de margen: n ≈ 384. Con ±2.5% (el doble de precisión): n ≈ 1,537. Con ±1% (cinco veces la precisión): n ≈ 9,604. La implicación práctica es que usualmente hay un punto óptimo — a menudo alrededor de n = 400–1,500 para encuestas — más allá del cual las ganancias de precisión adicionales cuestan más de lo que valen. Entender esta curva ayuda a los investigadores a establecer objetivos realistas y rentables en lugar de perseguir la perfección teórica.
Análisis de Potencia — El Paso Frecuentemente Olvidado
Muchos investigadores se enfocan únicamente en la confianza y el margen de error, ignorando la potencia estadística. La potencia (1 − β) es la probabilidad de detectar un efecto real de un tamaño dado. Un estudio puede tener un IC del 95% estrecho y aun así tener poca potencia si el tamaño del efecto que se mide es pequeño en relación con el tamaño de muestra. El análisis de potencia funciona en ambas direcciones: dado un presupuesto fijo (tamaño de muestra), ¿cuál es el efecto más pequeño que puedes detectar de forma confiable? O, dado un tamaño del efecto objetivo (de literatura previa o de importancia práctica), ¿cuántos sujetos necesitas para un 80% de potencia? La d de Cohen estandariza los tamaños del efecto para que puedan compararse entre estudios: d = 0.2 (pequeño), 0.5 (mediano), 0.8 (grande). Con n = 50 por grupo, un estudio tiene solo 40% de potencia para detectar un efecto pequeño (d = 0.2) pero 98% de potencia para detectar uno grande (d = 0.8). No tener en cuenta la potencia significa que se publican estudios con poca potencia con resultados negativos que descartan incorrectamente efectos reales — contribuyendo a la crisis de replicación en psicología y medicina.
Poblaciones Finitas y el Mito del Censo
Un error común es pensar que necesitas encuestar una gran fracción de una población para obtener resultados confiables. En realidad, para poblaciones por encima de aproximadamente 10,000, el tamaño de muestra requerido apenas cambia porque el factor de corrección por población finita se acerca a 1. La precisión de una encuesta está determinada casi por completo por el tamaño de muestra absoluto, no por la fracción muestreada. Un sondeo de n = 1,068 alcanza un margen de ±3% con 95% de confianza ya sea que la población sea de 100,000 o de 330 millones. La corrección por población finita n_adj = nN/(n + N − 1) solo importa cuando se muestrea más del 5–10% de la población total — por ejemplo, encuestar a 100 de 500 empleados. Para poblaciones pequeñas (N = 500), muestrear 50 requiere n_adj ≈ 44 en lugar de 384 — una reducción sustancial. Entender cuándo aplicar esta corrección previene tanto el sobremuestreo (desperdiciar recursos) como el submuestreo (precisión insuficiente) en contextos como el control de calidad, las encuestas de comunidades pequeñas o las encuestas de poblaciones de animales.