Estadística. Preguntas frecuentes
Respondemos a preguntas que pueden surgir en un curso general de estadística. Tratan sobre el material del curso y también sobre temas que pueden aparecer en discusiones sobre lo que es la estadística, sus dificultades y sus aplicaciones.Es el resultado de nuestra experienca moviéndonos en este terreno y esperamos que sea útil a estudiantes, profesores que empiezan, e intersados por la estadística en general. Cualquier comentario o sugerencia (hay espacio al final) será bienvenido.
General (sobre lo que es y lo que no es la Estadística)
Estadística Descriptiva
- ¿Para qué sirve la mediana si ya tenemos la media aritmética?
- ¿Tiene alguna aplicación práctica la media geométrica?
- ¿Por qué en estadística se da tanta importancia a la variabilidad?
- ¿Por qué en la fórmula de la varianza se utiliza el cuadrado de las diferencias en vez de su módulo?
- ¿Por qué cuando se calcula la varianza de una muestra se divide por n-1 en vez de dividir por n?
- ¿Por qué la desviación típica -o desviación estándar-es la medida típica de dispersión?
- ¿Cuál es la forma “correcta” de calcular los cuartiles?
- ¿De dónde sale el 1,5 utilizado para marcar las anomalías en un boxplot?
- ¿Qué hay que hacer cuando nos encontramos con valores atípicos?
- ¿Para qué sirve la curtosis?
- ¿Qué gráfico debo usar para representar mis datos?
- ¿Qué gráfico NO debo usar para representar mis datos?
- ¿Cuáles son los mejores paquetes de software para analizar datos gráficamente?
- ¿Cómo se pasa de la frecuencia (en los histogramas) a la densidad de probabilidad (en las distribuciones de probabilidad)?
- ¿Cómo se sabe qué distribución sigue una variable aleatoria?
- ¿Por qué se dice que la media es una variable aleatoria?
- ¿De dónde sale la fórmula de la distribución Normal?
- ¿Por qué para la distribución Normal solo se necesita la tabla de la N(0; 1)?
- ¿Por qué la probabilidad de tener mi estatura es igual a cero?
- ¿Existen variables con comportamiento contrario a la distribución Normal?
- ¿De dónde sale la fórmula de la distribución de Poisson?
- ¿Cómo se puede ver que la distribución de la varianza muestral está relacionada con la distribución Chi-cuadrado?
- ¿Por qué no es lo mismo sumar k veces una variable aleatoria que multiplicarla por k
- ¿Por qué nos creemos los resultados de una muestra sabiendo que si tomáramos otra serían distintos?
- ¿De dónde sale la expresión del intervalo de confianza?
- ¿Qué es el factor de corrección por población finita?
- ¿Cuántos elementos debe tener una muestra para que las conclusiones sean fiables?
- ¿Qué relación hay entre tamaño de muestra y tamaño de población?
- ¿Qué tipo de muestreo conviene elegir?
- ¿Es lo mismo muestra aleatoria que muestra representativa?
- ¿Por qué cuesta acertar en los sondeos electorales?
- ¿Qué es un estimador de máxima verosimilitud?
- ¿Qué es un contraste de hipótesis?
- ¿Por qué es controvertido el uso del contraste de hipótesis?
- ¿Cómo elegir la hipótesis alternativa que conviene plantear?
- ¿Por qué respecto a la hipótesis nula se habla de “no rechazo” y no de “aceptación”?
- ¿Cómo se sabe hacia qué lado hay que mirar el área de cola?
- ¿A partir de qué p-valor es razonable rechazar la hipótesis nula?
- ¿Qué tipos de error se pueden cometer en un contraste de hipótesis?
- ¿Es lo mismo diferencia significativa que diferencia importante?
- ¿Es correcto multiplicar por dos el área de cola en los tests de igualdad de varianzas?
- ¿Cómo que diseño de experimentos? ¿No es eso de física o de química?
- ¿Por qué no se usa el text de la t de Student para comparar más de dos tratamientos?
- ¿Por qué se llama Análisis de la Varianza si lo que se compara son medias?
- ¿Por qué no hay que mover las variables una a una?
- ¿Cómo es posible estudiar por separado el efecto de cada variable?
- ¿Cómo se puede escribir una ecuación para la respuesta con los resultados de un diseño factorial?
- ¿Qué es un diseño bloqueado?
- ¿Por qué se suponen no significativas las interacciones de tres o más factores?
- ¿Qué hacer si al aleatorizar el orden de experimentación se obtiene el orden estándar de la matriz de diseño?
- ¿Cómo se justifica la fórmula de la covarianza?
- ¿De dónde sale la fórmula del coeficiente de correlación?
- ¿Cómo se han calculado los valores críticos del coeficiente de correlación?
- ¿Sirven las tablas del coeficiente de correlación si X e Y no son Normales?
- ¿Por qué se utiliza el método de los mínimos cuadrados?
- ¿Por qué los coeficientes de la ecuación de regresión son variables aleatorias?
- ¿Para qué sirve y como se interpreta el valor de R2
- ¿Por qué cuando se ajusta la recta por el origen no se debe usar R2?
- ¿Por qué hace falta el valor de R2-ajustado si ya temeos el de R2?
- ¿Se pueden utilizar variables cualitativas en ecuaciones de regresión?
- ¿Por qué las variables que se incluyen en el modelo no necesariamente son las más correlacionadas con la respuesta?
- Cuando se habla de transformación logarítmica ¿se refiere al logaritmo decimal o al neperiano?
- ¿Debe decirse "Teorema central del límite" o "Teorema del límite central"?
- ¿Que significan los llamados "grados de libertad"?
- ¿Cuál es la mejor estrategia para que me toque la lotería?
- Acaba de salir 5 veces el rojo ¿debo aportar al negro?
- ¿Cómo se dice? ¿Qué significa?
Muy buen libro, explica en forma sencilla y con lenguaje simple conceptos que a veces dificulta explicar. Felicidades al Dr. Pere Grima y al Dr. Roberto Behar
ResponderEliminarMuchas gracias. Nos alegra saber que el libro te parece útil.
EliminarDespués de leer esta joya de libro, no me queda duda que debe ser un material obligatorio en todos los cursos básicos de Estadidtica. Felicitaciones a los autores.
ResponderEliminarMuchas gracias. Obligatorio no es ;-) pero si accesible a todos los interesados. Esperamos que sirva para aclarar dudas.
EliminarClasificar las variables de la encuesta. En una granja dedicada a la producción de huevos, se quiere comprobar la eficacia de un nuevo alimento balanceado. De las 1500 gallinas se toman 200 y se le pesa antes y después de los veinte días que dura la dieta con el nuevo alimento
ResponderEliminarGracias por su comentario. Supongo que es una invitación a tratar el tema de los distintos tipos de variables que pueden presentarse en un estudio y la importancia de su categorización, pues existen algunos procedimientos estadísticos que solo son válidos para cierto tipo de variables.
EliminarDe nuevo gracias. Lo tendremos en cuenta.