Introducción al Análisis de Datos

Febrero 2024 (Semana 1)

El Examen con TODOS los MODELOS para corrección.

El Examen con TODOS los MODELOS para corrección, provisional y no oficial.

Tras la salida de la PLANTILLA:
¡CONCIDEN TODAS LAS RESPUESTAS CON LAS OFICIALES ✅!
(Excepto una, reclamación más abajo ⤵️) 

Exclusión de Responsabilidad

  • El propósito es que  puedas corregírtelo.
  • Puede servirte de repaso, he anotado explicaciones en la mayoría de ellas.
  • Las respuestas marcadas como correctas son a mi juicio, no son las Oficiales del Equipo Docente.
  • Si alguna no te parece correcta, coméntalo en la publicación de Facebook y lo argumentamos.
  • En ningún momento mis respuestas serán tomadas como referentes para posibles reclamaciones.

EXAMEN EXPLICADO:

>>ERRATA: La pregunta 12 “El coeficiente de correlación más adecuado para relacionar dos variables cuantitativas que no tengan una distribución normal esla respuesta correcta sería la A) coeficiente de correlación de Spearman.

>> La correlación de Pearson sí es cierto que lo utilizamos en general para las dos variables cuantitativas pero el detalle de lo de la distribución normal se me escapó.

13.02.24>> Hoy el Equipo Docente ha publicado las correcciones de ambas semanas.

  • Examen segunda semana: coinciden todas las respuestas ✅.
  • Examen primera semana: como dije en mi vídeo de corrección, la pregunta 14 han dado por válida la A cuando considero que es la B.

Paso a detallar mis argumentos para que puedas orientarte y escribir en el Foro oficial de la asignatura o a los correos electrónicos del Equipo Docente para tratar las reclamaciones del examen.

———–

El enunciado de la pregunta es el siguiente:

14.En una investigación, donde A̅= 100 y B̅ = 20, se estandarizan ambas variables predictoras (A y B) y se obtiene esta ecuación de regresión lineal múltiple: Y′ = 0,37 + 0,89 A + 1,21 B. ¿Cuál será el pronóstico (Y′) de un participante que tiene una puntuación media en ambas variables? A) 0,37; B) 113,57; C) Falta información para estimar el pronóstico.

Han dado por correcta la alternativa A con el siguiente desarrollo:

Dado que ambas variables predictoras, A y B, fueron estandarizadas antes del análisis, sus medias son cero. Entonces el pronóstico de un participante con puntuaciones medias será igual a: Y′ = 0,37 + 0,89 A + 1,21 B = 0,37 + 0,89 0 + 1,21 0 = 0,37.

Sin embargo, desde mi punto de vista, dicha resolución no se desprende el enunciado planteado, y expongo mis motivos:

  1. Facilitan y piden las puntuaciones directas, no estandarizadas (típicas):
    Se presentan dos variables (A y B), nos facilitan sus medias, nos dicen que se estandarizan, es decir, que se calculan sus correspondientes puntuaciones típicas, y se nos facilita la ecuación de regresión para el cálculo de la puntuación pronosticada Y’, también en puntuación directa. Nos solicitan que calculemos dicho valor de la Y’ (pronóstico en puntuación directa) en el caso en el que las puntuaciones obtenidas en ambas variables A y B, coincidieran con el valor de la media.
    Por lo tanto, se toma el valor de la media de cada variable predictora (10 y 20, respectivamente), se sustituye en la ecuación de regresión planteada en puntaciones directas (A y B), y se obtiene el valor de 113,57; es decir, lo indicado en la alternativa B.
  2. Información irrelevante: La información del enunciado sobre que A y B han sido estandarizadas resulta irrelevante al darnos la ecuación de la recta de regresión en puntuaciones directas (A y B) y no en puntuaciones típicas (ZA y ZB), y al pedir el valor del pronóstico también en puntación directa (Y’), en lugar de en puntuación directa (ZY’).

    La notación simbólica es la que marca la diferencia, dan las medias de A y B en puntuaciones directas, por eso utilizan las iniciales en mayúscula (A̅= 100 y B̅ = 20).

    Estos mismos símbolos (A y B) son los representados en la ecuación, no sus representaciones típicas (ZA y ZB). Igualmente, el pronóstico se solicita en puntuación directa, que viene representada por la letra en mayúscula (Y’), en lugar de su símbolo en típica (ZY’)

  3. Ecuación de regresión múltiple no tiene ordenada en el origen: Más allá de que esta información no aparece en el Manual de la asignatura.

    En una ecuación de regresión múltiple expresada en puntuaciones típicas, se observa que presenta las variables predictoras en su dotación típica representada por z y multiplicadas por el coeficiente de cada una, también en puntuación típica. En estas ecuaciones se carece de valor que suma (de la ordenada en el origen).

Por todo esto es que considero que el comentario sobre la estandarización no afecta en nada a los cálculos, no permite utilizar el valor resultante de dichas puntuaciones típicas al no poder aplicadas en una ecuación de regresión múltiple que está claramente expresada en puntuaciones directas. Igualmente, se solicita el valor del pronóstico en puntuación directa, no en típica. De ahí que la respuesta que considero correcta sea la B) 11,57.

———

Os animo a reclamarla si lo consideráis oportuno.

Clases FLEXIBLES  y PERSONALIZADAS

Otra forma de estudiar a distancia, es posible.

👇Averígualo, pincha sobre la asignatura: