WEBVTT 1 00:00:15.200 --> 00:00:18.520 Para garantizar que hemos recogido correctamente los datos, 2 00:00:18.760 --> 00:00:21.080 tenemos que describirlos estadísticamente, 3 00:00:21.240 --> 00:00:25.120 de acuerdo con su nivel de medida, cualitativo o cuantitativo. 4 00:00:25.560 --> 00:00:28.360 Es un control de calidad que siempre tenemos que hacer. 5 00:00:28.960 --> 00:00:32.760 Los valores centrales: la moda, la mediana o la media, 6 00:00:32.920 --> 00:00:36.680 muestran cuáles son los valores más representativos de la variable. 7 00:00:37.040 --> 00:00:38.720 Las medidas de dispersión, 8 00:00:38.760 --> 00:00:41.240 rango de variación o desviación típica, 9 00:00:41.400 --> 00:00:44.400 nos dicen hasta qué punto estos valores centrales 10 00:00:44.560 --> 00:00:45.680 son representativos. 11 00:00:46.400 --> 00:00:48.320 Si aparecen valores que no esperamos, 12 00:00:48.560 --> 00:00:51.560 seguramente ha habido un problema en la recogida de datos 13 00:00:51.720 --> 00:00:54.480 que podemos resolver en los momentos iniciales. 14 00:00:54.960 --> 00:00:56.720 Las representaciones gráficas 15 00:00:56.800 --> 00:00:58.760 de las distribuciones de las variables, 16 00:00:59.040 --> 00:01:02.800 como histogramas, diagramas de caja o diagramas de barras, 17 00:01:02.960 --> 00:01:06.120 son la forma más completa de describir una variable. 18 00:01:06.320 --> 00:01:09.480 Una imagen vale más que diez mil palabras. 19 00:01:14.320 --> 00:01:15.760 Los modelos de regresión 20 00:01:15.920 --> 00:01:19.480 fueron diseñados para responder a la cuestión de la causalidad. 21 00:01:20.080 --> 00:01:21.840 Nos dicen cuál es la probabilidad 22 00:01:22.000 --> 00:01:25.120 de tener un valor específico de la variable dependiente 23 00:01:25.280 --> 00:01:27.800 por cada valor de la variable independiente. 24 00:01:27.960 --> 00:01:30.040 Los primeros modelos de regresión 25 00:01:30.200 --> 00:01:32.800 inventados por el primo de Charles Darwin, 26 00:01:33.040 --> 00:01:37.720 Sir Francis Galton, relacionaban la media de las alturas de los padres 27 00:01:37.880 --> 00:01:39.240 con la altura de los hijos. 28 00:01:39.600 --> 00:01:42.080 Cuanto más alta es la media de los padres, 29 00:01:42.240 --> 00:01:44.160 más alta resulta la de los hijos. 30 00:01:44.320 --> 00:01:46.160 Con el modelo de regresión, 31 00:01:46.320 --> 00:01:48.880 quería comprobar la transmisión hereditaria 32 00:01:49.040 --> 00:01:51.920 de las características de los padres a sus sucesores. 33 00:01:52.680 --> 00:01:55.560 En términos estadísticos, sirven para calcular 34 00:01:55.720 --> 00:01:59.080 la probabilidad condicionada de la variable dependiente. 35 00:01:59.880 --> 00:02:03.360 El tipo de modelo de regresión, depende del nivel de medida 36 00:02:03.520 --> 00:02:07.480 de la variable dependiente, cuantitativo o cualitativo. 37 00:02:08.080 --> 00:02:10.200 En el caso de la condena o absolución, 38 00:02:10.360 --> 00:02:13.280 la variable dependiente es dicotómica, 39 00:02:13.440 --> 00:02:15.920 solo puede adoptar dos valores. 40 00:02:16.400 --> 00:02:19.080 Un modelo adecuado para modelar la relación 41 00:02:19.240 --> 00:02:21.960 entre una variable independiente cuantitativa 42 00:02:22.200 --> 00:02:24.560 y una variable dependiente dicotómica, 43 00:02:24.720 --> 00:02:26.440 es la regresión logística. 44 00:02:27.360 --> 00:02:29.840 Las variables relativas a la dureza de la pena 45 00:02:30.000 --> 00:02:32.400 son todas variables numéricas de razón. 46 00:02:32.880 --> 00:02:35.040 Para encontrar la relación que existe 47 00:02:35.200 --> 00:02:37.320 entre las variables dependientes numéricas 48 00:02:37.480 --> 00:02:40.360 y las variables independientes del modelo teórico, 49 00:02:40.520 --> 00:02:42.960 se puede utilizar una regresión lineal. 50 00:02:46.320 --> 00:02:49.320 Dado que los datos que tenemos son observacionales, 51 00:02:49.480 --> 00:02:52.720 si queremos estimar correctamente cuál es la relación 52 00:02:52.880 --> 00:02:55.760 de una variable independiente sobre la dependiente, 53 00:02:55.920 --> 00:02:59.040 tenemos que construir un modelo multivariante 54 00:02:59.200 --> 00:03:02.480 que nos permita controlar estadísticamente las relaciones. 55 00:03:03.440 --> 00:03:07.600 Si no controlamos estadísticamente, correremos el riesgo de considerar 56 00:03:07.760 --> 00:03:11.040 que existen relaciones, cuando, en realidad, no las hay. 57 00:03:12.960 --> 00:03:14.120 O, al contrario, 58 00:03:14.400 --> 00:03:16.920 ignorar relaciones que en realidad existen, 59 00:03:17.000 --> 00:03:19.960 pero que quedan escondidas por variables supresoras. 60 00:03:20.600 --> 00:03:22.960 Este peligro siempre es posible 61 00:03:23.000 --> 00:03:25.040 cuando no tenemos el control experimental. 62 00:03:25.680 --> 00:03:27.280 En los datos observacionales, 63 00:03:27.520 --> 00:03:31.920 si las variables independientes están a su vez correlacionadas entre sí 64 00:03:31.960 --> 00:03:33.920 y con la variable dependiente, 65 00:03:34.120 --> 00:03:36.600 no seremos capaces de averiguar 66 00:03:36.760 --> 00:03:39.400 el efecto real de las variables independientes 67 00:03:39.560 --> 00:03:42.840 si no estimamos el modelo estadístico multivariante 68 00:03:43.000 --> 00:03:44.840 correctamente especificado. 69 00:03:49.200 --> 00:03:51.960 Los procedimientos y representaciones estadísticas 70 00:03:52.120 --> 00:03:54.400 nos permiten simplificar y entender 71 00:03:54.560 --> 00:03:56.560 la realidad múltiple y compleja. 72 00:03:57.480 --> 00:03:59.080 En el proceso de investigación, 73 00:03:59.240 --> 00:04:03.040 hay que explorar diferentes modelos que, de acuerdo con la teoría, 74 00:04:03.200 --> 00:04:05.080 explican los fenómenos de interés. 75 00:04:05.840 --> 00:04:09.480 No podemos conformarnos con el primer resultado que obtengamos, 76 00:04:09.640 --> 00:04:11.800 ya sea confirmatorio o negativo, 77 00:04:11.960 --> 00:04:14.720 de las hipótesis teóricas que hemos formulado. 78 00:04:15.480 --> 00:04:20.760 Hay muchas variaciones posibles en cómo las variables son medidas, 79 00:04:20.920 --> 00:04:23.240 en las especificaciones de los modelos, 80 00:04:23.400 --> 00:04:26.840 en las variables introducidas en los modelos estadísticos, 81 00:04:27.000 --> 00:04:29.480 y en las relaciones funcionales entre ellas. 82 00:04:30.040 --> 00:04:34.720 Esta incertidumbre hace inevitable el trabajo pesado de explorarlas 83 00:04:34.880 --> 00:04:36.400 para tener más seguridad 84 00:04:36.560 --> 00:04:39.000 de la robustez de los resultados obtenidos. 85 00:04:39.560 --> 00:04:41.640 Todo buen informe de la investigación 86 00:04:41.800 --> 00:04:45.720 tendrá que reportar cuál ha sido la extensión de esta exploración. 87 00:04:46.400 --> 00:04:49.640 Por otro lado, en cualquier investigación cuantitativa 88 00:04:49.800 --> 00:04:52.680 los resultados suelen ser más complejos de lo esperado 89 00:04:52.840 --> 00:04:53.840 según la teoría. 90 00:04:54.200 --> 00:04:56.600 Estos resultados nos obligan a hacer 91 00:04:56.640 --> 00:04:59.320 ajustes ad hoc de nuestras explicaciones, 92 00:04:59.480 --> 00:05:02.120 refinarlas, o hacerlas más detalladas. 93 00:05:02.520 --> 00:05:05.520 Aunque en el momento de la investigación son engorrosos, 94 00:05:05.680 --> 00:05:09.800 estos desajustes entre lo encontrado y lo que esperamos, 95 00:05:09.960 --> 00:05:12.440 son la marca de la auténtica investigación. 96 00:05:15.800 --> 00:05:18.160 Los resultados tienen que ser presentados 97 00:05:18.240 --> 00:05:21.520 de la manera más simple e inteligible para los lectores. 98 00:05:22.160 --> 00:05:24.480 La utilización de los recursos visuales 99 00:05:24.680 --> 00:05:27.920 es la mejor forma de comunicar la información compleja 100 00:05:28.080 --> 00:05:29.960 de los resultados estadísticos. 101 00:05:30.600 --> 00:05:32.840 Tanto las tablas como los gráficos 102 00:05:32.880 --> 00:05:36.040 tienen que ser lo más simples que sea posible, 103 00:05:36.200 --> 00:05:37.880 para comunicar eficazmente 104 00:05:38.040 --> 00:05:40.960 la información que es relevante de la investigación. 105 00:05:44.840 --> 00:05:48.320 El reto final de llevar adelante una investigación empírica 106 00:05:48.480 --> 00:05:50.120 es escribir el informe. 107 00:05:50.960 --> 00:05:53.200 Durante todo el proceso de investigación, 108 00:05:53.360 --> 00:05:56.320 se tiene que intentar escribir lo máximo posible, 109 00:05:56.480 --> 00:05:59.600 ya que, en el proceso de escribir, es más fácil detectar 110 00:05:59.760 --> 00:06:02.240 problemas lógicos en nuestros argumentos. 111 00:06:02.800 --> 00:06:04.440 Un trabajo de investigación 112 00:06:04.480 --> 00:06:07.480 tendría que ser visto como una cadena lógica 113 00:06:07.640 --> 00:06:11.440 en la cual, de la pregunta, se derivan unos supuestos teóricos 114 00:06:11.600 --> 00:06:14.920 que se intentan comprobar empíricamente con la observación, 115 00:06:15.080 --> 00:06:18.160 y de cuyo resultado, se deriva una conclusión. 116 00:06:19.120 --> 00:06:21.280 Las revistas académicas empíricas 117 00:06:21.440 --> 00:06:24.400 han desarrollado un esquema relativamente rígido 118 00:06:24.440 --> 00:06:26.080 para facilitar la comunicación 119 00:06:26.120 --> 00:06:28.560 de los elementos clave de la investigación: 120 00:06:56.240 --> 00:06:58.960 Esto sigue la estructura del reloj de arena. 121 00:06:59.600 --> 00:07:01.920 La redacción del informe de investigación 122 00:07:02.080 --> 00:07:05.600 para la publicación tiene que seguir las normas de la revista, 123 00:07:05.760 --> 00:07:06.880 del editor del libro, 124 00:07:07.040 --> 00:07:10.920 o del organismo o institución que ha encargado la investigación. 125 00:07:12.680 --> 00:07:13.720 En general, 126 00:07:13.880 --> 00:07:17.200 respecto a todos los elementos del informe de investigación, 127 00:07:17.360 --> 00:07:20.440 hay que pensar en cómo contribuyen a comunicar, 128 00:07:20.600 --> 00:07:22.600 de manera eficaz y eficiente, 129 00:07:22.800 --> 00:07:25.400 la investigación que se ha llevado a cabo.