Jesús Zavala
Jesús Zavala
 

2293020 - Métodos Cuantitativos en Geografía I

Presentación

Programa Analítico de la UEA
Métodos Cuantitativos en Geografía I
(Teoría y Práctica)

Licenciatura en Geografía Humana

Clave UEA: 2293071, Grupo: HD01, Trimestre: 20-O
Horario: Lunes y Miércoles de 10:00 a 12:00
Asesorías: Lunes de 20:00 a 22:00 hr.
Salón: En línea, vía Google Meet.


profr: dr. Jesús Zavala Ruiz

jzr@xanum.uam.mx

Telegram: @jzavalar


Introducción

La finalidad es conocer científicamente el objeto. Toda investigación científica implica plantearse el desafío de diseñar un experimento y ello implica, en principio, diseñar un instrumento de recolección de datos o cuestionario, cuando se trata de una investigación social. Después, viene el muestreo y el levantamiento de los datos y su preparación o procesamiento para su análisis. Una de las estrategias es el análisis exploratorio de datos y otra es el análisis explanatorio o estadístico de los datos. La finalidad de la investigación es generar conclusiones al describir el objeto de investigación o al comprobar las hipótesis planteadas originalmente. Para una discusión sobre el saber y el conocer, incluyendo en la ciencia, ver Creer, Saber, Conocer de Luis Villoro (2002) y para una discusión desde la perspectiva de las ciencias sociales ver El Oficio de Científico de Pierre Bourdieu (2003).

En la actualidad, cada vez hay mayor disponibilidad gratuita de datos secundarios. Por ejemplo, CORGIS que se presenta como la colección de conjuntos de datos realmente grandes, interesantes y situados, RDatasets que contiene cerca de 1500 conjuntos de datos incluidos en los paquetes el lenguaje de programación R para practicar análisis estadístico, los 21 lugares donde encontrar conjuntos de datos es un buen lugar para comenzar, que contiene datos de la NASA (sobre la tierra y el espacio), Amazon Web Services (AWS), Google, Kaggle, UCI y Data World, entre otros. En México, el Instituto Nacional de Estadística y Geografía (INEGI) desde hace tiempo puso a disposición del público prácticamente toda su información estadística y geográfica, así que es posible realizar infinidad de estudios con ella; por ejemplo el Censo Nacional de Población y Vivienda de 2010 (INEGI, 2010). En este periodo de pandemia por Covid-19 hay muchos datos al respecto en México y en el mundo.

También hay gran disponibilidad gratuita de herramientas de análisis estadístico. Por ejemplo, en lugar de usar el software SPSS, es posible usar el PSPP que es una implementación libre del primero o JASP, que se presenta como una herramienta para hacer estadística de una manera fresca e intuitiva. Sin embargo, el mejor software para el análisis de estadístico es el lenguaje de programación R (ver MOOC Aprende R), que se usa con algún entorno gráfico (GUIs o frontends). Los GUIs más utilizados con R son: RCommander, RKWard, Rattle (una herramienta para minería de datos, (artículo, Jamovi (un fork y migración de JASP a R (curso y libro)), Deducer (se presenta como la mejor alternativa SPSS, JMP y Minitab y el análisis geográfico con un plugin (video)) o lo que considero como la mejor alternativa: RStudio (en el escritorio o en linea.

Como es posible apreciar, el problema de aprender los métodos de análisis de datos no tiene que ver con la disponibilidad de datos o de software, sino del dominio de los principios o fundamentos sobre la o las preguntas de investigación, es decir, conocer el fenómeno, la naturaleza de los datos y la teoría estadística pertinente para su análisis. En ese sentido, conocer la teoría del fenómeno en estudio es más importante que dominar la teoría estadística, pues su aplicación resulta, hasta cierto punto, puede resultar rutinaria. Sin embargo, ésta se requiere para interpretar de manera adecuada los resultados gráficos y/o numéricos que se elaboran.

 Esta UEA pretende proporcionar las bases teórico-prácticas para que los alumnos manejen una computadora como herramienta de trabajo escolar y laboral y le saquen el mejor provecho y que exploren por su cuenta este vasto mundo del cómputo.

Programa vigente (url).
Calendario escolar (url) (pdf).

Objetivo

General

Que al final del curso los alumnos sean capaces de

Comprender los principios fundamentales de la estadística descriptiva e inferencial para su aplicación a la investigación social y en particular de la geografía, mediante software de análisis estadístico.

Contenido Sintético

Unidad 0. Presentación

0.1. Presentación de los participantes

0.2. Panorama de las herramientas de aprendizaje y colaboración en línea: Google Drive, RStudio Cloud.

0.3. Presentación del programa

0.4. Evaluación Global y de Recuperación

0.5. Acceso a nueva plataforma de Virtuami.

0.6. Prácticas

Práctica 0.1: Bases de trabajo colaborativo con Google Drive(Demostrativa online).

Objetivo: Aprender las operaciones con archivos y directorios en Google Drive, como un ejemplo de plataformas de cómputo en la nube. 

Cree la estructura de directorios en Google Drive para la entrega de controles de lectura, prácticas y proyecto final de acuerdo a un sistema de organización de archivos (guía). (tutorial).

Práctica 0.2: Introducción a RStudio(Demostrativa online).

Objetivo: Aprender el manejo esencial de R y RStudio en el escritorio y el la nube.
Conozca y aprenda la interfase gráfica de RStudio (guia 1, guía 2). Aprenda a crear proyectos de R. Instale y cargue paquetes, por ejemplo tidyverse y rio

Instale R y RStudio. Conozca, descargue y use a las hojas de referencia, cheatsheets o acordeones de RStudio y sus traducciones al español para estudiar y dominar los temas. Por ejemplo, de la Introducción a R, copie todo el código a RStudio, ejecútelo y estudie los resultados (código).

Ejecute código o scripts de R, a partir de ejemplos. Use la hoja de referencia para importar, cargar y guardar datos (guía) con los paquetes readr y rio. Manipule los datos con el paquete dplyr (guía). Cargue dataframes y conviértalos a tibbles con el paquete tibble y transforme los datos de distintas formas para que queden como usted lo requiere (guía) usando el paquete dplyr. Grafique datos usando los paquetes ggplot2 (guía) y survminer (guía). (ver Programa de Instroducción a RStudio).

Práctica 0.3: Instalación de software para grabación de video (Demostrativa online y en casa). 

Objetivo: Aprender a descargar, instalar y usar una aplicación básica de software para grabar video y una para audio y aprender a buscar tutoriales en YouTube para utilizarlo.

Instale vokoScreenNG (guía). Grabe su pantalla y capture la toma de la cámara y hable sobre las expectativas que tiene del curso usando el software. Puede agregar algún fondo musical.

Busque en YouTube los tutoriales que le sirvan para completar la práctica con éxito.

Al terminar suba su videos a su Google Drive donde corresponda, según los directorios de la Práctica 0.1.

Unidad 1. Bases de datos

1. El objeto de estudio

2. El definición y tipos de variables

3. Tipos de datos y operaciones

4. Bases de datos

5. Prácticas

Práctica 1.1. Base de datos tabular. (Entrega: 9 de enero de 2021).

Objetivo: Comprender lo que es una base de datos tabular.

Material de apoyo: Base de datos del Censo de Población y Vivienda 2010, del INEGI (url). Síntesis Metodológica y Conceptual (pdf), Cuestionario Básico (pdf), Cuestionario Ampliado (pdf), Descripción de la Base de Datos (xls), Catálogo General de Localidades (CIGEL) (dbf en zip) y Catálogos del Cuestionario Ampliado (dbf en zip) y muestras de la base de datos (Personas y Viviendas). 

Tip: Use el paquete rio de R en RStudio para importar o convertir los archivos DBF, DTA, SAS y SAV y compruebe su eficacia. 

Descargue los archivos del material de apoyo. Ábralos y compare el cuestionario básico, la descripción de la base de datos y las muestras de la base de datos y saque sus conclusiones. En la muestra de la base de datos, identifique las tablas, los campos, dominio y los registros. También identifique el objeto de investigación, las variables, los tipos de variables y los niveles.

Utilice los distintos paquetes de R para el análisis exploratorio de los datos (como funModelig) o las herramientas de análisis y manipulación de datos con los paquetes de Tidyverse (dplyr, forcats, etc.) que requiera según las guía 1 y guía 2.

Para esta y todas las prácticas subsecuentes, grabe su pantalla, realícela y explique al expectador. Puede agregar algún fondo musical. Al terminar suba su videos a su Google Drive donde corresponda, según los directorios de la Práctica 0.1.  

Busque en YouTube los tutoriales que le sirvan para completar la práctica con éxito. 

Tarea 1.1: Teoría de las bases de datos relacionales. (Entrega: 9 de enero de 2021).

Resuelva el siguiente cuestionario (parte 1, parte 2, parte 3) en su cuaderno de apuntes para que refuerce la teoría a partir de los tutoriales de las lecturas de la bibliografía obligatoria de la unidad.

Si requiere, busque en Scholar Google o en la biblioteca digital algún artículo o libro que le pueda complementar.

Suba las fotos (legibles) de la tarea a su cuenta de Google Drive, en la carpeta respectiva, con el nombre de la práctica.  

Práctica 1.2. Análisis exploratorio de datos con R. (Entrega: 20 de enero de 2021).

Objetivo: Aprender la metodología del análisis exploratorio de datos.

Previamente, debe realizar la Práctica 1.1. Utilice los datos de Práctica 1.1., la Lectura 1.3. y las lecturas de la bibliografía complementaria. Haga un acordeón con el inventario de las funciones y de los procedimientos de análisis mediante un script de R. Tome como guía lo siguiente:

Parte 1. La preparación de datos, exploración y transformación de los datos. 1.1. Antes que nada, haga un respaldo de los datos; luego, procéselos. 1.2. Cree o corrija el diccionario de datos (campos y significado de las variables, registros). 1.3. Identifique las distintas tablas que constituyen la base de datos. 1.4. Identifique la llave primaria de cada tabla y las relaciones entre las tablas. 1.5. Luego, identifique los tipos de datos de cada variable (numérico o categórico). 1.6. Haga las conversiones pertinentes entre los tipos de datos, en cada variable. 1.7. Codifíquelos correctamente al tipo de dato adecuado y/o transforme o recalcule los campos. 1.8. Identifique los datos faltantes, ausentes o perdidos (NA) y tome nota de las consecuencias para el análisis. 1.9. Prepare la base de datos en los subconjuntos necesarios, mediante las operaciones de conjuntos necesarios (joins).

Parte 2. Estadística descriptiva. 2.1. Aplique las funciones básicas a las de las variables numéricas. 2.2. Las funciones de descripción de datos.

Parte 3. Agrupamiento de datos. 3.1. Cree las tablas de contingencia. 3.2. Discretización de valores. 3.3. Agrupamiento y selección.

Parte 4. Reordenamiento de datos. 4.1. Rankings. 4.2. Unión (joins) y partición de datos.
 

Parte 5. Graficación. 5.1. Graficación básica (plot y animation): puntos, cajas, líneas, sectores, histogramas y curvas de densidad, agrupación de gráficos y animaciones. 5.2. Graficación avanzada (ggplot2): nubes de puntos, graficas de líneas, curvas de regresión, curvas de densidad, composición. 5.3. Otras gráficas: funciones, circlize, radar, 3D. 

Al terminar suba su scrpt a su Google Drive donde corresponda, según los directorios de la Práctica 0.1.  

Busque en YouTube los tutoriales que le sirvan para completar la práctica con éxito.  

Bibliografía Obligatoria:

  • Quiroz, J. (2003). El modelo relacional debases de datos. Boletín de Política Informática (INEGI), (6), 53-61. (url). (Lectura 1.1).
  • EDteam. (2020, Feb 13). ¿Qué son las bases de datos y cómo funcionan?. YouTube. (url). (Lectura 1.2).
  • Carvajalino, E. (2010, May 6). Todo tobre: Base de datos. YouTube. (url). (Lectura 1.3).
  • Charte Ojeda, F. (2014). Analisis exploratorio y visualizacion de datos con R. (pdf). (Lectura 1.4).

Bibliografía Complementaria:

  • Bravo Márquez, F. J. (2013, Nov 13). Análisis exploratorio de datos en R. (pdf). 
Unidad 2. Estadística descriptiva

 
1. Medidas de tendencia central y medidas de dispersión.

2. Estadísticos para variables cualitativas y cuantitativas.

3. Gráficos para variables cualitativas y cuantitativas.

4. Aplicación:
a. Utilización del valor índice medio.
b. Tipologías y clasificación de unidades territoriales mediante la metodología del valor índice medio.
c. Empleo de índices en el análisis regional.
d. Determinación de cambios en el tiempo.
e. Tasa de incremento medio anual. 
f. Concepto y cálculo del índice de Gini.
5. Prácticas:

Práctica 2.1. Estadística descriptiva. (Entrega: 20 de enero de 2021).

 

Objetivo: Aprender la teoría y la aplicación de la estadística descriptiva.


Bibliografía Obligatoria:

 
  • Spiegel, M. R., Schiller, J. J., and Srinivasan, R. A (2013). Probabilidad básica. In Probabilidad y estadística (pp. 3-33). México: McGraw-Hill/Interamericana. (Lectura 1.1). (Entrega: 14 de diciembre de 2020.
  • Spiegel, M. R., Schiller, J. J., and Srinivasan, R. A (2013). Teoría del muestreo. In Probabilidad y estadística (pp. 153-194). México: McGraw-Hill/Interamericana. (Lectura 1.1). (Entrega: 14 de diciembre de 2020.
  • Spiegel, M. R., Schiller, J. J., and Srinivasan, R. A (2013). Variables aleatorias y distribuciones de probabilidad. In Probabilidad y estadística (pp. 34-74). México: McGraw-Hill/Interamericana. (Lectura 1.2). (Entrega: 14 de diciembre de 2020.
  • Li, S.-T. (2019, Oct 9). Cheat sheet for Python dataframe ↔ R dataframe syntax conversions. Towards Data Science. (url). (Una mini-guía para los que tiene familiaridad con el análisis de datos usando Python o R y quieren aprender rápidamente los fundamentos del otro lenguaje de programación)


Distribuciones.

Introducción a la probabilidad.

Distribuciones de probabilidad discretas (binomial y Bernoulli).

Distribuciones de probabilidad continuas (normal).

Distribuciones de medias de poblaciones normales.

Introducción a la inferencia. Conceptos básicos de inferencia.

Estimación puntual y por intervalos.

Conceptos básicos de la estimación puntual.

Estimación puntual del parámetro p en la distribución Bernoulli.

Estimación de la media en la distribución normal.

Conceptos básicos de la estimación por intervalos.

Intervalo de confianza para una proporción.

Intervalo de confianza para la media de la distribución normal.

Muestreo aleatorio simple.

Población finita y marco de muestreo.

Identificación de los parámetros necesarios para determinar el tamaño de la muestra.

Cálculo del tamaño de muestra para intervalos de confianza para la media.

Cálculos del tamaño de la muestra para intervalos de confianza para una proporción.

Prueba de Hipótesis.

La inferencia estadística en las pruebas de hipótesis.

Definición de prueba de Hipótesis Estadística: Hipótesis nula e hipótesis alternativa.

Pruebas unilaterales y bilaterales.

Niveles de significación e intervalos de confianza.

 

MODALIDADES DE CONDUCCIÓN DEL PROCESO DE ENSEÑANZA-APRENDIZAJE

Podrá realizarse por: exposición del profesor y participación de los alumnos y las alumnas, discusiones dirigidas, exposiciones individuales o de grupo u otras que sean dadas a conocer al principio del curso. El aprendizaje de las herramientas estadísticas se reforzará con prácticas en la Sala de Informática.

 

MODALIDADES DE EVALUACIÓN

Global

Incluirá evaluaciones periódicas y/o evaluación terminal. Estas evaluaciones podrán realizarse a través de elaboración de fichas, controles de lectura, participación en clase, exámenes escritos diseñados, aplicados y evaluados individual o colectivamente, exposiciones individuales o de grupo y elaboración de trabajos de investigación. Los factores de ponderación serán a juicio del profesor. Éstos serán dados a conocer a los alumnos y las alumnas al principio del curso.

Recuperación

Podrá incluir un trabajo de investigación sobre algún tema del programa (que deberá entregarse en la fecha señalada en el calendario de evaluación de recuperación aprobado por el Consejo Académico) y/o una evaluación escrita, que se hará con base en los contenidos del programa y puede ser de todo el curso o de una parte.

 

BIBLIOGRAFÍA NECESARIA O RECOMENDABLE

Anderson, David, Sweeny Denis y William Thomas (2000), Estadística para administración y economía, International Thompson Editores, México.

Chistensen, Howard B. (1999), Estadística paso a paso, Trillas, 4a. Edición, México

Ebdon, David (1982), Estadística para Geógrafos, Ed. Oikos-Tau, Barcelona.

Freund, John, E y Gary A. Simon (1994), Estadística elemental, Ed. Prentice Hall, 8a. ed.

Guerrero, G. Víctor, Manuel (2000), Estadística básica para estudiantes de economía y otras ciencias sociales, Ed. F.C.E., 2a. Edición, México.

Mayntz, Renate, Kurt Holm, Peter Hüber (1996), Introducción a los métodos de la sociología empírica, 6ª edición, Ed. Alianza Universidad, Madrid.

Mendenhall, W. y Reinmuth, James (1981), Estadística para la administración y economía, Grupo Ed. Iberoamérica.

Pérez Sandoval Blanca Rosa (1992), Estadística para las Ciencias Sociales, Vol. I. UAM-Iztapalapa. Libros de texto, México.

Pierdant Rodríguez, Alberto Isaac (2000), Estadística descriptiva con Excel 97, 2a edición, Universidad Autónoma Metropolitana-Xochimilco, México.
 
----
Ejercicios (url).