Guía de aprendizaje

Nombre del curso
Estadística de datos geotécnicos.
Código del curso
3010139.
Profesor
Ludger O. Suarez-Burgoa (PhD, C.Eng, M.ASCE).
Créditos
4.
Intensidad horaria
32 horas.
Horarios
Sábados de 08:00 a 12:00.
Grupo
Estudiantes de posgrado del área curricular de ingeniería civil.
Fecha de inicio
4 de mayo de 2020
Fecha de finalización
5 de septiembre de 2020
Breve descripción del programa
La estadística de datos geotécnicos es la instauración de las matemáticas a objetos aleatorios para el estudio de la corteza terrestre con fines de aplicación a la ingeniería geológica y geotécnica. Estudia la forma de representar bajo el marco de las matemáticas: el muestreo de unidades geológicas, las distribuciones en el espacio y los patrones de comportamiento. A partir de ello posibilita diseñar simulaciones y modelos matemáticos a través de la automatización con lenguajes de programación.

El propósito de esta guía es presentar a los estudiantes la información más relevante para orientarlos durante esta experiencia de aprendizaje virtual en el tema de estadística de datos geotécnicos.

Presentación

Los invito a que cada uno sea el motivador de su propio curso, manteniendo una comunicación permanente y asertiva a través de los canales diseñados para este curso, tanto conmigo (el orientador) como sus compañeros del curso. Este curso le proporcionará las bases para usar los conceptos de la estadística para facilitar la solución de diferentes problemas de principio cualitativo o problemas cuantitativos aplicados en la ingeniería geológica y geotecnia, todo esto facilitado por lenguajes de programación tales como R, Octave (Matlab) o Python.

Se han hecho los mayores esfuerzos para ser un curso claro, conciso, con procedimientos paso a paso, enfocado en explicaciones intuitivas, una aproximación no estrictamente lineal, con ejemplos fáciles de sobrellevar y un lenguaje poco técnico (aunque uno de los objetivos del curso es justamente lo contrario: que el estudiante aprenda el lenguaje técnico de la geología).

Los invito a seguir el curso. Mucha suerte y hasta pronto.

Prerequisitos

Se asume (tal vez ingeniosamente) que el estudiante que cursará esta asignatura tenga aprobado una asignatura de pregrado donde tratan de la estadística de datos escales univariates, lo más común es que sea en las asignaturas impartidas en su curso profesionalizante. Por ejemplo, no hay nadie que desconozca la estadística descriptiva: las medidas centrales, medidas de variabilidad, percentiles; que sepa hacer gráficas de distribución de frecuencias o que desconozca las distribuciones normal y la t-student, o desconozca hacer una regresión lineal. Tal vez, lo que más nos costó fue la parte de pruebas de hipótesis o intervalos de confianza por su poca aplicación en la ingeniería civil de construcción

También se sobrentiende que el estudiante tiene experiencia alta en el manejo de hojas de cálculo, como es el Excel de Microsoft (aunque hay muchos más).

De forma avanzada, el estudiante tendrá ventaja si es ya tiene habilidades en programación computacional, en al menos Matlab u Octave.

Sin embargo, es importante que se repase los temas de estadística básica y un libro muy bueno para hacer este repaso rápido es el de Rumsey (2019).

En todo caso, aquí se estudiará asumiendo las limitaciones de amabarcar todo un curso de estadística básica, se repasará estadística univariante hasta cierto punto de detalle y prácticamente el lenguaje de programación R es un mundo muy distinto al de los demás lenguajes de programación. No es muy parecido a Matlab por ejemplo y es distinto a Python; ambos que se mencionaron que se parecen mucho al lenguaje C.

Requisitos tecnológicos

Para esta asignatura virtual, usted debe tener un computador portátil o de escritorio de 64 bits de arquitectura de procesamiento. Asimismo, debe tener acceso a una conexión estable de Internet por lo menos durante 8 horas por semana en un navegador, al menos 5 Giga bytes de conexión de datos. Use de preferencia el navegador Firefox versión 75.0 de 64 bits (o mayor). No se recomienda el uso de Internet Explorer y con cierta sinceridad no gusto mucho de Chrome.

Debe tener acceso de forma segura a la página web de la Universidad Nacional de Colombia, su login y su contraseña institucionales.

Debe tener un conocimiento de la forma de entrar a la plataforma Moodle versión 3.X.

Competencias

Con esta asignatura, se busca que el estudiante maneje el objeto matemático de conjunto y tupla como el principal para manejo de cualquier objeto estadístico de estudio. Pueda diferenciar entre lo que es un escalar, vector, matriz y tensor; estos objetos matemáticos que se usan mucho en la ingeniería. También se buscar que el estudiante emplee el sistema coordenado tridimensional, sea ortogonal, cilíndrico y esférico.

En lo que respecta al manejo del lenguaje de programación R, se quiere que el estudiante pueda diseñar, codificar, depurar y mantener el código que el desarrolle para realizar el análisis de datos mediante los métodos estadísticos que aquí se describirán. El estudiante debe al menos crear archivos de lotes y funciones bajo el paradigma de programación procedimental. No se alcanzará a llegar a programar bajo el paradigma orientado a objetos.

Luego se espera que el estudiante sea capaz de construir la estructura de sus datos en una estructura de tablas relacionales, las cuales serán administradas por un manejador de bases de datos u así dejar de lado el falso concepto que se tiene que un hoja de cálculo es todo en ingeniería; usan hojas de cálculo hasta para almacenar grandes cantidades de datos, estos susceptibles a no mantener el concepto de unicidad (un dato es único, no puede repetirse).

Se quiere destruir en este curso la mala costumbre que tienen los profesionales en la ingeniería civil de querer resolver todo con dos básicas herramientas: una hoja de cálculo y un programa de dibujo asistido por ordenador, más el procesador de palabras. En otras palabras, Excel, Word y Autocad. La capacidad de análisis se abre mucho si uno usar un lenguaje de programación (como R) y un culaquier manejador de base de datos (como PostgreSQL por ejemplo).

Ya entrando a la estadística de datos geotécnicos, un dato geotécnico puede representar un objeto complejo matemático (no un número complejo, sino un objeto que no es sencillo). Por tanto, el estudiante al finalizar el curso debe lograr identificar que objeto está analizando. Eso no es intuitivamente reconocido sin experiencia. Muchos de los errores de análisis de datos parte desde este punto sencillo no reconocieron el objeto que representa el datos que se está analizando.

Se pretende que el estudiante calcule los valores más esperados y las varianzas de los objetos estudiados. Y que a partir de esto genere modelos para la simulación. Esta regla es la médula espinal del análisis de datos, lo único que varía son los métodos para cada tipo de variable; es decir, para cada objeto. Bajo estos dos intereses, se analizaran datos univariados, datos espaciales, datos que representan un tensor y datos que varían en el tiempo en forma cíclica.

Resultados de aprendizaje

Los resultados de aprendizaje parten de las competencias (arriba descritas) que se quiere alcanzar con un cierto grado de habilidad y conocimiento adquirido; por ejemplo, se espera que el estudiante sea capaz de crear su código en lenguaje R de una variable identificada en la toma de decisiones geotécnicas a partir de primero identificar el tipo de variables necesarias para el estudio, luego con los datos tomados o leídos se pueda inferir el comportamiento, con esto definir un modelo que representa ese comportamiento, para que a parir de ello genere nuevos datos que le posibilitará inferir un cierto comportamiento proyectado bajo un grado de certeza y confiabilidad, a tal nivel de tomar una decisión que le genere tranquilidad y seguridad.

Desarrollo de curso

Este es un curso virtual con acompañamiento de tutor, con fechas establecidas y con horarios específicos para su desarrollo. Esto significa que además de las herramientas virtuales para que el estudiante interactúe, se cuenta con acompañamiento del profesor en espacios de interacción sincrónica y retroalimentación de las actividades asincrónicas, promoviendo una interacción entre los participantes del grupo.

Es un curso que tiene evaluaciones establecidas en fechas únicas y determinadas, con una duración de máximo dos horas por prueba.

Las actividades que se tienen son: lecturas de textos y respuesta de cuestionarios, talleres, ejemplos, ejercicios; todos presentados de formas distintas y posibles en la plataforma Moodle.

Es importante que el estudiante adopte un compromiso de auto aprendizaje bajo el marco de la honorabilidad y la honradez.

Interacción

La interacción de este curso se hará a través de los siguientes medios.

Sesión sincrónica semanal
de cuatro horas semanales, dos horas por cuatro días de lunes a viernes de 10:00 am a 11:00 am. Esto para instruir al estudiante para que logre realizar las sesiones asincrónicas.
Sesión asincrónica semanal
de cuatro horas semanales, dos horas por cuatro días de lunes a viernes de 11:00 am a 12:00 md. Esto para afianzar al estudiante en lo que se ha instruido en la sesión sincrónica.
Foro de dudas
donde se pueden solicitar aclaraciones académicas sobre las temáticas desarrolladas en las sesiones sincrónicas e identificadas en las sesiones asincrónicas.

Evaluación

Se tendrá tres tipos de evaluaciones para las tres actividades principales en el curso, que son la siguientes.

Evaluación de taller
En las clases que son o exposición magistral (de forma sincrónica mediante conferencia o de forma asincrónico mediante video) el estudiante recibirá un taller para trabajarlo en casa. Estos tendran un 32 % de la evaluación de la nota. Se harán cuatro talleres en todo el curso, cada uno con 8 % de la nota final.
Exposición.
En las clases donde el estudiante debe exponer un tema (sea en forma sincrónica o asincrónica) producto de una investigatigación en casa, lectura de un artículo o sección de un libro, o la guía de la clase) se le calificará con un 32 < de la evaluación de la nota. Se hará también cuatro de estas presentaciones en todo el curso, cada uno con 8 % de la nota final.
Instalación
Aunque es un requisito para trabajar en todo el curso, es una actividad que necesita adquirir una destreza y tener un resultado. Cada máquina personal es un mundo distinto que solo el dueño la conoce. En el curso se requerirá la instalación de dos programas: R y SQL. Estas tienen una evaluación de 6 % del total de la nota, con un valor individual de 3 %.
Participación
Hay seis conversatorios sincrónicos, donde se hablarán de temas de interés relativo a la asignatura. De estos, se necesita la participación de los estudiantes y la participación tendrá un puntaje total de 30&bvso;%. Se harán seis conversatorios con un valor de 5 % cada uno.

En resumen, la ponderación de las evaluaciones es la siguiente.

Organización de las sesiones de clase

Datos.

  1. Tipos de datos: cualitativos, cuantitativos, discretos, continuos.
  2. Toma de datos.

Manejadores de bases de datos relacionales.

  1. Estructura relacional de datos y bases de datos.
  2. Manejo de datos: almacenamiento, búsqueda, extracción, modificación: lenguaje SQL.

Lenguaje de programación.

  1. Lenguajes tradicionales e historia.
  2. El lenguaje R.

El procedimiento de análisis de datos.

  1. Medidas de valores centrales y valores esperados.
  2. Medidas de varianza.
  3. Distribución de frecuencias.
  4. Ajuste a un modelo probabilista
  5. Verificación del modelo.
  6. Generación de más datos con el modelo.
  7. Proyecciones y toma de decisiones.

Aplicación a datos geotécnicos y geológicos.

  1. Datos univariantes: escalares.
  2. Análisis de secuencia de datos.
  3. Análisis de datos espaciales 1 (variables \(n\)-dimensionales).
  4. Análisis de datos espaciales 2 (escalares que varían en el espacio).
  5. Análisis de datos tensoriales.
  6. Análisis de datos con variación cíclica

Cuadro de organización de sesiones

[Abra este enlace].