Este es el repositorio con el contenido del curso Estadística Computacional de la Maestría en Ciencia de Datos del ITAM impartido por el Prof. Miguel Escalante.
- El alumno se sentirá cómodo interactuando con línea de comandos.
- El alumno podrá mantener un repositorio de código versionado de sus archivos y programas.
- El alumno se sentirá cómodo con herramientas del cli.
- El alumno se sentirá familiarizado con los lenguajes de programación:
R
yPython
- El alumno se familiarizará con los conceptos base de la nube.
- El alumno se familiarizará con Docker y herramientas de contenedores.
- El alumno estará cómodo generando consultas complejas de SQL.
El objetivo en pocas palabras es que construyan capacidades técnicas de programación básicas para afrontar problemas asociados a la ciencia de datos, este es un curso introductorio pero me gusta profundizar en los temas que vemos, por lo que …
- Pasaremos el tiempo de la clase aprendiendo a codificar para resolver problemas de ciencia de datos.
- Algunas actividades requerirán que se haga Programación en pares
- Las tareas estarán basadas en las habilidades que desarrolles en clase ¡Trata de no faltar!
- Practicar es la única manera de volverse bueno en esto. Lo más probable es que pases de 8 a 12 horas por semana (además del tiempo de la clase) escribiendo y debugeando código.
- Si tienes problemas con la tarea, pregúntame, o busca ayuda de tus compañeros. NO esperes a que sea demasiado tarde para tomar tu destino en tus manos.
Escribe a [email protected]
y por favor que el subject del correo diga [Estadística Computacional 2023]
.
- Git + Github + Git flow
- Docker
- basics
- docker-compose
- Cli
- pipe
- SED
- Awk
- cat
- grep
- SQL
- Basics
- Joins
- Inserts
- Python
- Pandas
- Flask
- Dash
- Aws
- EC2
- S3
- RDS
- R
- Basics
- Rproj
- Dplyr
- Rmarkdown
- Shiny
- Visualización
La calificación final está compuesta de la manera siguiente:
Entregable | Porcentaje |
---|---|
Primer Parcial | 30% |
Examen Final | 30% |
Proyecto Final (equipos) | 30% |
Presentación | 10% |
A la mitad del semestre haremos una evaluación con los temas vistos hasta el momento, todo lo visto o mencionado en clase es sujeto a ser evaluado en este examen. Tendrá un componente teórico y un componente práctico, más o menos al 50%.
Al final del semestre tendremos una evaluación global de temas del curso, abarca todo el contenido que hayamos visto hasta ese momento. Habrá componentes teóricos y prácticos alrededor del 50% cada uno.
Al final del semestre también espero que entreguen un proyecto englobando todos los conceptos que veamos. Será entregar un dashboard de analítica avanzada con interactividad. El equipo puede ser de a lo más 3 personas y será asignado aleatoreamente.
Una parte fundamental de la ciencia de datos es el presentar resultados a los interesados en el problema, por lo que para ejercitarlo se harán presentaciones de 5 minutos, (si 10% de su calificación en 5 minutos). Los 5 minutos son para establecer un hallazgo que hayan tenido en algún dataset que les interese. Tendremos presentaciones como esta durante el curso y cuando sea momento abriré los lugares para que se puedan organizar.
Para la evaluación del código que lleguen a escribir se contemplará la siguiente escala a manera de referencia.
Puntos | Descripción |
---|---|
5 | Excelente. Código limpio, conciso, documentado y exploró los conceptos en profundidad. |
4 | Completo y correcto. Incluye el análisis, el programa, el caso de pruebas y responde a las preguntas planteadas. |
3 | Contiene unos cuentos errores menores. |
2 | Entrega parcial o tiene errores mayores. |
1 | Le faltó mucho. |
0 | Ni lo intentó :( |
El proyecto se evaluará promediando las siguientes categorías. Se usará la escala recién mostrada en cada una de ellas.
Categoría | Descripción |
---|---|
Diseño | El proyecto está bien organizado, fácil de seguir y se especifica claramente el problema a resolver. |
Documentación | Instrucciones de como ejecutar el código. Nombres de las variables y funciones son descriptivas. Incluye comentarios para que el lector pueda seguir el algoritmo. Se incluyen casos de prueba. |
Completez | Todos los elementos del proyecto están incluidos. |
Correcto | La lógica del código es correcta y produce resultados con sentido. |
Análisis | Todas las preguntas de análisis en la descripción del proyecto fueron resueltas. La interpretación del resultado está incluida. |
Al final del curso, tendrás que mostrar tu proyecto en 15 minutos a la clase. Se calificará por mí y por tus compañeros.
- El código NO es la respuesta.
- La gráfica NO es la respuesta.
- Debes de mostrar que entendiste la solución y el problema.
Adaptado del departamento de ciencias de la computación de Grand Valley State University y de George Washington University)
- Se espera que tú…
- Crees / desarrolles tus tareas (incluyendo el código fuente).
- Entiendas tus soluciones
- Reconozcas la ayuda de otros en la escritura.
- Cites la fuente en la tarea.
- Te protejas de sospecha al no permitir que otros vean tu tarea antes de que sea enviada.
- Contactes al profesor para aclarar los requerimientos de las tareas.
- Uses extensivamente Github para socializar el conocimiento, soluciones, dudas, etc.
- Se prefiere que tú…
- Discutas diversos caminos para alcanzar la solución.
- Compartas tu conociemiento con otros estudiantes acerca de errores de sintáxis, trucos de código, etc.
- Proveas y recibas ayuda respecto a errores de ejecución.
- Proveas y recibas ayuda usando el ambiente de computación.
- Participes, junto con otros estudiantes, en discuiones hacer de las tareas, requerimientos, estrategais de solución, etc.
- Eres culpable de romper el código de conducta si …
- Le das tu código fuente a cualquiera en formato electrónico o analógico.
- Recibes de otro estudiante la solución en formato electrónico o analógico.
- Subes al repositorio como tuyos otros archivos, soluciones o documentos.
- Subes tareas sin indicar que colaboraste con alguien.
- Realizas modificaciones al código en un esfuerzo de ocultar un engaño.
- Usas material no permitido en examen o te comunicas con alguien de manera no autorizada durante el examen.
Primer tarea!!
- Instalar
git
- Si estás en una distro de
GNU/Linux
tipoDebian
:sudo apt-get install git
. - Si estás en una MacOS sigue las instrucciones de aquí y sigue las instrucciones.
- Si estás en una distro de
- Crea una cuenta en github
- Instalar docker
- Instalar un editor de textos
GNU/Emacs
VsCode
Después de tener converso al director de la Maestría, estoy convencido del valor que provee tener una herramienta como Emacs disponible, tanto para temas de escritura científica, como para programación, durante el curso verán que uso esta herramienta. Denle una oportunidad aunque su curva de aprendizaje sea un poco inclinada. :)
Por favor entren aquí y agreguen su información, para tener los usuarios de github y la lista de las CU’s.