aprendizaje-estadistico
Notas para el curso de licenciatura de Aprendizaje Estadistico @ ITAM
Science Score: 36.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
○CITATION.cff file
-
✓codemeta.json file
Found codemeta.json file -
✓.zenodo.json file
Found .zenodo.json file -
○DOI references
-
✓Academic publication links
Links to: zenodo.org -
○Academic email domains
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (5.3%) to scientific vocabulary
Last synced: 7 months ago
·
JSON representation
Repository
Notas para el curso de licenciatura de Aprendizaje Estadistico @ ITAM
Basic Info
Statistics
- Stars: 14
- Watchers: 7
- Forks: 32
- Open Issues: 3
- Releases: 3
Created over 5 years ago
· Last pushed almost 2 years ago
Metadata Files
Readme
License
Citation
README.org
#+TITLE: EST-25134: Aprendizaje Estadstico
#+AUTHOR: Prof. Alfredo Garbuno Iigo
#+EMAIL: agarbuno@itam.mx
#+DATE: ~Primavera 2023~
:REVEAL_PROPERTIES:
#+LANGUAGE: es
#+OPTIONS: num:nil toc:nil timestamp:nil
#+REVEAL_EXTRA_CSS: ./notas/mods.css
#+REVEAL_THEME: night
#+REVEAL_SLIDE_NUMBER: t
#+REVEAL_HEAD_PREAMBLE:
#+REVEAL_INIT_OPTIONS: width:1600, height:900, margin:.2
#+REVEAL_PLUGINS: (notes)
:END:
#+STARTUP: showall
#+EXCLUDE_TAGS: toc github latex
[[https://github.com/agarbuno/aprendizaje-estadistico/actions/workflows/docker.yml/badge.svg]] [[https://img.shields.io/docker/pulls/agarbuno/aprendizaje.svg?logo=docker]] [[https://img.shields.io/docker/image-size/agarbuno/aprendizaje/notas.svg?logo=docker]] [[https://img.shields.io/github/languages/top/agarbuno/aprendizaje-estadistico.svg?logo=r]] [[https://img.shields.io/github/languages/code-size/agarbuno/aprendizaje-estadistico.svg?logo=r]]
[[https://zenodo.org/badge/297475197.svg]]
* Contenido :toc:
:PROPERTIES:
:TOC: :include all :ignore this :depth 3
:END:
:CONTENTS:
- [[#introduccin][Introduccin]]
- [[#objetivo][Objetivo]]
- [[#temario][Temario]]
- [[#de-qu-se-trata-el-curso][De qu se trata el curso?]]
- [[#recursos][Recursos]]
- [[#ambiente-de-trabajo][Ambiente de trabajo]]
- [[#ambiente-de-desarrollo-grfico-integrado-ide][Ambiente de desarrollo grfico integrado (IDE)]]
- [[#configuracin-r][Configuracin R]]
- [[#gestin-de-libreras-de-r-renv][Gestin de libreras de R: renv]]
- [[#ambiente-dockerizado][Ambiente Dockerizado]]
- [[#dudas][Dudas?]]
:END:
* Introduccin :github:
Este es el repositorio con el contenido del curso en *Aprendizaje Estadstico*
ofrecido a estudiantes de semestres avanzados en las licenciaturas de
matemticas aplicadas, ciencia de datos, actuara, economa, etc.
* Objetivo
El Aprendizaje Estadstico trata de cmo establecer reglas de asociacin al
observar un conjunto de datos. En este curso estudiaremos las ideas
fundamentales detrs de las tcnicas de aprendizaje modernas e incorporaremos
conceptos familiares de estadstica. El libro de texto ser [[cite:James2021]] y
lo complementaremos con el enfoque de [[cite:Kuhn2013]]. Se estudiarn, adems,
tcnicas estadsticas modernas aplicadas a modelado predictivo por medio de
lecturas que acompaaran el curso.
#+REVEAL: split
El libro de texto ser:
#+begin_quote
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). /An introduction to statistical learning/. Springer, New York, NY. Second Edition.
#+end_quote
#+REVEAL: split
Nos apoyaremos de:
#+begin_quote
- Kuhn, M., Johnson K. (2013). /Applied predictive modeling/. Springer, New York, NY.
#+end_quote
#+REVEAL: split
El curso, adems, utilizar distintas herramientas computacionales para
brindar al estudiante un marco de trabajo reproducible. Al final del curso, lxs
estudiantes tendrn las competencias para trabajar en proyectos de cdigo
abierto en ambientes reproducibles de trabajo.
#+REVEAL: split
Esto se lograr en el curso al utilizar herramientas de cdigo abierto: ~R~ como
lenguaje de programacin y ~GitHub~ como gestor de entrega y avance de tareas y
trabajos.
#+REVEAL: split
El curso est pensando para cursarse despus de haber acreditado ~Estadstica
Matemtica~ (o equivalente). Sin embargo, se aprovechar mejor si se lleva a la
par junto con ~Estadstica Aplicada II~ (o equivalentes).
* Temario
El temario para el semestre de primavera 2022 se puede encontrar [[https://github.com/agarbuno/aprendizaje-estadistico/blob/spring-2022/docs/temario.pdf][aqui]]. Este es
un plan preliminar que est sujeto al avance del curso a lo largo del semestre.
** De qu se trata el curso?
El material que estudiaremos ser sobre modelos predictivos desde el punto de
vista estadstico. Dicho de otra forma, no ser un curso de /Machine Learning/
*algortmico*. Nos concentraremos en las conexiones entre modelos predictivos y
principios estadsticos que le dan sustento.
* Recursos
El contenido actual de esta iteracin del curso se encuentra en la rama:
[[https://github.com/agarbuno/aprendizaje-estadistico/tree/spring-2022][spring-2023]]. La estructura del repositorio se muestra a continuacin donde
tenemos a grandes razgos:
#+begin_src bash :exports results :results org :eval never
tree -L 1 -d
#+end_src
#+RESULTS:
#+begin_src org
.
docs # Handouts con las notas de clase (pdf).
images # Material visual de apoyo (png).
notas # Material fuente de las notas (eMacs).
renv # Archivos de estructura de ambiente (R).
rscripts # Codigo de R para seguir la clase.
5 directories
#+end_src
* Ambiente de trabajo
El curso es agnstico al lenguaje de programacin. Sin embargo, las notas y el
material estar construido a partir de [[https://www.r-project.org/][R]]. En particular utilizaremos [[https://www.tidymodels.org/][tidymodels]]
como herramienta de programacin dentro de ~R~ pues ofrece una ambiente unificado
de distintas libreras enfocadas en modelos predictivos. Adems, es una
herramienta que representa muy bien la filosofa del curso.
#+REVEAL: split
El ambiente de trabajo est configurado para tener un espacio ~reproducible~. Es decir, independiente del
sistema operativo unificaremos versiones para poder trabajar. Esto lo logramos con las siguientes herramientas
(las menciono pero no espero que tengan familiaridad, a lo largo del curso veremos cmo utilizarlas).
** Ambiente de desarrollo grfico integrado (IDE)
Se sugiere utilizar +[[https://www.rstudio.com/products/rstudio/download/][Rstudio]]+ =Visual Studio Code= para poder trabajar en sus
proyectos y sus tareas. En particular, el material de clase ser editado en [[https://www.gnu.org/software/emacs/][GNU
Emacs]] a travs de =orgfiles= (archivos con sufijo ~.org~) pero pueden ser
visualizados en ~Github~.
** Configuracin ~R~
Utilizaremos ~renv~ para mantener actualizada las herramientas de ~R~ junto con el
contenido del curso. En la carpeta =notas= se encuentran los archivos de
requerimientos (=renv.lock=) con el que podrn usar los archivos que se vayan
decantando en la carpeta =rscripts=. An asi, la configuracin se ir construyendo
en los ejercicios de tarea que vayamos utilizando en el curso.
#+REVEAL: split
*Nota*: Es necesario tener instalada la versin ~4.2.1~ de ~R~ para tener la mejor
compatibilidad con el cdigo del curso.
** Gestin de libreras de R: ~renv~
Se recomienda escribir en el archivo =~/.Renviron= la siguiente lnea lo cual
mantendr el cache de ~renv~ en un lugar centralizado
#+begin_src conf :tangle ~/.Renviron :mkdirp yes
RENV_PATHS_ROOT=~/.renv
#+end_src
** Ambiente /Dockerizado/
Mi idea de ambiente computacional es el que se puede reproducir en cualquier
sistema operativo. Para esto ~Docker~ es la herramienta ideal y el uso de los
~Codespaces~ de GitHub ha resultado increble para una solucin dentro de un
mbito educativo.
#+REVEAL: split
Para la imagen ~agarbuno/aprendizaje~ consideren que:
1) El /tag/ ~notas~ basado en una distribucin linux en una emulacin con un
procesador ~Intel~, tiene la configuracin mnima necesaria para poder
reproducir el ambiente de cmputo para poder ejecutar el material del curso
#+REVEAL: split
Esto no les puede decir mucho, pero bsicamente con el combo
~Docker~ + ~Visual Code Studio~, tod@s tenemos la misma computadora para trabajar! .
Y si lo quieren correr en la nube entonces: ~Docker~ + ~Visual Code Studio~ + ~Github Codespaces~ $\times 10^{78}$.
#+REVEAL: split
~Importante~: No espero que sepan reproducir ustedes la configuracin del ambiente de
trabajo. Si les interesa podemos organizar una sesin para discutir esto a profundidad.
Lo importante es que lo sepan utilizar en su computadora o en un explorador de internet.
Esto es, que pueden utilizarlo para las prcticas del curso.
* COMMENT Referencias :latex:
\nocite{*}
bibliographystyle:abbrvnat
bibliography:references.bib
* COMMENT Plan de trabajo [7/16][43%] :noexport:
:PROPERTIES:
:UNNUMBERED: notoc
:END:
** DONE Motivacion
CLOSED: [2023-01-11 Wed 19:52]
** DONE Aprendizaje Estadistico
CLOSED: [2023-01-19 Thu]
** DONE Regresion
CLOSED: [2023-02-02 Thu]
** DONE Clasificacion
CLOSED: [2023-02-16 Thu]
** DONE Separacin de muestras
CLOSED: [2023-02-23 Thu]
** DONE Validacin cruzada
CLOSED: [2023-03-02 Thu]
** TODO Primer Examen Parcial
** DONE Regularizacion
CLOSED: [2023-03-03 Fri 20:14]
** TODO Modelos no lineales (intro)
** TODO Arboles de decisin
** TODO Modelos de Ensamble (RF y Boosting)
** TODO Mquinas de Soporte Vectorial
** TODO Aprendizaje no supervisado
** TODO Modelos hiper-parametrizados
** TODO Modelos de supervivencia
** TODO Pruebas mltiples
Owner
- Name: Alfredo Garbuno Iñigo
- Login: agarbuno
- Kind: user
- Location: Mexico City
- Company: ITAM
- Website: agarbuno.github.io
- Twitter: AlfredoGarbuno
- Repositories: 71
- Profile: https://github.com/agarbuno
Bayesian inference, non-parametric Bayesian models, MCMC algorithms, Kernel Methods, Data assimilation, Langevin dynamics
GitHub Events
Total
- Watch event: 1
- Fork event: 1
Last Year
- Watch event: 1
- Fork event: 1
Dependencies
.github/workflows/docker.yml
actions
- actions/checkout v3 composite
- docker/build-push-action v3 composite
- docker/login-action v2 composite
- docker/setup-buildx-action v2 composite
.devcontainer/Dockerfile
docker
- agarbuno/aprendizaje notas build
Dockerfile
docker
- rocker/verse 4.2.2 build