eda_project

Análisis exploratorio de datos sobre entrega de pedidos

https://github.com/alejandro-barba/eda_project

Science Score: 18.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
    Found CITATION.cff file
  • codemeta.json file
  • .zenodo.json file
  • DOI references
  • Academic publication links
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (2.1%) to scientific vocabulary
Last synced: 10 months ago · JSON representation ·

Repository

Análisis exploratorio de datos sobre entrega de pedidos

Basic Info
  • Host: GitHub
  • Owner: Alejandro-Barba
  • License: mit
  • Language: Jupyter Notebook
  • Default Branch: main
  • Size: 1.03 MB
Statistics
  • Stars: 0
  • Watchers: 1
  • Forks: 0
  • Open Issues: 1
  • Releases: 0
Created over 2 years ago · Last pushed over 2 years ago
Metadata Files
Readme Contributing License Citation

README.md

Análisis exploratorio de datos sobre tiempos de entrega de pedidos

Descripción del Proyecto

En este proyecto se realiza un análisis exploratorio de datos para tener un primer acercamiento a las fechas de los diferentes pasos en el proceso de entrega de pedidos de una empresa ficticia.

Pregunta de estudio

¿Que parte del proceso podemos mejorar para reducir los tiempos de entrega de pedidos?


Creación de valores dummy

Si deseas crear valores dummy para utilizar el código mostrado ingresa al notebook createdummydata y genera tu fuente de datos, este archivo cuenta con las siguientes funciones:

  • generatedummydf Genera un dataframe con valores aleatorios y congruentes
  • add_outliers Agrega outliers al dataframe
  • introducemissingvalues Intriduce valores vacíos al dataframe

No olvides guardar tu archivo en CSV corriendo la ultima celda del notebook

En caso de que tengas datos reales asegúrate que tengan el siguiente formato:

| IDpedido | Fechapedido | Fechapicking | Fechafactura | Fecha_entrega | |-----------|--------------|--------------|--------------|--------------| | 1 | DD/MM/YYYY | DD/MM/YYYY | DD/MM/YYYY | DD/MM/YYYY |


Ver el análisis

Para ver el proceso del análisis utiliza en archivo eda.ipynb corriendo linea por linea

Resumen de resultados

  • Se observan algunos valores vacíos Empty values plot

  • No se observa una alta correlación sobre la falta de valores en las variables

  • Se observan algunos outliers que al ser pocos, se procede a eliminar

  • Se observa que los días entre el pedido y la factura no tienen tanta variablilidad, como los dias de la factura a la entrega

  • No se observa correlación entre estas 3 variables

  • Con los gráficos de cajas y bigotes se puede observar la media y desviación de las 3 variables Box plot

  • Viendo las medias se puede observar que los días entre la factura y la entrega representan la mayor parte de los días del proceso de envíos

Radial plot


Conclusión

En base al análisis exploratorio de los datos se puede observar que el proceso en el que debemos enfocarnos para mejorar los tiempos de entrega es el transporte hacia el cliente, que es lo que sucede entre la factura y la entrega, pues esto representa el 58% del tiempo total del proceso.


Referencias

https://altair-viz.github.io/index.html

https://matplotlib.org


Proyecto compartido en Facebook (necesario para completar la actividad)

Facebook share

Este proyecto se realizó utilizando la version 3.11.2 de python

Owner

  • Name: Alejandro Barba
  • Login: Alejandro-Barba
  • Kind: user
  • Location: México
  • Company: @tecnolite

Citation (CITATION.md)

# Citation

Por favor cita este trabajo de la siguiente forma:

Alejandro Barba. 2023. "Análisis exploratorio de datos". https://github.com/Alejandro-Tecno/EDA_project.git

GitHub Events

Total
Last Year