Revisión 2. Identificación de Variables
- Fernando Huilca
- 31 may. 2024
- 4 Min. de lectura
Actualizado: 6 jun. 2024
Objetivo del análisis
Objetivo General
- Proporcionar una comprensión clara y objetiva de los datos recogidos en el registro de ventas, permitiendo tomar decisiones informadas. 
Objetivo Específicos
- Analizar los productos en términos de ventas y unidades vendidas, comparando diferentes categorías como el tipo de producto y su prioridad. 
- Identificar los productos más rentables, proporcionando información crucial para optimizar la gestión del inventario. 
- Analizar las tendencias de ventas a lo largo del tiempo, examinando si se dan patrones específicos en ciertos días de la semana. Identificar patrones en las preferencias de los clientes, como qué productos se compran con más frecuencia. 
Identificación de las variables de estudio
Variables de estudio
ID Cliente.- Cualitativa nominal
Zona.- Cualitativa nominal
País.- Cualitativa nominal
Tipo de producto.- Cualitativa nominal
Canal de venta.- Cualitativa nominal
Prioridad.- Cualitativa ordinal
Fecha pedido.- Cuantitativa continua
ID Pedido.- Cualitativa nominal
Fecha envío.- Cuantitativa continua
Unidades.- Cuantitativa discreta
Precio Unitario.- Cuantitativa continua
Coste unitario.- Cuantitativa continua
Importe venta total.- Cuantitativa continua
Importe Coste total.- Cuantitativa continua
Clasificación y estructuración de datos acorde a las preguntas planteadas
- Cualitativa Nominal 
Tipo de producto
Canal de venta
ID Pedido
ID Cliente
Zona
País
- Cualitativa Ordinal 
Prioridad
- Cuantitativa Continua 
Fecha de envío
Fecha de pedido
Precio unitario
Coste Unitario
Importe Venta total
Importe Coste total
- Cuantitativa Discreta 
Unidades
-------------------------------------------------------------------------------------------------------------------------------------
- ¿Cuáles son los clientes que presentan un importe venta total superior a la media? 
Histograma: Un histograma puede mostrar la distribución de los importes de venta total de los clientes, con una línea vertical que representa la media. Los clientes cuyos importes de venta están por encima de esta línea se pueden resaltar.
- ¿Cuál es el continente con unidades superiores a la mediana? 
Gráfico de Barras con la Mediana: Podemos usar un gráfico de barras donde cada barra representa un continente y marcar la mediana de todos los datos como una línea horizontal. Esto nos permitirá ver de manera rápida qué continentes están por encima de esta línea.
- ¿Cuál de las categorías de la variable prioridad es la más baja, respecto a la variable unidades? 
Agrupación y cálculo de la media/mediana: Agrupa los datos por prioridad y calcula la media o mediana de las unidades. Posteriormente se puede plantear un gráfico de barras para visualizar la comparación entre las categorías de prioridad.
- ¿Cómo se distribuye el número de unidades que se venden? 
Diagrama de cajas: este tipo de gráfico es útil para visualizar la distribución de un conjunto de datos, así como para identificar valores atípicos y resumir algunas características clave de la distribución, como la mediana, los cuartiles y los valores mínimos y máximos.
- Si se creara 4 categorías para la variable tipo de producto, ¿cuál categoría es la más frecuente? 
Crear las 4 categorías y comenzar a distribuir los datos dentro de las categorías creadas, para posteriormente representar estos datos en un diagrama de pastel o torta para que se facilite la visualización de cual es la más frecuente.
diagrama de pastel
- ¿Cómo se distribuye la variable Importe coste total? 
Para responder a esta pregunta procedemos a ordenar los datos de menor a mayor, calcular los cuartiles: el primer cuartil (Q1) marca el 25% de los datos, la mediana (Q2) marca el 50%, y el tercer cuartil (Q3) marca el 75%.
Determinar el rango intercuartil, que es la diferencia entre Q1 y Q3, calcular los límites de los bigotes, Identificar los valores atípicos, que son los datos fuera de estos límites.
Dibujar el diagrama: la caja se extiende desde Q1 hasta Q3, con una línea en la mediana (Q2), los bigotes llegan hasta los límites calculados, y los valores atípicos se marcan como puntos separados.
- ¿Cuál de las variables: Coste unitario, Importe venta total o Importe coste total, presenta menor dispersión? 
Para responder a esta pregunta, una de las opciones más eficientes sería el uso de las medidas de dispersión o variabilidad. Vamos a calcular la media aritmética y, posteriormente, la desviación estándar. Con estos datos, obtendremos el coeficiente de variación en porcentaje, lo cual nos permitirá comparar entre el coste unitario, el importe de venta total y el importe de coste total. De esta manera, determinaremos la relación entre estas tres variables con respecto a su dispersión.
- ¿Cuáles son las medidas descriptivas de la variable Unidades? 
Para encontrar las medidas descriptivas de la variable Unidades se realizará una tabla de distribución de frecuencias. Posteriormente se calcularán las medidas de tendencia central (incluyendo moda, media y mediana) así como medidas de posicionamiento que permitirán describir el comportamiento de los datos.
- ¿Cuáles son las medidas descriptivas de la variable Importe venta total? Interprete 
De forma similar al proceso mencionado en el literal anterior, para encontrar las medidas descriptivas de la variable “Importe venta total” se realizará una tabla de distribución de frecuencias. Posteriormente se calcularán las medidas de tendencia central (incluyendo moda, media y mediana) así como medidas de posicionamiento que permitirán describir el comportamiento de los datos. Utilizando la información obtenida, se procederá a analizar los datos para identificar la asimetría de la distribución del conjunto de datos y su dispersión.
- ¿Existe una relación entre el Importe venta total e Importe coste total? 
Para analizar la relación entre el Importe venta total e Importe coste total se utilizará un diagrama de dispersión de datos con las variables respectivas. Un diagrama de dispersión permitirá visualizar si existe una correlación entre el Importe venta total e Importe coste total. Si los puntos en el diagrama tienden a alinearse siguiendo una tendencia específica, esto indicaría una relación entre ambas variables.




Comentarios