Revisión 3.
- Fernando Huilca
- 7 jun 2024
- 8 Min. de lectura
1. ¿Cuáles son los clientes que presentan un importe venta total superior a la media?
Se realizará un histograma que muestre la distribución de la variable Importe Venta Total de los clientes, se calcula la media y se la presenta en el histograma.
Descripción.- El presente histograma representa el Importe Venta Total de un registro de ventas con mil datos.
Interpretación.-
- La gráfica es asimétrica a la derecha. 
- La mayor parte del Importe Venta Total se encuentra entre 47,45 y 490.47,45 euros. 
Existen 337 clientes que se encuentran por encima de la media (1.289.101,897 €).
Clientes por encima de la media.
2. ¿Cuál es el continente con unidades superiores a la mediana?
Tomando en cuenta que Unidades es una variable cuantitativa discreta, se procederá a realizar un gráfico de barras. A pesar de que la gran cantidad de datos podría sugerir el uso de un histograma, es posible apoyarse en las herramientas de graficación debido a que de esta manera es más fácil visualizar los datos que se encuentran por encima de la mediana.
Descripción.- El presente gráfico de barras presenta las Unidades vendidas presentes en el registro según el Continente al que pertenecen de un total de mil datos.
Interpretación.-
- Tanto Australia y Oceanía como Centroamérica y el Caribe presentan Unidades vendidas similares (son las que más se parecen entre todas las unidades vendidas). 
- Se puede identificar que África es el continente con más unidades vendidas y el valor de Unidades vendidas más alto. 
Como se puede observar en la gráfica todos los continentes cuentan con unidades superiores a la mediana, siendo África la que más altos valores de Unidades presenta.
3. ¿Cuál de las categorías de la variable prioridad es la más baja, respecto a la variable unidades?
Descripción.- El presente gráfico de barras presenta la media de las Unidades de acuerdo al nivel de prioridad de las ventas de un total de mil datos.
Interpretación.-
- La barra con la media de los datos pertenecientes a Unidades con la media más alta es la Prioridad Media. 
- Tomando en cuenta la media aritmética de los datos de la variable unidades segmentados por su nivel de prioridad, es posible afirmar que la variable Prioridad Alta es la más baja (con una media de 4903,66). 
Descripción.- El presente diagrama de cajas presenta el nivel de prioridad de los registros en relación a las Unidades vendidas de un total de mil datos.
Interpretación.-
- Como se puede observar, no se presentan datos atípicos. 
- Las gráficas en las diferentes prioridades tienden a ser simétricas. 
- Se puede identificar que la distribución de datos de la variable Prioridad Alta presenta un sesgo hacia la izquierda (abajo en este caso) más pronunciado que las demás. 
4. ¿Cómo se distribuye el número de unidades que se venden?
Descripción
El siguiente diagrama de cajas y bigotes muestra la distribución de la variable "unidades de venta" en un registro de mil ventas.
Interpretación
· Del gráfico podemos observar que la mediana de unidades de venta es 5125.5, lo que significa que la mitad de las ventas están por debajo de este valor y la otra mitad por encima.
· La media o promedio de los datos es 5024.481 unidades de venta.
· La media es significativa porque es muy similar a la mediana, indicando una distribución equilibrada sin sesgo significativo.
· El primer cuartil (Q1) es 2657.5. Esto significa que el 25% de las ventas están por debajo de este valor.
· El tercer cuartil (Q3) es 7475.25. Esto significa que el 75% de las ventas están por debajo de este valor y el 25% restante está por encima.
· El rango intercuartílico (IQR): La diferencia entre el tercer cuartil y el primer cuartil (Q3 - Q1) es 7475.25 - 2657.5 = 4817.75. Este es el rango donde se encuentra el 50% central de los datos.
· El límite inferior (Q1 - 1.5IQR) es 2657.5 - 1.54817.75 = -4569.125.
· El límite superior (Q3 + 1.5IQR) es 7475.25 + 1.54817.75 = 14701.875.
· Dado que ningún dato se encuentra fuera de este rango y como se observa en la gráfica, no hay presencia de datos atípicos.
· También podemos notar que la forma de la distribución es casi simétrica, puesto que la mediana está centrada en la caja y muy cercana a la media. Además, los bigotes son aproximadamente de la misma longitud en ambos lados.
Nota sobre los límites superior e inferior
Aunque los cálculos para los límites inferior y superior (utilizando 1.5 veces el IQR) pueden dar valores negativos o muy altos, estos valores son teóricos para identificar posibles outliers. En la práctica, los datos reales no pueden ser negativos (para unidades de venta) y cualquier valor fuera de los bigotes del diagrama se consideraría un outlier. En este caso, el diagrama no muestra ningún outlier, lo que respalda la simetría y la normalidad de la distribución.
- Si se creara 4 categorías para la variable tipo de producto, ¿Cuál categoría es la más frecuente? 
Lo primero que vamos a hacer es crear 4 categorías que nos permitan asignar cada tipo de producto dentro de estás nuevas categorías ordenadas según su naturaleza, las categorías elegidas son:
1. Alimentos y Bebidas
2. Cuidado Personal y Cosméticos
3. Ropa y Accesorios
4. Materiales y Productos del Hogar
Luego agrupamos cada variable en su categoría:
1. Alimentos y Bebidas
Snacks
Cárnicos
Cereales
Frutas
Alimento infantil
Bebida
Verduras
2. Cuidado Personal y Cosméticos
Cosméticos
Cuidado personal
3. Ropa y Accesorios
Ropa
4. Materiales y Productos del Hogar
Material de oficina
Doméstico
Luego, procedemos a calcular la suma de las frecuencias con las que aparecen estos productos dentro de su categoría respectiva y a hacer el gráfico para visualizar de mejor manera dichas frecuencias.
De todos los datos:
De los datos dentro de su categoría:
Diagrama de pastel:
Descripción:
El gráfico de pastel (o gráfico de torta) muestra la distribución porcentual de cuatro categorías de productos de venta:
1. Alimentos y bebidas
2. Cuidado personal y cosméticos
3. Ropa y accesorios
4. Materiales y productos de hogar
Cada sector del gráfico representa el porcentaje correspondiente a cada categoría. Tomar en cuenta que dentro de cada categoría hay un tipo específico de producto cuya frecuencia se ha sumado al total.
Interpretación:
Se observa lo siguiente:
Alimentos y bebidas: Representa el 60% del total. Esta es la categoría más grande y, por lo tanto, la más frecuente.
Cuidado personal y cosméticos: Representa el 15% del total.
Ropa y accesorios: Representa el 8% del total.
Materiales y productos de hogar: Representa el 17% del total.
De acuerdo con el gráfico, la categoría más frecuente de productos de venta es Alimentos y bebidas, que constituye el 60% del total. Esta categoría domina claramente en comparación con las otras, que representan porcentajes significativamente menores.
6. ¿Cómo se distribuye la variable Importe coste total?
Descripción
El siguiente diagrama de cajas y bigotes muestra la distribución de la variable "importe coste total" en un registro de mil ventas.
Interpretación
La mediana, representada por la banda dentro de la caja azul, es de aproximadamente €459,283.44. Esto indica que la mitad de los datos están por encima de este valor y la otra mitad por debajo.
La media, señalada por la marca 'x', es alrededor de €907,076.52.
El primer cuartil (Q1) se sitúa en aproximadamente €169,841.47, lo que significa que el 25% de los datos están por debajo de este valor.
El tercer cuartil (Q3) es de cerca de €1,178,942.29, indicando que el 75% de los datos están por debajo de este valor.
El mínimo se encuentra alrededor de €31.79, y el máximo es €26,68,371.68
· El rango intercuartílico (IQR): La diferencia entre el tercer cuartil y el primer cuartil (Q3 - Q1) es 1,178,942.29 - 169,841.47 = 1,009,100.82.
· El límite inferior (Q1 - 1.5IQR) es 169,841.47 - 1.5(1,009,100.82) = -334,708.94.
· El límite superior (Q3 + 1.5IQR) es 1,178,942.29 + 1.5(1,009,100.82) = 2,692,593.52.
· Se observan varios puntos individuales por encima del bigote superior, los cuales representan valores atípicos en total 93 valores. El valor atípico más alto es de aproximadamente €5,068,488.89.
· El bigote superior (la línea que se extiende desde la caja hacia arriba) es notablemente más largo que el bigote inferior. Esto sugiere que hay una mayor dispersión de los datos en la cola derecha de la distribución.
. La mediana (la línea dentro de la caja) está más cerca del primer cuartil (Q1) que del tercer cuartil (Q3), esto indica asimetría a la derecha. En otras palabras, la mediana se encuentra desplazada hacia la parte inferior de la caja y se presenta una asimetría a la derecha.
7. ¿Cuál de las variables: Coste unitario, Importe venta total o Importe coste total, presenta menor dispersión?
Descripción: Diagrama de cajas del coste unitario de mil productos, recopilados de diferentes continentes del mundo.
Interpretación:
- mayor dispersión entre $97,44 y $263,33 
- Existe mucha concentración entre $35,84 y $97,44 
- Presenta una asimetría a la derecha: Mo ≤ Me ≤ x. 
Descripción: Diagrama de cajas del importe de venta total y el importe de coste total de mil productos, recopilados de diferentes continentes del mundo.
Interpretación:
- La mediana en el diagrama azul (Importe venta total) está en 1,289,101.90 €, lo que indica que el 50% de las ventas totales están por encima de este valor y el 50% están por debajo. 
- La caja abarca desde aproximadamente 47.45 € (Q1) hasta 1,777,701.58 € (Q3). Esto muestra que la mayoría de las ventas están concentradas en este rango. 
- El bigote inferior llega hasta 47.45 €, mientras que el bigote superior llega a 6,933,626.30 €. La presencia de bigotes largos puede indicar una alta dispersión en los datos. 
- La mediana en el diagrama naranja(Importe coste total) está en 907,076.52 €, lo que indica que el 50% de los costes totales están por encima de este valor y el 50% están por debajo. 
- La caja abarca desde aproximadamente 169,841.47 € (Q1) hasta 1,178,942.29 € (Q3). Esto muestra que la mayoría de los costes están concentrados en este rango. 
- El bigote inferior llega hasta 31.79 €, mientras que el bigote superior llega a 4,146,793.68 €. Nuevamente, bigotes largos indican una dispersión alta. 
Valores Centrales
Las medianas del Importe Venta Total y el Importe Coste Total son significativamente más altas que la mediana del Coste Unitario, reflejando mayores valores en términos absolutos.
Asimetría
Todas las variables presentan asimetría a la derecha.
Dispersión
La variable Coste Unitario presenta la menor dispersión en comparación con las otras dos variables. Esto se puede respaldar por un coeficiente de variación menor respecto a los demás (0,9504).
8. ¿Cuáles son las medidas descriptivas de la variable Unidades?
Descripción.- Tabla de medidas descriptivas de la variable unidades.
Interpretación.-
- Posee una alta variabilidad y dispersión, con valores que oscilan desde 1 hasta 9989. 
- La media y la mediana están relativamente cercanas, lo que sugiere una distribución simétrica, aunque la moda es significativamente más alta 
- La alta desviación estándar y el rango indican que hay una gran dispersión en los valores de las unidades. 
9. ¿Cuáles son las medidas descriptivas de la variable Importe venta total? Intérprete
Descripción.- Tabla de medidas descriptivas de la variable importe venta total.
Interpretación.-
- Gran variabilidad con los importes de venta totales, con una media y moda muy altas, pero con una mediana significativamente más baja. 
- Alta desviación estándar al igual que la varianza 
- La gran diferencia entre la mediana y la media, así como el amplio rango entre el valor mínimo y máximo, indican que las ventas están distribuidas de manera desigual, con algunos valores extremadamente altos. 
10. ¿Existe una relación entre el Importe venta total e Importe coste total?
Descripción.- El presente diagrama de dispersión presenta los datos de Importe Venta Total e Importe Coste Total tomados de un registro de ventas con mil datos.
Interpretación.-
- Los puntos naranjas que representan el Importe Coste Total están concentrados mayormente en la parte inferior del gráfico, lo que significa que los costes totales son relativamente bajos en comparación con los importes de venta total, esto sería un indicio positivo para la rentabilidad de las ventas. 
- En general, el patrón que se observa en el gráfico es que el Importe Coste Total tiende a ser menor que el Importe de Venta Total. Esta relación es deseable, ya que implica que la empresa obtiene una ganancia y rentabilidad en su negocio. 



























Comentarios