Ari Vladimir

Logo

description: >- ¡Hola! Te doy la bienvenida a mi portafolio de proyectos de Análisis de Datos.

📬 Contacto
LinkedIn   Email: av.deleoncalderon@gmail.com
📍 México 📍 México

View My GitHub Profile

Acerca de mí

Ingeniero mecánico certificado en análisis de datos con sólida experiencia en extracción, limpieza y modelado de datos estratégicos.

Genero insights accionables que optimizan procesos y apoyan la toma de decisiones estratégicas, logrando ahorros significativos de tiempo mediante la automatización.

Habilidades tecnológicas

Habilidades blandas

Análisis de datos | Resolución de problemas | Comunicación efectiva | Trabajo en equipo | Orientación a resultados | Organización | Proactividad | Atención al detalle | Optimización de Procesos


Proyectos Seleccionados

Análisis de retención de clientes para gimnasio

En todas las industrias, la retención de clientes es fundamental para garantizar ingresos sostenibles y reducir los costos asociados con la adquisición de nuevos clientes. Identificar los factores clave que influyen en la retención y cancelación permite al gimnasio Model Fitness anticiparse a los riesgos de abandono, diseñar estrategias de fidelización efectivas y personalizar las experiencias para cada cliente.

Herramientas y tipo de proyecto

Python Pandas Seaborn scikit-learn Limpieza de datos Transformación de datos Análisis de datos Modelos de predicción

Preguntas clave

  1. ¿Qué factores demográficos o de comportamiento influyen más en la cancelación?
  2. ¿Qué características diferencian a los clientes leales de los que abandonan?
  3. ¿Cómo se pueden segmentar los clientes para diseñar estrategias personalizadas?

Metodología

Conclusiones y recomendaciones

Factores críticos de retención:

Estrategias recomendadas:

Visualizaciones destacadas

  1. Distribución de cancelación según duración del contrato: Observamos que quienes cancelaron suelen contratar en su mayoría 1 mes, al igual que quienes no cancelan. Sin embargo, quienes permanecen suelen también contratar por periodos de 1 año y 6 meses, mientras que los que cancelan en su minoría contratan en dichos periodos. Contract Period Histogram
  2. Matriz de correlaciones: Se encontró que Las características month_to_end_contract y contract_period están altamente correlacionadas (0.9), lo que sugiere que se debe tener cuidado con la multicolinealidad al desarrollar modelos predictivos. Corr Matrix Churn Data
  3. Análisis de clústeres: El dendrograma muestran cómo los clientes se agrupan en segmentos distintos basados en sus características, donde el número óptimo de clústeres sugerido es 4. Dendrogram

Explora más detalles del proyecto en el repositorio completo.

Análisis de comportamiento de usuarios y embudo de ventas

Este proyecto analiza el embudo de ventas de la aplicación de una empresa de alimentos para identificar las etapas con mayores pérdidas de usuarios y evalúa, mediante un experimento A/A/B, si un nuevo diseño de fuentes puede mejorar la conversión en comparación con el diseño actual. El objetivo es proporcionar insights basados en datos que guíen decisiones estratégicas sobre diseño y funcionalidad.

Herramientas y tipo de proyecto

Python Pandas Seaborn Plotly Limpieza de datos Transformación de datos Análisis de datos Tests A/B Pruebas de hipótesis Visualización de datos

Preguntas clave

  1. ¿Qué eventos del embudo de ventas tienen mayores tasas de abandono?
  2. ¿Qué porcentaje de usuarios completa el embudo de ventas desde el inicio hasta el pago?
  3. ¿El cambio en el diseño de las fuentes afecta significativamente la conversión?
  4. ¿Hay diferencias estadísticas entre los grupos de control y el grupo de prueba?

Metodología

Conclusiones y recomendaciones

Embudo de ventas:

Resultados del experimento:

Recomendaciones:

Visualizaciones destacadas

  1. Embudo de ventas: La etapa en la que más se pierden usuarios es en el Tutorial, donde solo el 23.7% de los usuarios en la etapa anterior llegan a esta. La siguiente etapa donde se pierden más usuarios es en OfferScreenAppear, donde el 61.9% de los usuarios de la etapa anterior pasan a esta. Sales Funner Chart
  2. Periodo de tiempo de los datos: Los datos completos están disponibles a partir del 1 de agosto de 2019, por lo que se descartaron fechas anteriores. El periodo actualizado abarca del 1 al 7 de agosto de 2019. Time Period Data

Explora más detalles del proyecto en el repositorio completo.

Análisis de Base de Datos para Startup de Libros

En el contexto post-pandemia, el mercado de aplicaciones de lectura creció exponencialmente. Este proyecto analiza una base de datos de un servicio de libros para identificar patrones de consumo, popularidad de autores y editoriales, y comportamiento de los usuarios mediante reseñas y calificaciones. El objetivo es generar insights accionables que sirvan de base para la propuesta de valor de un nuevo producto digital dirigido a lectores.

Herramientas y tipo de proyecto

Python Pandas SQL Matplotlib Seaborn Tableau Análisis de datos Visualización de datos Base de datos relacional

Preguntas clave

  1. ¿Cuántos libros publicados después del año 2000 hay en el catálogo?
  2. ¿Qué libros generan mayor interacción (reseñas) y mejor calificación promedio?
  3. ¿Qué editorial lidera en volumen de publicaciones sustanciales (>50 páginas)?
  4. ¿Qué autor tiene la calificación promedio más alta, considerando solo libros con al menos 50 calificaciones?
  5. ¿Cuál es el comportamiento de los usuarios más activos (con más de 50 calificaciones) en cuanto a reseñas de texto?

Metodología

Conclusiones y recomendaciones

Recomendaciones estratégicas:

Visualizaciones destacadas

  1. Top 10 libros por reseñas y calificación: Gráfico de barras horizontal que muestra el número de reseñas junto con el rating promedio integrado dentro de cada barra, facilitando la lectura rápida de los libros más conversados y mejor valorados.

Top 10 Books

Explora más detalles del proyecto en el repositorio completo.