Yellowbrick: Visualización de Machine Learning

_images/banner.png

Yellowbrick amplía la API Scikit-Learn para facilitar la selección de modelos y el ajuste de hiperparámetros. En su núcleo, usa Matplotlib.

Ruta de aprendizaje recomendada

  1. Revisa el Inicio rápido, utiliza el Tutorial de selección de modelos, y también revisa Los «Oneliners».

  2. Use Yellowbrick en su trabajo, haciendo referencia a Visualizers and API para obtener ayuda con visualizadores específicos e información detallada sobre parámetros opcionales y personalización.

  3. Síguenos en GitHub y síguenos en Twitter (@scikit_yb) para que te enteres de los nuevos visualizadores tan pronto se agreguen.

Contribuyendo

¿Interesado en contribuir a Yellowbrick? Yellowbrick es un proyecto acogedor e inclusivo y nos encantaría tenerte. Seguimos el Código de conducta de Python Software Foundation.

No importa tu nivel de habilidad técnica, puedes ayudar. Apreciamos los informes de errores, las pruebas de usuario, las solicitudes de funciones, las correcciones de errores, las mejoras de productos y las mejoras en la documentación.

¡Revisa la guía Contributing!

Considera la posibilidad de unirte al Google Groups Listserv listserve para que puedas responder preguntas.

¡Gracias por tus contribuciones!

Conceptos & API

Visualizadores

El objetivo principal de Yellowbrick es crear una API sensorial similar a Scikit-Learn.

Los visualizadores son los objetos centrales en Yellowbrick. Son similares a los transformadores en Scikit-Learn. Los visualizadores pueden envolver un estimador de modelo, de manera similar a «ModelCV» (e.g. RidgeCV, LassoCV) .

Algunos de nuestros visualizadores más populares incluyen:

Características de las visualizaciones

Clasificación de las visualizaciones

Visualización en regresión

  • Prediction Error Plot: encuentra desgloses del modelo a lo largo del dominio del objetivo

  • Residuals Plot: muestra la diferencia en los residuos de los datos de entrenamiento y prueba

  • Alpha Selection: muestra cómo la elección del alfa influye en la regularización

  • Cook’s Distance: mostrar la influencia de las instancias en la regresión lineal

Visualización en agrupación

Visualización de selección de modelos

  • Validation Curve: sintoniza un modelo con respecto a un solo hiperparámetro

  • Learning Curve: muestra si un modelo se podría beneficiar de más datos o menos complejidad

  • Feature Importances: clasifica las entidades por importancia o coeficientes lineales para un modelo específico

  • Recursive Feature Elimination: encuentra el mejor subconjunto de características en función de la importancia

Visualización en objetivos

  • Balanced Binning Reference: genera un histograma con líneas verticales que muestra el punto de valor recomendado para agrupar los datos en contenedores distribuidos uniformemente

  • Class Balance: visualiza cómo afecta la distribución de clases al modelo

  • Feature Correlation: muestra la correlación entre características y variables dependientes

Visualización de texto

… y más! Los visualizadores se agregan todo el tiempo. Compruebe los ejemplos (o incluso la develop branch). ¡Siéntete libre de contribuir con tus ideas para nuevos visualizadores!

Obtener ayuda

¿Algo no te funciona? Aquí puedes encontrar ayuda.

  1. Los documentos (¡estás aquí!).

  2. Stack Overflow. Si haces una pregunta, etiquétela con «yellowbrick».

  3. The Yellowbrick Google Groups Listserv.

  4. Puedes hacer un tweet o enviarnos mensajes directos en Twitter @scikit_yb.

¿Encontraste un error?

Compruebe si ya hay un issue sobre el tema. Si es necesario, presente un issue.

Código abierto

La licencia de Yellowbrick es una licencia de código abierto Apache 2.0. ¡Yellowbrick disfruta de una comunidad de desarrolladores muy activa; por favor revisa Contributing!

Yellowbrick está alojado en GitHub. Los issues y pull requests son rastreados aquí.

Tabla de contenido

Indices and tables