Estadística con Python
La estadística es una rama de las matemáticas que se ocupa de la recopilación de datos, organización, análisis, interpretación y presentación.
Al aplicar estadísticas a, por ejemplo, un problema científico, industrial o social, es convencional comenzar con un proceso de modelo estadístico a estudiar. Python con sus librerías (statistics y statsmodels, por ejemplo) provee herramientas y funciones para ayudar en el análisis estadístico.
Revisaremos las habilidades y estructuras de datos básicas de Python, continuaremos con formas de cargar datos de diferentes fuentes, reorganizarlos y agregarlos, y finalmente, analizarlos y visualizarlos para crear resultados de alta calidad.
Funciones Básicas de Estadística
El módulo statistics proporciona funciones para calcular estadísticas matemáticas de datos numéricos (valores reales). La librería se carga de la siguiente manera: import statistics Promedios y medidas de ubicación central Estas funciones calculan un valor promedio o típico de una población o muestra. mean() Media aritmética (promedio). harmonic_mean() Media armónica de los datos. median() Mediana (valor medio) de los datos. median_low() Mediana baja de los datos. median_high() Mediana alta de los datos. median_grouped() Mediana percentil 50, de datos agrupados. mode() […]
Análisis estadístico con Python y statsmodels
Esta clase proporciona funciones para la estimación de muchos modelos estadísticos diferentes, así como para realizar pruebas estadísticas y exploración de datos estadísticos con el uso de la biblioteca statsmodels. Conocimientos en programación en python y estadística son necesarios. Este caso de estudio muy simple está diseñado para que puedas ponerte en funcionamiento rápidamente con statsmodels. A partir de datos sin procesar, mostraremos los pasos necesarios para estimar un modelo estadístico y dibujar un gráfico para evaluar los resultados. Cargando […]
Regresión lineal con Python y statsmodels
La regresión lineal es un modelo usado para aproximar la relación de dependencia entre una variable dependiente Y, y variables independientes X. Por ejemplo, puede predecir cuánto de las ventas de un vendedor (la variable dependiente) se debe a variables independientes como su educaciñon, años de experiencia, horas trabajadas etc. (las variables independientes). El módulo statsmodels permite la estimación por mínimos cuadrados ordinarios (OLS), mínimos cuadrados ponderados (WLS) y mínimos cuadrados generalizados (GLS). import numpy as np import statsmodels.api as […]
Modelos lineales generalizados con Python y statsmodels
El modelo lineal generalizado amplía los modelos lineales, de manera que las variables dependientes están relacionadas linealmente con factores y las covariables mediante una determinada función. Una de las ventajas es que este modelo permite que la variable dependiente tenga una distribución no normal. Como ejemplo, una empresa de transporte puede utilizar modelos lineales generalizados para ajustar una regresión de Poisson a las frecuencias de rechazo de paso de sus barcos en el canal de Panamá en varios períodos de […]