Articles of estadísticas de

Python wilcoxon: desigual N

Rs wilcox.test puede tomar diferentes vectores de longitud, pero el wilcoxon de scipy.stats no puede: Recibo un mensaje de error unequal N . from scipy.stats import wilcoxon wilcoxon(range(10), range(12)) ¿Hay alguna manera de obtener el comportamiento de Rs en Python?

Cualquier biblioteca de Python produce tablas de regresión de estilo de publicación

He estado usando Python para el análisis de regresión. Después de obtener los resultados de la regresión, debo resumir todos los resultados en una sola tabla y convertirlos a LaTex (para publicación). ¿Hay algún paquete que haga esto en Python? Algo así como estout en stata que da la siguiente tabla:

pandas, dataframe, groupby, std

Nuevo en los pandas aquí. Un problema (trivial): hosts, operaciones, tiempos de ejecución. Quiero agrupar por host, luego por host + operación, calcular la desviación estándar para el tiempo de ejecución por host, luego por host + operación par. Parece simple? Funciona para agrupar por una sola columna: df Out[360]: Int64Index: 132564 entries, 0 to […]

Estimación del pequeño cambio de tiempo entre dos series de tiempo

Tengo dos series de tiempo, y sospecho que hay un cambio de tiempo entre ellas, y quiero estimar este cambio de tiempo. Esta pregunta se ha formulado anteriormente en: Encuentre la diferencia de fase entre dos ondas (inarmónicas) y encuentre el cambio en el tiempo entre dos formas de onda similares, pero en mi caso, […]

Implementando una prueba de Kolmogorov Smirnov en python scipy

Tengo un conjunto de datos sobre N números que quiero probar para la normalidad. Sé que scipy.stats tiene una función kstest pero no hay ejemplos sobre cómo usarla y cómo interpretar los resultados. ¿Hay alguien aquí que esté familiarizado con eso que me pueda dar algún consejo? Según la documentación, el uso de kstest devuelve […]

Convierta el puntaje Z (valor Z, puntaje estándar) a valor p para la distribución normal en Python

¿Cómo se convierte un puntaje Z de la distribución Z (distribución normal estándar, distribución gaussiana) a un valor p ? Todavía tengo que encontrar la función mágica en el módulo de stats de Scipy para hacer esto, pero uno debe estar allí.

Utilizando estimaciones de statsmodel con la validación cruzada de scikit-learn, ¿es posible?

Publiqué esta pregunta en el foro de validación cruzada y luego me di cuenta de que podría encontrar la audiencia adecuada en Stackoverlfow. Estoy buscando una forma en la que pueda usar el objeto de fit (resultado) que se obtiene de python statsmodel para ingresar al cross_val_score del método scikit-learn cross_validation? El enlace adjunto sugiere […]

Comparando múltiples opciones de precio para muchos clientes algorítmicamente

Tenemos 1,000,000 de clientes. El costo de los bienes vendidos para cada uno de ellos puede expressse como precio A o precio B. Precio A << Precio B. El precio A y el precio B no son lineales entre sí. En algunos casos, B es 2 veces más caro, en algunos es 100 veces más […]

Detectar cambios significativos en un conjunto de datos que cambia gradualmente

Tengo una lista de datos en python que representa la cantidad de recursos utilizados por minuto. Quiero encontrar la cantidad de veces que cambia significativamente en ese conjunto de datos. Lo que quiero decir con cambio significativo es un poco diferente de lo que he leído hasta ahora. Por ejemplo, si tengo un conjunto de […]

Graficar una función de densidad sobre un histogtwig

En Python, he estimado los parámetros para la densidad de un modelo de mi distribución y me gustaría trazar la función de densidad sobre el histogtwig de la distribución. En R es similar a usar la opción prop=TRUE . import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt # initialization of the […]