Articles of datos

Django y eBay estilo multi listado

Estoy tratando de imitar la función de listado múltiple de eBay. Básicamente, eBay permite a los usuarios especificar dos variaciones de su elección, por ejemplo, size and color . Cada variación tendrá datos diferentes, por ejemplo: Color: red, green Size: 12, 9 Entonces se pone un poco confuso, por ejemplo: quantity for color red, size […]

Ajuste de datos con función integral.

Cuando se usa curve_fit de scipy.optimize para ajustar algunos datos en python, uno primero define la función de ajuste (por ejemplo, un polinomio de segundo orden) de la siguiente manera: def f(x, a, b): return a*x**2+b*x Y luego continúa con el ajuste popt, pcov = curve_fit(f,x,y) Pero la pregunta ahora es, ¿cómo se hace para […]

¿Cómo encontrar la distribución de probabilidad y los parámetros para datos reales? (Python 3)

Tengo un conjunto de datos de sklearn y sklearn la distribución de los datos de load_diabetes.target (es decir, los valores de la regresión que se utilizan para load_diabetes.data ). Utilicé esto porque tiene el menor número de variables / atributos de la regresión sklearn.datasets . Utilizando Python 3, ¿cómo puedo obtener el tipo de distribución […]

¿Cómo asignar una clase contra varias tablas con SQLAlchemy?

Digamos que tengo una estructura de base de datos con tres tablas que se parecen a esto: items – item_id – item_handle attributes – attribute_id – attribute_name item_attributes – item_attribute_id – item_id – attribute_id – attribute_value Me gustaría poder hacer esto en SQLAlchemy: item = Item(‘item1’) item.foo = ‘bar’ session.add(item) session.commit() item1 = session.query(Item).filter_by(handle=’item1′).one() print […]

base de datos en memoria en Python

Estoy haciendo algunas consultas en Python en una gran base de datos para obtener algunas estadísticas de la base de datos. Quiero que estas estadísticas estén en la memoria para que otros progtwigs puedan usarlas sin tener que ir a una base de datos. Estaba pensando en cómo estructurarlos, y después de intentar configurar algunos […]

Parcela de matriz de correlación utilizando pandas.

Tengo un conjunto de datos con un gran número de características, por lo que el análisis de la matriz de correlación se ha vuelto muy difícil. Quiero trazar una matriz de correlación que obtengamos usando la función dataframe.corr() de la biblioteca pandas. ¿Hay alguna función incorporada proporcionada por la biblioteca de pandas para trazar esta […]

Cómo cambiar manualmente las tags de garrapatas de las plots de margen en una plot de Seaborn

Estoy tratando de usar una escala logarítmica como los diagtwigs de margen para mi gráfica de par en el mar. Estoy usando set_xticks () y set_yticks (), pero mis cambios no aparecen. Aquí está mi código a continuación y el gráfico resultante: import matplotlib.pyplot as plt %matplotlib inline import numpy as np import seaborn as […]

Manipulación de datos – Índice de clasificación cuando los valores son alfanuméricos

Me pregunto cómo debería abordar este problema de manipulación de datos. Cuál es el mejor método para ordenar un índice de un multi-índice en un dataframe donde los valores de a nivel del índice son alfanuméricos. Los valores son: [u’0′, u’1′, u’10’, u’11’, u’2′, u’2Y’, u’3′, u’3Y’, u’4′, u’4Y’, u’5′, u’5Y’, u’6′, u’7′, u’8′, u’9′, […]

Acceso a campos de bits mientras se leen / escriben estructuras de datos binarios

Estoy escribiendo un analizador para un formato binario. Este formato binario involucra diferentes tablas que, de nuevo, están en formato binario y contienen diferentes tamaños de campo (en algún lugar entre 50 y 100 de ellas). La mayoría de estas estructuras tendrán campos de bits y se verán como estos cuando se representen en C: […]

¿Cómo ordenar un DataFrame por dos columnas, usando un orden personalizado?

Tengo un dataframe de pandas que necesito ordenar en un orden particular en una columna, y simplemente ascendiendo en otra. Ambas columnas tienen valores repetidos. Se ve más o menos así: import pandas as pd df = pd.DataFrame() df[0] = pd.Series( [ ‘a’, ‘aa’, ‘c’ ] * 2 ) df[1] = pd.Series( [ 1, 2 […]