Articles of datos de

¿Cómo pesar los puntos en un diagtwig de dispersión para un ajuste?

Por lo tanto, busqué información sobre el parámetro de pesos en la función polyfit (numpy.polynomial.polynomial.polyfit) en Python y parece que tiene algo que ver con el error asociado con los puntos individuales. ( Cómo incluir errores de medición en numpy.polyfit ) Sin embargo, lo que estoy tratando de hacer no tiene nada que ver con […]

Google App Engine – incrementando las operaciones del almacén de datos

Hoy, se nos ha cobrado por primera vez en el motor de aplicaciones de Google, y la causa principal parece ser las operaciones de creación, lectura y eliminación en el Datastore . Estoy tratando de averiguar cuál es la causa de esto, o hablar de millones de operaciones, lo cual es extraño. Tenemos tareas de […]

La forma más rápida de determinar el rango de valores consecutivos más largo en una matriz 2D

El problema supongamos que estamos trabajando con un gran conjunto de datos y por simplicidad usamos este más pequeño en esta pregunta: dataset = [[“PLANT”, 4,11], [“PLANT”, 4,12], [“PLANT”, 34,4], [“PLANT”, 6,5], [“PLANT”, 54,45], [“ANIMAL”, 5,76], [“ANIMAL”, 7,33], [“Animal”, 11,1]] y queremos averiguar qué columna tiene el rango más largo de valores consecutivos, ¿cuál sería […]

¿Cómo crear todas las combinaciones de columnas sabias para múltiples variables en pandas?

Para un rango dado para n variables. He tomado n = 3 como ejemplo. A : [1,3] B: [5,10,12] C: [100,113] Tenga en cuenta que los valores en el rango anterior también pueden ser flotantes. ¿Cómo podemos crear un dataframe donde cada columna representa una combinación única de las variables de entrada? c1 c2 c3 […]

Inserte filas como resultado de una operación grupal en el dataframe original

Por ejemplo, tengo un dataframe de pandas de la siguiente manera: col_1 col_2 col_3 col_4 a X 5 1 a Y 3 2 a Z 6 4 b X 7 8 b Y 4 3 b Z 6 5 Y quiero, para cada valor en col_1, agregar los valores en col_3 y col_4 (y muchas […]

__getitem__, __setitem__ teclas múltiples Python

Estoy intentando crear una clase que almacena datos en un búfer local y actúa como una interfaz para una base de datos. Tengo el siguiente código: class Table(object): def __init__(self, tableName, **columnDict): self.tableName = tableName self.columns = {} self.types = {} self.columns[‘id’] = [] self.types[‘id’] = ‘INT PRIMARY KEY NOT NULL’ for name in columnDict: […]

Pandas: actualización de índice y cambio de valor accedido por ubicación

Tengo dos preguntas relacionadas con el índice en los marcos de datos de Python Pandas. import pandas as pd import numpy as np df = pd.DataFrame({‘id’ : range(1,9), ‘B’ : [‘one’, ‘one’, ‘two’, ‘three’, ‘two’, ‘three’, ‘one’, ‘two’], ‘amount’ : np.random.randn(8)}) df = df.ix[df.B != ‘three’] # remove where B = three df.index >> Int64Index([0, […]

Eliminar palabras que no están en inglés del texto usando Python

Estoy haciendo un ejercicio de limpieza de datos en python y el texto que estoy limpiando contiene palabras en italiano que me gustaría eliminar. He estado buscando en línea si podría hacer esto en Python usando un kit de herramientas como nltk. Por ejemplo dado algún texto: “Io andiamo to the beach with my amico.” […]

Selecciona las filas del marco de pandas basadas en los valores de dos columnas.

Deseo seleccionar algunas filas específicas basadas en dos valores de columna. Por ejemplo: d = {‘user’ : [1., 2., 3., 4] ,’item’ : [5., 6., 7., 8.],’f1′ : [9., 16., 17., 18.], ‘f2’:[4,5,6,5], ‘f3’:[4,5,5,8]} df = pd.DataFrame(d) print df Out: f1 f2 f3 item user 0 9 4 4 5 1 1 16 5 5 […]

Python Pandas: Asignar el último valor del grupo DataFrame a todas las entradas de ese grupo

En Python Pandas, tengo un DataFrame. Agrupo este DataFrame por una columna y quiero asignar el último valor de una columna a todas las filas de otra columna. Sé que puedo seleccionar la última fila del grupo con este comando: import pandas as pd df = pd.DataFrame({‘a’: (1,1,2,3,3), ‘b’:(20,21,30,40,41)}) print(df) print(“-“) result = df.groupby(‘a’).nth(-1) print(result) […]