Articles of datos de los

Obtenga todas las celdas del dataframe como tupla de (índice, columna) para pasar a df.apply ()

Quiero obtener el índice y el nombre de columna de cada celda en el dataframe de Pandas. Por ejemplo, en el dataframe generado a partir del código de abajo df = pd.DataFrame({1 : np.arange(1, 6), 2 : np.arange(6, 11), 3 : np.arange(11, 16), 4 : np.arange(16, 21), 5 : np.arange(21, 26)}, index=[1, 2, 3, 4, […]

Agrupe por dos columnas y cuente las ocurrencias de cada combinación en pandas

Tengo el siguiente dataframe: data = pd.DataFrame({‘user_id’ : [‘a1’, ‘a1’, ‘a1’, ‘a2′,’a2′,’a2′,’a3′,’a3′,’a3’], ‘product_id’ : [‘p1′,’p1′,’p2′,’p1′,’p1′,’p1′,’p2′,’p2′,’p3’]}) product_id user_id p1 a1 p1 a1 p2 a1 p1 a2 p1 a2 p1 a2 p2 a3 p2 a3 p3 a3 en el caso real, también podría haber otras columnas, pero lo que debo hacer es agrupar por dataframe por product_id […]

Seleccione una lista de segmentos de un dataframe de múltiples índices / multicolumnas de Pandas

Digamos que tengo el siguiente dataframe de Pandas de varias columnas: arrays = [[‘bar’, ‘bar’, ‘baz’, ‘baz’, ‘foo’, ‘foo’, ], [‘one’, ‘two’, ‘one’, ‘two’, ‘one’, ‘two’, ]] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=[‘first’, ‘second’]) df = pd.DataFrame(np.random.randn(8, 6), columns=arrays) bar baz foo one two one two one two 0 1.018709 0.295048 -0.735014 1.478292 -0.410116 […]

La mejor manera de subcontratar un dataframe pandas

Hola, soy nuevo en Pandas y acabo de encontrar df.query() . ¿Por qué la gente usaría df.query() cuando puedes filtrar directamente tus Dataframes usando la notación de corchetes? El tutorial oficial de pandas también parece preferir este último enfoque. Con notación entre paréntesis: df[df[‘age’] <= 21] Con el método de consulta pandas: df.query(‘age <= 21') […]

Rolling Conditional Pandas DataFrame Column

¿Cómo podría escribir una condición de balanceo que se aplique a una columna en pandas? import pandas as pd import numpy as np lst = np.random.random_integers(low = -10, high = 10, size = 10) lst2 = np.random.random_integers(low = -10, high = 10, size = 10) #lst = [ -2 10 -10 -6 4 2 -5 […]

cómo dividir los valores en una columna de datos y agregarlos a una nueva columna con una condición en pandas

Tengo un df, name Value Sri is a cricketer Sri,is Ram player Ram Ravi is a singer is cricket and foot is ball and,is,foot y una lista, my_list=[“is”, “foot”] Estoy intentando dividir df [“valor”] por (,) y agregar el valor a una nueva columna si el valor existe en my_list. Mi salida esperada es name […]

Python Pandas comparan dos marcos de datos para asignar el país al número de teléfono

Tengo dos marcos de datos que leí a través de csv. Dataframe one consiste en un número de teléfono y algunos datos adicionales. El segundo dataframe contiene códigos de países y nombres de países. Quiero tomar el número de teléfono del primer conjunto de datos y compararlo con los códigos de país del segundo. Los […]

Los valores de la columna de datos no están cambiando a flotar

Tengo un dataframe, df, Name Stage Description 0 sri 1 sri is one of the good singer in this two 1 nan 2 thanks for reading 2 ram 1 ram is two of the good cricket player 3 ganesh 1 one driver 4 nan 2 good buddies tried df[“Stage”]=pd.to_numeric(df[“Stage”],downcast=”float”) Pero aun así los valores son […]

Cortar múltiples rangos de columnas desde un dataframe usando iloc

Tengo un df con 32 columnas df.shape (568285, 32) Estoy tratando de reorganizar las columnas de una manera específica, y soltar la primera columna usando iloc df = df.iloc[:,[31,[1:23],24,25,26,28,27,29,30]] ^ SyntaxError: invalid syntax ¿Esta es la manera correcta de hacerlo?

¿Cómo configurar / obtener pandas.DataFrame a / desde Redis?

Después de configurar un DataFrame para redis, luego recuperarlo, redis devuelve una cadena y no puedo encontrar una manera de convertir esta cadena en un DataFrame. ¿Cómo puedo hacer estos dos adecuadamente?