Articles of pandas de

Las pandas se fusionan dando error “El búfer tiene un número incorrecto de dimensiones (se espera 1, obtuve 2)”

Estoy tratando de hacer una fusión de pandas y obtener el error anterior del título cuando bash ejecutarlo. Estoy usando 3 columnas para hacer coincidir, mientras que justo antes de hacer una combinación similar solo en 2 columnas, funciona bien. df = pd.merge(df, c, how=”left”, left_on=[“section_term_ps_id”, “section_school_id”, “state”], right_on=[“term_ps_id”, “term_school_id”, “state”]) columnas para los dos […]

Promedio por filas para un subconjunto de columnas con valores perdidos

Tengo un ‘DataFrame’ que tiene valores perdidos ocasionales, y se parece a esto: Monday Tuesday Wednesday ================================================ Mike 42 NaN 12 Jenna NaN NaN 15 Jon 21 4 1 Me gustaría agregar una nueva column a mi dataframe donde podría calcular el promedio de todas las columns para cada row . Lo que significa que, […]

Compruebe si existe una fila en un dataframe en otro dataframe

Tengo un dataframe A como este: Y otro cuadro de datos B que se ve así: Quiero agregar una columna ‘Existir’ al dataframe A para que si el Usuario y la Película existen en el dataframe B entonces ‘Existir’ sea Verdadero, de lo contrario, sea Falso. Entonces A debería volverse así:

Filtrado de Pandas Dataframe usando la instrucción OR

Tengo un dataframe de pandas y quiero filtrar todo el df en función del valor de dos columnas en el dataframe. ¡Quiero recuperar todas las filas y columnas donde IBRD o IMF! = 0. alldata_balance = alldata[(alldata[IBRD] !=0) or (alldata[IMF] !=0)] pero esto me da un ValueError ValueError: El valor de verdad de una serie […]

Combinar Pandas DataFrame DateTime Columns

Supongo que tengo los marcos de datos de la siguiente manera: Year Month Day 2003 1 8 2003 2 7 Cómo combinar el Año, el Mes y el Día en la columna recién definida en el dataframe como tal, el dataframe sería: Year Month Day Date 2003 1 8 2003-1-8 2003 2 7 2003-2-7 ¿Alguna […]

dataframe de los pandas de Python, si no, sin iterar el dataframe de pensamiento

Quiero añadir una columna a un df. Los valores de este nuevo df dependerán de los valores de las otras columnas. p.ej dc = {‘A’:[0,9,4,5],’B’:[6,0,10,12],’C’:[1,3,15,18]} df = pd.DataFrame(dc) ABC 0 0 6 1 1 9 0 3 2 4 10 15 3 5 12 18 Ahora quiero agregar otra columna D cuyos valores dependerán de […]

pandas multiprocesamiento aplicar

Estoy tratando de usar el multiprocesamiento con el dataframe de pandas, que es dividir el dataframe en 8 partes. aplique alguna función a cada parte usando apply (con cada parte procesada en un proceso diferente). EDIT: Aquí está la solución que finalmente encontré: import multiprocessing as mp import pandas.util.testing as pdt def process_apply(x): # do […]

pandas dataframe groupby y obtener nth fila

Tengo un dataframe de pandas como siguiente. df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list(‘AAABBBBABCBDDD’), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], [‘x/y/z’,’x/y’,’x/y/z/n’,’x/u’,’x’,’x/u/v’,’x/y/z’,’x’,’x/u/v/b’,’-‘,’x/y’,’x/y/z’,’x’,’x/u/v/w’],[‘1′,’3′,’3′,’2′,’4′,’2′,’5′,’3′,’6′,’3′,’5′,’1′,’1′,’1’],[‘200′,’400′,’404′,’200′,’200′,’404′,’200′,’404′,’500′,’200′,’500′,’200′,’200′,’400’]]).T df.columns = [‘col1′,’col2′,’col3′,’col4′,’ID’,’col5′] Quiero agrupar esto por “ID” y obtener la segunda fila de cada grupo. Más tarde necesitaré obtener tercero y cuarto también. Solo explícame cómo obtener solo la segunda fila […]

Pandas de Python reemplazando cadenas en el dataframe con números

¿Hay alguna forma de usar la función de mapeo o algo mejor para reemplazar valores en un dataframe completo? Sólo sé cómo realizar el mapeo en serie. Me gustaría reemplazar las cadenas en las columnas ‘tesst’ y ‘set’ con un número, por ejemplo set = 1, test = 2 Aquí hay un ejemplo de mi […]

¿Dónde está la documentación en las tags ‘Freq’ de Pandas?

Soy nuevo en Pandas y estoy tratando de usar date_range . Me encontré con todo tipo de cosas buenas para freq , como BME y BMS y me gustaría poder buscar rápidamente las cadenas adecuadas para obtener lo que quiero. Ayer encontré una tabla bien formateada en algún lugar de la documentación, pero el título […]