Articles of marco de datos de los

Rellene los valores de na agregando x a los pandas de la fila anterior

Tengo un dataframe con una columna llamada SAM con los siguientes datos SAM 3 5 9 Nan Nan 24 40 Nan 57 Ahora quiero insertar 12 , 15 y 43 respectivamente en los valores de Nan (porque 9+3=12 , 12+3=15 , y 40+3=43 ). En otras palabras, rellene cualquier fila de Nan agregando 3 a […]

Python: filtre DataFrame en Pandas por hora, día y mes agrupados por año

Al ser nuevo en Pandas, tenía que cavar mucho para encontrar una solución a este problema. Me gustaría saber una mejor manera de resolver esto, teniendo en cuenta que todavía tengo que resolver los problemas fronterizos. Tengo un conjunto de 10 medidas minuciosas de “Potencia” desde 2009 hasta 2012 y quiero obtener una ventana de […]

¿Cómo cambiar varias filas en un dataframe de pandas?

Tengo el siguiente Dataframe de pandas: import pandas as pd data = {‘one’ : pd.Series([1.], index=[‘a’]), ‘two’ : pd.Series([1., 2.], index=[‘a’, ‘b’]), ‘three’ : pd.Series([1., 2., 3., 4.], index=[‘a’, ‘b’, ‘c’, ‘d’])} df = pd.DataFrame(data) df = df[[“one”, “two”, “three”]] one two three a 1.0 1.0 1.0 b NaN 2.0 2.0 c NaN NaN 3.0 […]

Grupo de pandas por grupo por lista de listas

Dado un dataframe estructurado como: rule_id | ordering | sequence_id 1 | 0 | 12 1 | 1 | 13 1 | 1 | 14 2 | 0 | 1 2 | 1 | 2 2 | 2 | 12 Necesito transformarlo en: rule_id | sequences 1 | [[12],[13,14]] 2 | [[1],[2],[12]] Eso parece ser […]

Probando si existe un DataFrame pandas

En mi código, tengo varias variables que pueden contener un DataFrame de pandas o nada en absoluto. Digamos que quiero probar y ver si un determinado DataFrame se ha creado todavía o no. Mi primer pensamiento sería probarlo de esta manera: if df1: # do something Sin embargo, ese código falla de esta manera: ValueError: […]

El objeto DataFrame no tiene atributo ‘sort_values’

dataset = pd.read_csv(“dataset.csv”).fillna(” “)[:100] dataset[‘Id’]=0 dataset[‘i’]=0 dataset[‘j’]=0 #… entries=dataset[dataset[‘Id’]==0] print type(entries) # Prints entries=entries.sort_values([‘i’,’j’,’ColumnA’,’ColumnB’]) ¿Cuál podría ser la posible razón del siguiente mensaje de error en la última línea ? AttributeError: ‘DataFrame’ object has no attribute ‘sort_values’

Eliminar el día bisiesto de los datos de los pandas.

Tengo los folletos. dataframe: datetime 2012-01-01 125.5010 2012-01-02 125.5010 2012-01-03 125.5010 2012-02-04 125.5010 2012-02-05 125.5010 2012-02-29 125.5010 2012-02-28 125.5010 2016-01-07 125.5010 2016-01-08 125.5010 2016-02-29 81.6237 Me gustaría eliminar todas las filas correspondientes al 29 de febrero, lo que resulta en seguidores. dataframe: datetime 2012-01-01 125.5010 2012-01-02 125.5010 2012-01-03 125.5010 2012-02-04 125.5010 2012-02-05 125.5010 2012-02-28 125.5010 […]

Python calcula la tenencia de gestión basada en la base de datos de rol

Tengo una base de datos de roles (como dataframe de pd) que tiene las siguientes variables: individuo, compañía y año, con solo un individuo por cada combinación de compañía y año. Ahora, quiero crear un nuevo dataframe con cada compañía única como índice y calcular cuánto tiempo ha estado el individuo más reciente en la […]

Encuentra el aumento, disminución en la columna de Dataframe

Tengo un dataframe y quiero verificar si los elementos en la columna “PBI” aumentan o disminuyen en comparación con su valor anterior para crear la columna “cambio”. Ya probé la función diff () pero no estoy seguro de cómo podría ayudar. Por favor, sugiera algunos consejos para mi problema. Gracias.

Python Pandas: equilibra un conjunto de datos desequilibrado (para análisis de panel)

Sé que esto podría ser fácil de hacer. Puedo hacerlo en Stata pero estoy tratando de moverme a Python. Tengo un gran conjunto de datos que es desequilibrado. Se parece a esto: Y necesito obtener un conjunto de datos de la siguiente manera: Cualquier orientación es bienvenida. ¡Muchas gracias!