Tengo un dataframe 10730 filas x 249 columnas, tengo columnas: Index([‘RegionID’, ‘Metro’, ‘CountyName’, ‘SizeRank’, ‘1996-04’, ‘1996-05’, ‘1996-06’, ‘1996-07’, ‘1996-08’, ‘1996-09’, … ‘2015-11’, ‘2015-12’, ‘2016-01’, ‘2016-02’, ‘2016-03’, ‘2016-04’, ‘2016-05’, ‘2016-06’, ‘2016-07’, ‘2016-08′], dtype=’object’, length=249) así que lo que debo hacer es agrupar las columnas por trimestre, jan para marchar Q1, y así sucesivamente hasta Q4 (usando […]
Estoy tratando de usar una regresión lineal en un grupo por el dataframe de pandas python: Este es el df dataframe: group date value A 01-02-2016 16 A 01-03-2016 15 A 01-04-2016 14 A 01-05-2016 17 A 01-06-2016 19 A 01-07-2016 20 B 01-02-2016 16 B 01-03-2016 13 B 01-04-2016 13 C 01-02-2016 16 C […]
Supongamos que tengo el siguiente conjunto de datos: uid iid val 1 1 2 1 2 3 1 3 4 1 4 4.5 1 5 5.5 2 1 3 2 2 3 2 3 4 3 4 4.5 3 5 5.5 A partir de estos datos, quiero agrupar primero por uid, luego obtener el último […]
Tengo un “panel de datos” típico (en términos econométricos, no objeto de panel de pandas). El dataframe tiene una columna Date y una columna ID , y otras columnas que contienen ciertos valores. Para cada Fecha, necesito clasificar de manera transversal las distintas identificaciones basadas en V1 en 10 grupos (deciles) y crear una nueva […]
El dataframe es un df vacío después de la consulta. Cuando esté agrupado, active la advertencia de tiempo de ejecución, luego obtenga otro dataframe vacío sin columnas. ¿Cómo mantener las columnas? df = pd.DataFrame(columns=[“PlatformCategory”,”Platform”,”ResClassName”,”Amount”]) print df resultado: Empty DataFrame Columns: [PlatformCategory, Platform, ResClassName, Amount] Index: [] entonces groupby: df = df.groupby([“PlatformCategory”,”Platform”,”ResClassName”]).sum() df = df.reset_index(drop=False,inplace=True) print […]
Date Description 0 6/09/2012 Amazon 1 6/09/2012 iTunes 2 6/08/2012 iTunes 3 6/08/2012 Building 4 6/08/2012 Slicehost Tengo un DataFrame como el anterior. Puedo seleccionar la parte del día de la cita de datos anterior mediante una función get_day () como esta: def get_day(date_string): d = datetime.strptime(date_string, ‘%m/%d/%Y’) return d.day Ahora, ¿cómo paso esta función […]
Tengo un dataframe como este: import pandas as pd df = pd.DataFrame({‘id’: [1, 2, 1, 1, 2, 1, 2, 2], ‘min_max’: [‘max_val’, ‘max_val’, ‘min_val’, ‘min_val’, ‘max_val’, ‘max_val’, ‘min_val’, ‘min_val’], ‘value’: [1, 20, 20, 10, 12, 3, -10, -5 ]}) id min_max value 0 1 max_val 1 1 2 max_val 20 2 1 min_val 20 3 […]
Digamos que tengo el conjunto de datos del ejemplo aquí : import pandas as pd raw_data = {‘regiment’: [‘Nighthawks’, ‘Nighthawks’, ‘Nighthawks’, ‘Nighthawks’, ‘Dragoons’, ‘Dragoons’, ‘Dragoons’, ‘Dragoons’, ‘Scouts’, ‘Scouts’, ‘Scouts’, ‘Scouts’], ‘company’: [‘1st’, ‘1st’, ‘2nd’, ‘2nd’, ‘1st’, ‘1st’, ‘2nd’, ‘2nd’,’1st’, ‘1st’, ‘2nd’, ‘2nd’], ‘name’: [‘Miller’, ‘Jacobson’, ‘Ali’, ‘Milner’, ‘Cooze’, ‘Jacon’, ‘Ryaner’, ‘Sone’, ‘Sloan’, ‘Piger’, ‘Riani’, ‘Ali’], […]
Tengo siguiente Pandas Dataframe: In [66]: hdf.size() Out[66]: ab 0 0.0 21004 0.1 119903 0.2 186579 0.3 417349 0.4 202723 0.5 100906 0.6 56386 0.7 6080 0.8 3596 0.9 2391 1.0 1963 1.1 1730 1.2 1663 1.3 1614 1.4 1309 … 186 0.2 15 0.3 9 0.4 21 0.5 4 187 0.2 3 0.3 10 […]
Tengo un dataframe como este: Name id col1 col2 col3 cl4 PL 252 0 747 3 53 PL2 252 1 24 2 35 PL3 252 4 75 24 13 AD 889 53 24 0 95 AD2 889 23 2 0 13 AD3 889 0 24 3 6 BG 024 12 89 53 66 BG1 024 […]