Articles of indexación del

P: Cómo asignar de manera eficiente una identificación única a personas con múltiples entradas basadas en el nombre en df muy grande

Me gustaría tomar un conjunto de datos con un grupo de diferentes individuos únicos, cada uno con múltiples entradas, y asignar a cada individuo una identificación única para todas sus entradas. Aquí hay un ejemplo de la df: FirstName LastName id 0 Tom Jones 1 1 Tom Jones 1 2 David Smith 1 3 Alex […]

Seleccione el índice inverso en pd.Dataframe

¿Cómo seleccionar el índice inverso en pd.DataFrame usando loc o iloc ? Intenté df.loc[!my_index,my_feature] pero falló. Y df.loc[[ind for ind in df.index.tolist() if ind not in my_index],my_feature] parece demasiado aburrido. ¿Alguna idea mejor?

Obtenga el índice de la columna del nombre de la columna en Python Pandas

En R cuando necesite recuperar un índice de columna basado en el nombre de la columna que podría hacer idx <- which(names(my_data)==my_colum_name) ¿Hay alguna manera de hacer lo mismo con los marcos de datos de pandas?

¿Cómo indexar en un diccionario?

Tengo un diccionario a continuación: colors = { “blue” : “5”, “red” : “6”, “yellow” : “8”, } ¿Cómo indexo la primera entrada en el diccionario? colors[0] devolverá un KeyError por razones obvias.

Seleccionando una fila de pandas series / dataframe por índice entero

Tengo curiosidad por saber por qué df[2] no es compatible, mientras que df.ix[2] y df[2:3] funcionan ambos. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: ABCD 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Espero que df[2] funcione de la misma manera que df[2:3] para ser consistente […]

Cómo seleccionar columnas de marcos de datos con listas y rangos combinados

Por favor considere esto df: df = pd.DataFrame({‘a’:[1,2], ‘b’:[1,2], ‘c’:[1,2], ‘d’:[1,2], ‘e’:[1,2], ‘f’:[1,2], ‘g’:[1,2], ‘h’:[1,2]}) abcdefgh 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 ¿Cómo puedo seleccionar las columnas 1ª, 4ª y 5ª a 7ª? Lo que intenté: df.iloc[:, [0, 3, np.arange(5,8)]] ValueError: setting an […]

Para Pandas DataFrame, ¿cuál es la diferencia entre usar corchetes o puntos para acceder a una columna?

es decir: import pandas d = {‘col1’: 2, ‘col2’: 2.5} df = pandas.DataFrame(data=d, index=[0]) print(df[‘col2’]) print(df.col2) La salida es la misma. ¿Esta respuesta se aplica a este caso? ¿Cuál es la diferencia entre el corchete y las notaciones de puntos en Python?

Seleccione solo un índice de DataFrame multiindex

Estoy tratando de crear un nuevo DataFrame usando solo un índice de un DataFrame multi-indexado. ABC first second bar one 0.895717 0.410835 -1.413681 two 0.805244 0.813850 1.607920 baz one -1.206412 0.132003 1.024180 two 2.565646 -0.827317 0.569605 foo one 1.431256 -0.076467 0.875906 two 1.340309 -1.187678 -2.211372 qux one -1.170299 1.130127 0.974466 two -0.226169 -1.436737 -2.006747 Idealmente, […]