Pandas DataFrame tiene un método de cambio de nombre que toma un parámetro llamado “índice”. No entiendo la descripción del parámetro en la documentación: DataFrame.rename
Específicamente, lo estoy usando como el ejemplo en la página web de documentación:
df.rename(index=str, columns={"A": "a", "B": "c"})
Entiendo el resultado, pero no entiendo por qué establecemos index=str
.
¿Para qué se utiliza el parámetro de index
? ¿Por qué el ejemplo establece index=str
?
El parámetro de índice se usa para cambiar el nombre del índice, tome df del ejemplo:
df.index # RangeIndex(start=0, stop=3, step=1) df.rename(index=str).index # converts index from int to str # Index(['0', '1', '2'], dtype='object')
Esto funciona porque en la función de cambio de nombre , también puede pasar funciones a los parámetros de índice y columnas que se aplicarán a cada elemento en el índice y las columnas. Aquí, str actúa como una función y convierte cada índice de int a objeto str .
Otro ejemplo:
df.rename(index=lambda x: x*2).index # Int64Index([0, 2, 4], dtype='int64')