¿Cuál es el parámetro de nombre en Pandas Series?

En el documento de Series , el parámetro de uso de name y fastpath no se explica. ¿Qué hacen?

El argumento de name permite dar un nombre a un objeto Series , es decir, a la columna. De modo que cuando coloques eso en un DataFrame , la columna será nombrada de acuerdo con el parámetro de name .

ejemplo:

 In [1]: s = pd.Series(["A","B","C"], name="foo") In [2]: s Out[2]: 0 A 1 B 2 C Name: foo, dtype: object In [3]: pd.DataFrame(s) Out[4]: foo 0 A 1 B 2 C 

Si no le das un name a tu Series , se le asignará un nombre automáticamente. Aquí estará un 0 en el objeto dataframe :

  0 0 A 1 B 2 C 

Para la fastpath , es un parámetro interno y ya se ha informado de un problema:

https://github.com/pydata/pandas/issues/6903

El name de pd.Series convierte en el column name la column name cuando los reúne juntos. Y viceversa, cuando extrae una columna de dataframe , tiene el column name la column name como el nombre del pd.Series extraído.

 import pandas as pd import numpy as np s1 = pd.Series(np.random.randn(10), name='series1') s2 = pd.Series(np.random.randn(10), name='series2') pd.concat([s1, s2], axis=1) Out[16]: series1 series2 0 0.3499 0.3017 1 -2.2980 -1.1121 2 -1.4517 -0.5107 3 -0.4596 -0.0855 4 -0.3230 0.5391 5 -0.1764 -0.3218 6 2.4806 -0.6129 7 1.6766 1.1408 8 -1.2407 0.4857 9 0.3587 -1.5752 

Agregando a toda la información, acabo de enterarme de que cuando tiene que agregar una fila usando Series, existen dos opciones: 1) ignore_index = True, en este caso, eliminará el índice establecido y lo restablecerá al índice numérico (predeterminado) 2) usar el nombre ayuda a mantener la estructura actual del dataframe y usar el parámetro de nombre como el índice múltiple (en orden).

Hay otro uso del parámetro ‘nombre’. Daré un ejemplo. En este ejemplo, veremos que el parámetro ‘nombre’ podría usarse como un nombre de índice para los valores.

 purchase_1 = pd.Series({'Name': 'JJ', 'Item': 'A', 'Cost': 22.00}) purchase_2 = pd.Series({'Name': 'KK', 'Item': 'B', 'Cost': 22.50}) dfn = pd.DataFrame([purchase_1, purchase_2], index=['Store X', 'Store Y']) dfn = dfn.append(pd.Series(data={'Cost': 30.00, 'Item': 'C','Name': 'TT'}, name='Store Y')) dfn Out[3]: Cost Item Name Store X 22.0 A JJ Store Y 22.5 B KK Store Y 30.0 C TT