Articles of marco de datos de los

Pandas DataFrame explotar el contenido de la columna

Tengo un pandas.core.frame.DataFrame que se ve así: 0 1 0 [1,2,3] 1 1 [2,2,1] 1 2 [1,2,1] 1 … La última columna es la etiqueta y se supone que cada una de las matrices de la columna ‘0’ son puntos de datos diferentes para una clase determinada. Quiero que esto se convierta en: x0 x1 […]

Cómo recolectar muestras en múltiples archivos csv

Tengo archivos abajo file1.csv,file2.csv…. Me gustaría extraer muestras de cada archivo csv. Lo intenté f1=pd.read_csv(file1.csv) f1.sample(2) f1.append(f2) Traté de hacer un bucle y añadir. Supongo que algunas soluciones son más rápidas. ¿Cómo puedo recolectar muestras en múltiples archivos csv?

Cree el dataframe de pandas a partir de la lista de listas, pero hay diferentes separadores

Tengo una lista de listas: [[‘1’, ‘Toy Story (1995)’, “Animation|Children’s|Comedy”], [‘2’, ‘Jumanji (1995)’, “Adventure|Children’s|Fantasy”], [‘3’, ‘Grumpier Old Men (1995)’, ‘Comedy|Romance’]] Quiero terminar con un dataframe de pandas con estas columnas. cols = [‘MovieID’, ‘Name’, ‘Year’, ‘Adventure’, ‘Children’, ‘Comedy’, ‘Fantasy’, ‘Romance’] Para las columnas ‘Adventure’, ‘Children’, ‘Comedy’, ‘Fantasy’, ‘Romance’ , los datos serán 1 o 0. […]

Trazar tabla y mostrar Pandas Dataframe

Quiero mostrar mi dataframe de Pandas en pantalla en un formato tabular: df = pd.DataFrame({‘apples’: 10, ‘bananas’: 15, ‘pears’: 5}, [0]) No estoy seguro de cómo hacerlo. Sé que pd.DataFrame.plot () tiene algunas opciones para mostrar una tabla, pero solo junto con el gráfico. Solo quiero mostrar la tabla (es decir, el dataframe) en la […]

¿Cómo ejecutar una función en un grupo de filas en el dataframe de pandas?

Estoy tratando de implementar un algoritmo . Digamos que el algoritmo se ejecuta como la función “xyz” La función está diseñada específicamente para operar en datos de trayectoria, es decir, coordenadas (x, y). La función toma dos argumentos: el primer argumento es una lista de tuplas de (x, y) puntos, y el segundo es un […]

Astack dos columnas en un DataFrame, repite otras

Tengo un DataFrame de pandas con una estructura como esta: df = pd.DataFrame( [ [ ‘foo1’, ‘a’, ‘z’, ‘bar1’, 1, 4 ], [ ‘foo2’, ‘b’, ‘y’, ‘bar2’, 2, 5 ], [ ‘foo3’, ‘c’, ‘x’, ‘bar3’, 3, 6 ] ] ) df.columns = [ ‘foo’, ‘let1’, ‘let2’, ‘bar’, ‘num1’, ‘num2’ ] print( df ) foo let1 […]

Filtrar datos con groupby en pandas.

Tengo un DataFrame donde tengo los siguientes datos. Cada fila representa una palabra que aparece en cada episodio de una serie de televisión. Si una palabra aparece 3 veces en un episodio, el dataframe de pandas tiene 3 filas. Ahora necesito filtrar una lista de palabras para que solo obtenga las palabras que aparecen más […]

DataFrame KeyError, aunque existe

Dados los datos rows = [ {‘x’: 1, ‘y’: 2, ‘z’: 3}, {‘x’: 2, ‘y’: 2, ‘z’: 3}, ] Si bash construir un dataframe como este frame = pd.DataFrame.from_records(rows, index=’x’) funciona bien. Sin embargo, este frame = pd.DataFrame.from_records(rows, index=’x’, columns=[‘y’, ‘z’]) (que espero que sea equivalente) falla con el error extraño: KeyError: ‘x’ . Que […]

Estadísticas basadas en el número de coincidencias en la columna de dataframe

Estoy buscando un enfoque de Pythonic para capturar estadísticas basadas en la cantidad de coincidencias en una columna de DF. Así que trabajando con este ejemplo: rng = pd.DataFrame( {‘initial_data’: [‘A’, ‘A’,’A’, ‘A’, ‘B’,’B’, ‘A’ , ‘A’, ‘A’, ‘A’,’B’ , ‘B’, ‘B’, ‘A’,]}, index = pd.date_range(‘4/2/2014′, periods=14, freq=’BH’)) test_B_mask = rng[‘initial_data’] == ‘B’ rng[‘test_for_B’] = […]

Cómo establecer un nuevo índice y eliminar el índice predeterminado en pandas df

He adjuntado el dataframe en la foto. En el df, subVoyageID es el índice predeterminado. Estoy tratando de eliminar esa fila en blanco al lado del subvoyageID, de modo que todos los nombres de columna estén alineados en la misma fila, pero no puedo hacerlo. Dado que subVoyageID es el índice predeterminado, copié los datos […]