Tengo un pandas.core.frame.DataFrame que se ve así: 0 1 0 [1,2,3] 1 1 [2,2,1] 1 2 [1,2,1] 1 … La última columna es la etiqueta y se supone que cada una de las matrices de la columna ‘0’ son puntos de datos diferentes para una clase determinada. Quiero que esto se convierta en: x0 x1 […]
Tengo archivos abajo file1.csv,file2.csv…. Me gustaría extraer muestras de cada archivo csv. Lo intenté f1=pd.read_csv(file1.csv) f1.sample(2) f1.append(f2) Traté de hacer un bucle y añadir. Supongo que algunas soluciones son más rápidas. ¿Cómo puedo recolectar muestras en múltiples archivos csv?
Tengo una lista de listas: [[‘1’, ‘Toy Story (1995)’, “Animation|Children’s|Comedy”], [‘2’, ‘Jumanji (1995)’, “Adventure|Children’s|Fantasy”], [‘3’, ‘Grumpier Old Men (1995)’, ‘Comedy|Romance’]] Quiero terminar con un dataframe de pandas con estas columnas. cols = [‘MovieID’, ‘Name’, ‘Year’, ‘Adventure’, ‘Children’, ‘Comedy’, ‘Fantasy’, ‘Romance’] Para las columnas ‘Adventure’, ‘Children’, ‘Comedy’, ‘Fantasy’, ‘Romance’ , los datos serán 1 o 0. […]
Quiero mostrar mi dataframe de Pandas en pantalla en un formato tabular: df = pd.DataFrame({‘apples’: 10, ‘bananas’: 15, ‘pears’: 5}, [0]) No estoy seguro de cómo hacerlo. Sé que pd.DataFrame.plot () tiene algunas opciones para mostrar una tabla, pero solo junto con el gráfico. Solo quiero mostrar la tabla (es decir, el dataframe) en la […]
Estoy tratando de implementar un algoritmo . Digamos que el algoritmo se ejecuta como la función “xyz” La función está diseñada específicamente para operar en datos de trayectoria, es decir, coordenadas (x, y). La función toma dos argumentos: el primer argumento es una lista de tuplas de (x, y) puntos, y el segundo es un […]
Tengo un DataFrame de pandas con una estructura como esta: df = pd.DataFrame( [ [ ‘foo1’, ‘a’, ‘z’, ‘bar1’, 1, 4 ], [ ‘foo2’, ‘b’, ‘y’, ‘bar2’, 2, 5 ], [ ‘foo3’, ‘c’, ‘x’, ‘bar3’, 3, 6 ] ] ) df.columns = [ ‘foo’, ‘let1’, ‘let2’, ‘bar’, ‘num1’, ‘num2’ ] print( df ) foo let1 […]
Tengo un DataFrame donde tengo los siguientes datos. Cada fila representa una palabra que aparece en cada episodio de una serie de televisión. Si una palabra aparece 3 veces en un episodio, el dataframe de pandas tiene 3 filas. Ahora necesito filtrar una lista de palabras para que solo obtenga las palabras que aparecen más […]
Dados los datos rows = [ {‘x’: 1, ‘y’: 2, ‘z’: 3}, {‘x’: 2, ‘y’: 2, ‘z’: 3}, ] Si bash construir un dataframe como este frame = pd.DataFrame.from_records(rows, index=’x’) funciona bien. Sin embargo, este frame = pd.DataFrame.from_records(rows, index=’x’, columns=[‘y’, ‘z’]) (que espero que sea equivalente) falla con el error extraño: KeyError: ‘x’ . Que […]
Estoy buscando un enfoque de Pythonic para capturar estadísticas basadas en la cantidad de coincidencias en una columna de DF. Así que trabajando con este ejemplo: rng = pd.DataFrame( {‘initial_data’: [‘A’, ‘A’,’A’, ‘A’, ‘B’,’B’, ‘A’ , ‘A’, ‘A’, ‘A’,’B’ , ‘B’, ‘B’, ‘A’,]}, index = pd.date_range(‘4/2/2014′, periods=14, freq=’BH’)) test_B_mask = rng[‘initial_data’] == ‘B’ rng[‘test_for_B’] = […]
He adjuntado el dataframe en la foto. En el df, subVoyageID es el índice predeterminado. Estoy tratando de eliminar esa fila en blanco al lado del subvoyageID, de modo que todos los nombres de columna estén alineados en la misma fila, pero no puedo hacerlo. Dado que subVoyageID es el índice predeterminado, copié los datos […]