Articles of cadena de datos de los

Concatenar índice y cadena a nueva columna

Tengo un dataframe de 3 columnas (incluido el índice): name age 0 satya 24 1 abc 26 2 xyz 29 3 def 32 por lo tanto, es necesario agregar un nuevo detail columna que almacenará el nombre del archivo de detalle y el valor en esa columna debería ser similar (str(file_index no)) name age detail […]

Elimine caracteres no ASCII de las columnas de cadena en pandas

Tengo un dataframe de panda con varias columnas que se mezclan con valores y caracteres no deseados. columnA columnB columnC ColumnD \x00A\X00B NULL \x00C\x00D 123 \x00E\X00F NULL NULL 456 Lo que me gustaría hacer es hacer este dataframe como se muestra a continuación. columnA columnB columnC ColumnD AB NULL CD 123 EF NULL NULL 456 […]

Python: convierte todos los elementos de un Dataframe en cadenas

Seguí el siguiente procedimiento: En Python, ¿cómo convierto todos los elementos de una lista a flotantes? porque cada columna de mi Dataframe es una list , pero en lugar de floats , elegí cambiar todos los valores a strings . df = [str(i) for i in df] Pero esto fracasó. Simplemente borró todos los datos […]

pandas dataframe str.contains () AND operation

df (Pandas Dataframe) tiene tres filas. some_col_name “apple is delicious” “banana is delicious” “apple and banana both are delicious” df.col_name.str.contains(“apple|banana”) Atrapará todas las filas: “apple is delicious”, “banana is delicious”, “apple and banana both are delicious”. ¿Cómo aplico el operador AND en el método str.contains, de modo que solo tome cuerdas que contengan AMBAS manzanas […]

agregue un prefijo de cadena a cada valor en una columna de cadena usando Pandas

Me gustaría agregar una cadena al inicio de cada valor en una columna de un dataframe de pandas (con elegancia). Ya me di cuenta de cómo hacer esto y actualmente estoy usando: df.ix[(df[‘col’] != False), ‘col’] = ‘str’+df[(df[‘col’] != False), ‘col’] Parece una cosa muy poco elegante que hacer. ¿Conoces alguna otra forma (que quizás […]

Eliminar partes no deseadas de cadenas en una columna

Estoy buscando una manera eficiente de eliminar partes no deseadas de cadenas en una columna de DataFrame. Los datos se parecen a time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Necesito recortar estos datos para: time result 1 09:00 52 2 10:00 62 3 11:00 44 […]

Seleccionar por cadena parcial de un dataframe de pandas

Tengo un DataFrame con 4 columnas de las cuales 2 contienen valores de cadena. Me preguntaba si habría una manera de seleccionar filas basadas en una cadena de concordancia parcial con una columna en particular. En otras palabras, una función o función lambda que haría algo como re.search(pattern, cell_in_question) devolviendo un booleano. Estoy familiarizado con […]