Articles of análisis de

Extraer información de una tupla (Python)

Actualmente estoy usando la biblioteca httplib en Python 2.7 para obtener algunos encabezados de un sitio web para establecer a) el tamaño de archivo de una descarga yb) la última fecha de modificación del archivo. He usado algunas herramientas en línea y estos detalles existen. Actualmente estoy ejecutando mi código Python y parece que funciona […]

Análisis de las direcciones “De” del texto del correo electrónico

Estoy tratando de extraer las direcciones de correo electrónico de las transcripciones de texto sin formato de los correos electrónicos. He reunido un poco de código para encontrar las direcciones, pero no sé cómo discriminarlas; en este momento solo escupe todas las direcciones de correo electrónico en el archivo. Me gustaría que fuera solo para […]

Agrupe por dos columnas y cuente las ocurrencias de cada combinación en pandas

Tengo el siguiente dataframe: data = pd.DataFrame({‘user_id’ : [‘a1’, ‘a1’, ‘a1’, ‘a2′,’a2′,’a2′,’a3′,’a3′,’a3’], ‘product_id’ : [‘p1′,’p1′,’p2′,’p1′,’p1′,’p1′,’p2′,’p2′,’p3’]}) product_id user_id p1 a1 p1 a1 p2 a1 p1 a2 p1 a2 p1 a2 p2 a3 p2 a3 p3 a3 en el caso real, también podría haber otras columnas, pero lo que debo hacer es agrupar por dataframe por product_id […]

leer el archivo en una matriz separada por el párrafo Python

Tengo un archivo de texto, quiero leer este archivo de texto en 3 matrices diferentes, array1 array2 y array3. el primer párrafo se coloca en array1, el segundo párrafo se coloca en array2 y así sucesivamente. el cuarto párrafo se colocará en array1 element2 y así sucesivamente, los párrafos se separan con una línea en […]

Cómo dividir los pares clave-valor separados por comas con comas entre comillas

Sé que hay muchas otras publicaciones sobre el análisis de valores separados por comas, pero no pude encontrar uno que divida los pares clave-valor y maneje comas entre comillas. Tengo cuerdas como esta: age=12,name=bob,hobbies=”games,reading”,phrase=”I’m cool!” Y quiero conseguir esto: { ‘age’: ’12’, ‘name’: ‘bob’, ‘hobbies’: ‘games,reading’, ‘phrase’: “I’m cool!”, } Intenté usar shlex así: lexer […]

¿Cómo puedo analizar un archivo creado con pstats.dump_stats (nombre de archivo) fuera de línea?

Básicamente he hecho lo siguiente: import cProfile, pstats, StringIO pr = cProfile.Profile() pr.enable() # … my code did something … pr.disable() s = StringIO.StringIO() sortby = ‘cumulative’ ps = pstats.Stats(pr, stream=s).sort_stats(sortby) ps.dump_stats(‘stats.dmp’) # dump the stats to a file named stats.dmp Así que ahora tengo el archivo llamado ‘stats.dmp’ almacenado fuera de línea. ¿Cómo puedo […]

¿Cómo analizar la fuente de C ++ en Python?

Queremos analizar nuestro enorme árbol de fonts de C ++ para obtener suficiente información para alimentar a otra herramienta para hacer diagtwigs de relaciones de clase y objeto, discernir la organización general de las cosas, etc. Mi mejor bash hasta ahora es un script de Python que analiza todos los archivos .cpp y .h, realiza […]

analizar la cadena de conjuntos de enteros con intervalos para listar

Tengo la cadena “2,5,7-9,12″ . Quiero obtener [2, 5, 7, 8, 9, 12] de la lista. ¿Hay alguna función incorporada para ella en python? Gracias. UPD. Supongo que la respuesta directa es no . De todos modos, gracias por tus “fragmentos”. Usando uno, sugerido por Sven Marnach .

cómo dividir los valores en una columna de datos y agregarlos a una nueva columna con una condición en pandas

Tengo un df, name Value Sri is a cricketer Sri,is Ram player Ram Ravi is a singer is cricket and foot is ball and,is,foot y una lista, my_list=[“is”, “foot”] Estoy intentando dividir df [“valor”] por (,) y agregar el valor a una nueva columna si el valor existe en my_list. Mi salida esperada es name […]

Los valores de la columna de datos no están cambiando a flotar

Tengo un dataframe, df, Name Stage Description 0 sri 1 sri is one of the good singer in this two 1 nan 2 thanks for reading 2 ram 1 ram is two of the good cricket player 3 ganesh 1 one driver 4 nan 2 good buddies tried df[“Stage”]=pd.to_numeric(df[“Stage”],downcast=”float”) Pero aun así los valores son […]