Articles of análisis

¿Cómo analizar datos de bloques de un archivo de texto en una matriz 2D en Python?

Estoy tratando de analizar un archivo de texto con la siguiente estructura: latitude 5.0000 number_of_data_values 9 0.1 0.2 0.3 0.4 1.1 1.2 1.3 1.4 8.1 latitude 4.3000 number_of_data_values 9 0.1 0.2 0.3 0.4 1.1 1.2 1.3 1.4 8.1 latitude 4.0000 number_of_data_values 9 0.1 0.2 0.3 0.4 1.1 1.2 1.3 1.4 8.1 … Cada número de […]

¿Hay un analizador de mensajes de correo electrónico de código abierto (encabezados, archivos adjuntos, etc.)?

¿Existe una solución gratuita de código abierto que tome el mensaje de correo electrónico sin procesar (como parte del texto) y devuelva cada campo de encabezado, cada archivo adjunto y el cuerpo del mensaje como campos separados?

Uso de struct.unpack de Python con variables de 1 byte

¿Cómo puedo usar struct.unpack() o alguna otra función disponible en Python para convertir fácilmente una variable de un byte en un entero de Python? En este momento, se hace de una manera bastante aburrida: file = open(“telemetry.dat”, “rb”).read() magic = file[0] int(binascii.hexlify(magic), 16) ¿Hay otro?

Cadena numérica flexible que analiza en Python

¿Hay alguna biblioteca de Python que ayude a analizar y validar cadenas numéricas más allá de lo que es compatible con la función incorporada float ()? Por ejemplo, además de los números simples (1234.56) y la notación científica (3.2e15), me gustaría poder analizar formatos como: Números con comas: 2,147,483,647 Nombrados grandes números: 5.5 mil millones […]

Personalizando la función rolling_apply en los pandas de Python

Preparar Tengo un DataFrame con tres columnas: “Categoría” contiene Verdadero y Falso, y he hecho que df.groupby(‘Category’) según estos valores. “Tiempo” contiene marcas de tiempo (medidas en segundos) en las que se han registrado valores “Valor” contiene los valores en sí mismos. En cada instancia de tiempo, se registran dos valores: uno tiene la categoría […]

Eigsh escaso de Scipy () para valores propios pequeños

Estoy tratando de escribir un algoritmo de agrupamiento espectral usando NumPy / SciPy para sistemas más grandes (pero aún así manejables), haciendo uso de la biblioteca de álgebra lineal escasa de SciPy. Desafortunadamente, estoy teniendo problemas de estabilidad con eigsh () . Aquí está mi código: import numpy as np import scipy.sparse import scipy.sparse.linalg as […]

Análisis de palabras y puntuación de un archivo python.

Estoy haciendo un análisis palabra por palabra de una oración como “Oye, ¿esta es una excelente película?” Tengo muchas oraciones como la de arriba. Tengo un archivo de conjunto de datos enorme como se muestra a continuación, donde tengo que hacer una búsqueda rápida si esa palabra existe. Si lo hace, entonces haga un análisis […]

Python: ¿Cómo leo y analizo un archivo de texto utic-8 de Unicode?

Estoy exportando texto UTF-8 desde Excel y quiero leer y analizar los datos entrantes utilizando Python. He leído toda la información en línea, así que ya he intentado esto, por ejemplo: txtFile = codecs.open( ‘halout.txt’, ‘r’, ‘utf-8’ ) for line in txtFile: print repr( line ) El error que estoy recibiendo es: UnicodeDecodeError: el codec […]

Convierte una cadena con paréntesis nesteds en una lista anidada, python

Hay otras preguntas que se refieren a esto en el desbordamiento de stack, como la forma de analizar una cadena y devolver una matriz anidada. Pero todos se refieren a listas en el formato de ((abc)de(fg))) . yendo a la forma: [[‘a’,’b’,’c’]’d’,’e'[‘f’,’g’,]]] Tengo una lista de la forma: ((wordOneWord2)OtherWord(FinalWord))) Al usar los métodos que aprendí […]

Análisis de imágenes en R

Me gustaría saber cómo realizaría el análisis de imágenes en R. Mi objective es convertir las imágenes en matrices (información en píxeles), extraer / cuantificar el color, estimar la presencia de formas y comparar imágenes en base a tales métricas / patrones . Soy consciente de los paquetes relevantes disponibles en Python (las sugerencias relacionadas […]