Estoy haciendo un análisis palabra por palabra de una oración como “Oye, ¿esta es una excelente película?” Tengo muchas oraciones como la de arriba. Tengo un archivo de conjunto de datos enorme como se muestra a continuación, donde tengo que hacer una búsqueda rápida si esa palabra existe. Si lo hace, entonces haga un análisis […]
Estoy exportando texto UTF-8 desde Excel y quiero leer y analizar los datos entrantes utilizando Python. He leído toda la información en línea, así que ya he intentado esto, por ejemplo: txtFile = codecs.open( ‘halout.txt’, ‘r’, ‘utf-8’ ) for line in txtFile: print repr( line ) El error que estoy recibiendo es: UnicodeDecodeError: el codec […]
Hay otras preguntas que se refieren a esto en el desbordamiento de stack, como la forma de analizar una cadena y devolver una matriz anidada. Pero todos se refieren a listas en el formato de ((abc)de(fg))) . yendo a la forma: [[‘a’,’b’,’c’]’d’,’e'[‘f’,’g’,]]] Tengo una lista de la forma: ((wordOneWord2)OtherWord(FinalWord))) Al usar los métodos que aprendí […]
Me gustaría saber cómo realizaría el análisis de imágenes en R. Mi objective es convertir las imágenes en matrices (información en píxeles), extraer / cuantificar el color, estimar la presencia de formas y comparar imágenes en base a tales métricas / patrones . Soy consciente de los paquetes relevantes disponibles en Python (las sugerencias relacionadas […]
Es un error bastante común mezclar los argumentos de cadena de fecha y formato datetime.strptime() usando: datetime.strptime(“%B %d, %Y”, “January 8, 2014”) en lugar de al revés: datetime.strptime(“January 8, 2014”, “%B %d, %Y”) Por supuesto, fallaría durante el tiempo de ejecución: >>> datetime.strptime(“%B %d, %Y”, “January 8, 2014”) Traceback (most recent call last): File “”, […]
He creado un Diccionario ordenado de Python mediante la importación de colecciones y lo he almacenado en un archivo llamado ‘filename.txt’. el contenido del archivo parece OrderedDict([(7, 0), (6, 1), (5, 2), (4, 3)]) Necesito hacer uso de este OrderedDict de otro progtwig. lo hago como myfile = open(‘filename.txt’,’r’) mydict = myfile.read() Necesito obtener ‘mydict’ […]
Estoy leyendo un archivo en Python 2.4 que está estructurado así: field1: 7 field2: “Hello, world!” field3: 6.2 La idea es analizarlo en un diccionario que tome fieldfoo como clave y lo que venga después de los dos puntos como valor. Quiero convertir lo que sea después de los dos puntos a su tipo de […]
Estoy tratando de escribir una gramática para un conjunto de oraciones y usar Pyparsing para analizarla. Estas oraciones indican qué y cómo buscar en un archivo de texto, y debo convertirlas en los códigos de búsqueda de expresiones regulares correspondientes. Sin embargo, hay algunos elementos que no son realmente libres de contexto y, por lo […]
Soy bastante nuevo en progtwigción y me lanzo a python para familiarizarme con el análisis de datos y el aprendizaje automático. Estoy siguiendo un tutorial sobre la eliminación hacia atrás para una regresión lineal múltiple. Aquí está el código ahora mismo: # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas […]
¿Cuál es el idioma Python recomendado para dividir una cadena en la última aparición del delimitador en la cadena? ejemplo: # instead of regular split >> s = “a,b,c,d” >> s.split(“,”) >> [‘a’, ‘b’, ‘c’, ‘d’] # ..split only on last occurrence of ‘,’ in string: >>> s.mysplit(s, -1) >>> [‘a,b,c’, ‘d’] mysplit toma un […]