Articles of análisis

Conversión de cadena a OrderedDict en Python

He creado un Diccionario ordenado de Python mediante la importación de colecciones y lo he almacenado en un archivo llamado ‘filename.txt’. el contenido del archivo parece OrderedDict([(7, 0), (6, 1), (5, 2), (4, 3)]) Necesito hacer uso de este OrderedDict de otro progtwig. lo hago como myfile = open(‘filename.txt’,’r’) mydict = myfile.read() Necesito obtener ‘mydict’ […]

Interpretación de cadenas como otros tipos de datos en Python

Estoy leyendo un archivo en Python 2.4 que está estructurado así: field1: 7 field2: “Hello, world!” field3: 6.2 La idea es analizarlo en un diccionario que tome fieldfoo como clave y lo que venga después de los dos puntos como valor. Quiero convertir lo que sea después de los dos puntos a su tipo de […]

Escribiendo reglas gtwigticales para elementos sensibles al contexto usando Pyparsing

Estoy tratando de escribir una gramática para un conjunto de oraciones y usar Pyparsing para analizarla. Estas oraciones indican qué y cómo buscar en un archivo de texto, y debo convertirlas en los códigos de búsqueda de expresiones regulares correspondientes. Sin embargo, hay algunos elementos que no son realmente libres de contexto y, por lo […]

: ¿Cómo puedo obtener statsmodel para devolver el valor de p de un objeto OLS?

Soy bastante nuevo en progtwigción y me lanzo a python para familiarizarme con el análisis de datos y el aprendizaje automático. Estoy siguiendo un tutorial sobre la eliminación hacia atrás para una regresión lineal múltiple. Aquí está el código ahora mismo: # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas […]

¿Dividir en el último delimitador en la cadena Python?

¿Cuál es el idioma Python recomendado para dividir una cadena en la última aparición del delimitador en la cadena? ejemplo: # instead of regular split >> s = “a,b,c,d” >> s.split(“,”) >> [‘a’, ‘b’, ‘c’, ‘d’] # ..split only on last occurrence of ‘,’ in string: >>> s.mysplit(s, -1) >>> [‘a,b,c’, ‘d’] mysplit toma un […]

Análisis del significado del texto

Me doy cuenta de que este es un tema amplio, pero estoy buscando un buen manual para analizar el significado del texto, idealmente en Python. Como ejemplo de lo que estoy buscando hacer, si un usuario hace una publicación de blog como: “Manny Ramírez hace su regreso para los Dodgers hoy contra los Astros de […]

La función json.load () genera un error ‘UnicodeDecodeError:’ el codec ‘ascii’ no puede decodificar ‘error

Estoy intentando leer un archivo JSON que he guardado en un archivo de texto usando la función python .loads (). Más tarde analizaré el JSON para obtener un valor específico. Sigo recibiendo este mensaje de error. Cuando lo busco en google, no hay resultados. UnicodeDecodeError: el codec ‘ascii’ no puede decodificar el byte 0xc2 en […]

Arreglando el escape JSON inválido

KISSmetrics genera cadenas JSON inválidas que necesito analizar. Estoy recibiendo toneladas de errores como ERROR 2013-03-04 04:31:12,253 Invalid \escape: line 1 column 132 (char 132): {“search engine”:”Google”,”_n”:”search engine hit”,”_p”:”z392cpdpnm6silblq5mac8kiugq=”,”search terms”:”happy new year animation 1920\303\2271080 hd”,”_t”:1356390128} ERROR 2013-03-04 04:34:19,153 Invalid \escape: line 1 column 101 (char 101): {“search engine”:”Google”,”_n”:”ad campaign hit”,”_p”:”byskpczsw6sorbmzqi0tk1uimgw=”,”search terms”:”\331\203\330\261\330\252\331\207 \331\201\331\212\330\257\331\212\330\244\331\211 \330\256\331\212\331\204\330\247\330\255\331\211 \331\203\331\210\330\261\330\257\331\211″,”_t”:1356483052} Mi […]

BeautifulSoup: el objeto de tipo ‘Respuesta’ no tiene len ()

Problema: cuando bash ejecutar el script, BeautifulSoup(html, …) muestra el mensaje de error “TypeError: el objeto de tipo ‘Response’ no tiene len (). Intenté pasar el html real como parámetro, pero aún así no funciona import requests url = ‘http://vineoftheday.com/?order_by=rating’ response = requests.get(url) html = response.content soup = BeautifulSoup(html, “html.parser”)

Usando argparse para analizar argumentos de la forma “arg = val”

Quiero usar argparse para analizar las líneas de comando de la forma “arg = val” Por ejemplo, el uso sería: script.py conf_dir=/tmp/good_conf Para lograrlo, estoy haciendo esto: desc = “details” parser = argparse.ArgumentParser(description=desc, add_help=False) args = parser.add_argument(“conf_dir”) args = parser.parse_args(“conf_dir=FOO”.split()) args = parser.parse_args() print args.conf_dir Pero, el problema es que, al invocar el script con: […]