Comencé con una estructura HTML simple, algo como esto: Gracias a la ayuda de @alecxe, pude crear este dictado JSON: {u’Outer List’: {u’Inner List’: [u’info 1′, u’info 2′, u’info 3′]}} usando su código: from bs4 import BeautifulSoup data = “””your html goes here: see the very end of post””” soup = BeautifulSoup(data) inner_ul = soup.find(‘ul’, […]
Me gustaría crear una lista de todas las funciones utilizadas en un archivo de código. Por ejemplo, si tenemos el siguiente código en un archivo llamado ‘add_random.py’ ` import numpy as np from numpy import linalg def foo(): print np.random.rand(4) + np.random.randn(4) print linalg.norm(np.random.rand(4)) ` Me gustaría extraer la siguiente lista: [numpy.random.rand, np.random.randn, np.linalg.norm, np.random.rand] […]
Perdóname si tengo la terminología incorrecta; tal vez solo obtener las palabras “correctas” para describir lo que quiero es suficiente para que encuentre la respuesta por mi cuenta. Estoy trabajando en un analizador para ODL (Lenguaje de descripción de objetos), un lenguaje arcano que, por lo que puedo decir, ahora lo usa solo la NASA […]
Tengo un archivo que contiene varias funciones de python, cada una con algunas declaraciones. def func1(): codeX… def func2(): codeY… CodeX y codeY pueden ser múltiples declaraciones. Quiero poder analizar el archivo, buscar una función por nombre y luego evaluar el código en esa función. Con el módulo ast, puedo analizar el archivo, encontrar los […]
Estoy usando Windows 8 y ejecutando python en eclipse con pyDev. Instalé Stanford coreNLP (versión de python) desde el sitio: https://github.com/relwell/stanford-corenlp-python Cuando bash importar corenlp, aparece el siguiente mensaje de error. Traceback (most recent call last): File “C:\Users\Ghantauke\workspace\PythonTest2\test.py”, line 1, in import corenlp File “C:\Python27\lib\site-packages\corenlp\__init__.py”, line 13, in from corenlp import StanfordCoreNLP, ParserError, TimeoutError, ProcessError […]
¿Hay algún código de Python que permita tomar un código de látex (para ecuaciones) y analizarlo a código Mathml o SVG? Una función simple que tome como argumento una cadena (el código de látex) y produzca una cadena (el código svg o mathml) sería perfecta. PD. He encontrado este http://svgkit.sourceforge.net/SVGLaTeX.html pero es un proyecto basado […]
Tengo el dataframe que se parece a: Groupe Id MotherName FatherName Field Advanced 56 Laure James English-107,Economics, Management, History, Philosophy Middle 11 Ann Nicolas Web-development, Java-2 Advanced 6 Helen Franc Literature, English-2 Beginner 43 Laure James Mathematics, History, Philosophy, Literature Middle 14 Naomi Franc Java-2, Management, English-107 Para seguir trabajando con los datos, necesito dividir […]
Tengo una página html que consiste en una tabla y quiero recuperar todos los valores en td, tr en esa tabla. He intentado trabajar con beautifulsoup pero ahora quería trabajar en el analizador lxml o HML con python. He adjuntado el ejemplo. Quiero recuperar valores como listas de tuplas como [ [( value of 2050 […]
Tengo el siguiente código: url = ‘https://www.basketball-reference.com/leagues/NBA_2017_standings.html#all_expanded_standings’ html = urlopen(url) soup = BeautifulSoup(html, ‘lxml’) print(len(soup.findAll(‘table’))) print(soup.findAll(‘table’)) Hay 6 tablas en la página web, pero solo devuelve 4 tablas. Intenté usar ‘html.parser’ o ‘html5lib’ como analizadores pero tampoco funcionó. ¿Alguna idea de cómo puedo obtener la tabla “clasificaciones expandidas” de la página web? ¡Gracias!
Si tengo la siguiente macro en algún código de C ++: _Foo(arg1, arg2) Me gustaría usar Python para encontrar todas las instancias y extensiones de esa macro usando Clang y los enlaces de Python que se proporcionan con cindex.py. No quiero usar una expresión regular de Python en el código directamente porque eso me lleva […]