Articles of url

Obtenga solo el primer enlace de una lista de URL con BeautifulSoup

Analicé un archivo HTML completo, extrayendo algunas URL con el módulo Beautifulsoup en Python, con esta tranquilidad de código: for link in soup.find_all(‘a’): for line in link : if “condition” in line : print link.get(“href”) y obtengo en el shell una serie de enlaces que observan la condición en el bucle if: http: // ..link1 […]

Enlace HTML analizando usando BeautifulSoup

Aquí está mi código de Python que estoy usando para extraer el HTML específico de los enlaces de página que estoy enviando como parámetro. Estoy usando BeautifulSoup . ¡Este código funciona bien para algunas veces y otras veces se atasca! import urllib from bs4 import BeautifulSoup rawHtml = ” url = r’http://iasexamportal.com/civilservices/tag/voice-notes?page=’ for i in […]

Subdominios de enrutamiento en pirámide

En Pylons 1.0 podría ir a config / routing.py y agregar map.connect(‘/’, controller=’index’, conditions=dict(sub_domain=False)) map.connect(‘/’, controller=’mobileindex’, conditions=dict(sub_domain=’m’)) para enrutar m.mydomain.com a un controlador diferente, pero sigue usando la misma aplicación. ¿Puedo hacer lo mismo en la pirámide?

¿Cómo puedo normalizar / contraer rutas o URL en Python de forma independiente?

Intenté usar os.normpath para convertir http://example.com/a/b/c/../ a http://example.com/a/b/ pero no funciona en Windows porque se convierte la barra diagonal inversa.

Obtener subdominio de URL usando Python

Por ejemplo, la dirección es: Address = http://lol1.domain.com:8888/some/page Quiero guardar el subdominio en una variable para poder hacerlo así; print SubAddr >> lol1

¿Cuál es la mejor manera de verificar el cambio de URL con Selenium en Python?

Entonces, lo que quiero hacer es ejecutar una función en una página web específica (que coincide con mi expresión regular). En este momento lo estoy comprobando cada segundo y funciona, pero estoy seguro de que hay una mejor manera (ya que está inundando ese sitio web con las solicitudes). while flag: time.sleep(1) print(driver.current_url) if driver.current_url […]

Cómo obtener el nombre de dominio (nombre + TLD) de una URL en python

Quiero extraer el nombre de dominio (nombre del sitio + TLD) de una lista de URL que pueden variar en su formato. por ejemplo: estado actual —-> lo que quiero mail.yahoo.com——> yahoo.com account.hotmail.co.uk—->hotmail.co.uk x.it—>x.it google.mail.com—> google.com ¿Hay algún código de Python que pueda ayudarme a extraer lo que quiero de la URL o debo hacerlo […]

¿Cómo puedo anteponer http a una url si no comienza con http?

Tengo urls formateadas como: google.com www.google.com http://google.com http://www.google.com Me gustaría convertir todo tipo de enlaces a un formato uniforme, comenzando con http:// http://google.com ¿Cómo puedo anteponer las URL con http:// usando Python?

¿Cómo agregar un enlace a la palabra usando reportlab?

Estoy confundido con los enlaces y reportlab. Me gustaría tener un texto con una palabra, que ‘contiene’ un enlace en el que se puede hacer clic. Por ejemplo, escribo ese texto: This web-site is called StackOverflow. Y quiero que se pueda hacer clic en la palabra StackOverflow y que lleve a la página correspondiente. ¿Hay […]

problemas para obtener datos de FlightRadar24 con urllib2

Estoy tratando de obtener datos de FlightRadar24 usando el siguiente script, basado en esta respuesta para manejar las cookies. Cuando actualmente escribo esa URL en un navegador, obtengo un buen json largo o diccionario que incluye una lista de actualizaciones de lat / long / alt. Pero cuando bash el siguiente código, aparece el mensaje […]