Articles of python pedidos

¿Cómo eliminar el iframe que no se mostró directamente en BeautifulSoup y se requiere usar selenium?

Quiero raspar un video de este sitio . sin embargo, traté de obtener su URL directamente desde la etiqueta pero no la encontré en la fuente de la página después de haberla raspado con solicitudes y BeautifulSoup. Utilicé este código: import requests from bs4 import BeautifulSoup ok = requests.get(‘http://okanime.com/animes/one-piece/episodes/one-piece-314’) parse = BeautifulSoup(ok.content, ‘html5lib’) for url […]

Python web scraping con solicitudes – después de iniciar sesión

Tengo un código de sopa / solicitud de python hermoso que me permite iniciar sesión en una URL con éxito. Sin embargo, después del inicio de sesión, para obtener los datos que necesito normalmente tendré que: 1) haga clic en ‘statement’ en la primera fila: 2) Seleccione las fechas, haga clic en ‘ejecutar statement’: 3) […]

Problemas para obtener solicitudes == 2.7.0 para descomprimir automáticamente gzip

Estoy intentando leer un archivo XML comprimido que solicito a través de solicitudes. Todo lo que he leído indica que la descompresión debe ocurrir automáticamente. #!/usr/bin/python from __future__ import unicode_literals import requests if __name__ == ‘__main__’: url = ‘http://rdf.dmoz.org/rdf/content.rdf.u8.gz’ headers = { ‘Accept-Encoding’: “gzip,x-gzip,deflate,sdch,compress”, ‘Accept-Content’: ‘gzip’, ‘HTTP-Connection’: ‘keep-alive’, ‘Accept-Language’: “en-US,en;q=0.8”, } request_reply = requests.get(url, headers=headers) […]

HTTP Error 403: Prohibido con urlretrieve

Estoy intentando descargar un PDF, sin embargo, aparece el siguiente error: Error HTTP 403: Prohibido Soy consciente de que el servidor está bloqueando por cualquier motivo, pero parece que no puedo encontrar una solución. import urllib.request import urllib.parse import requests def download_pdf(url): full_name = “Test.pdf” urllib.request.urlretrieve(url, full_name) try: url = (‘http://papers.xtremepapers.com/CIE/Cambridge%20IGCSE/Mathematics%20(0580)/0580_s03_qp_1.pdf’) print(‘initialized’) hdr = {} […]

manejo de claves duplicadas en la publicación HTTP para especificar valores múltiples

Fondo python 2.7 módulo de solicitudes Publicación http con claves duplicadas para especificar múltiples valores Problema Trevor está utilizando solicitudes de python con un sitio web que toma claves duplicadas para especificar múltiples valores. El problema es que los diccionarios JSON y Python no permiten claves duplicadas, por lo que solo una de las claves […]

Cómo realizar una tarea al realizar raspado de Twitter con solicitudes de python

Estoy tratando de recuperar 100 tweets recientes de un usuario. Está funcionando bien con el módulo tweepy en Python. Pero, ¿cómo puedo hacer lo mismo con las solicitudes en python? Quiero hacer: import requests r = requests.get(‘https://api.twitter.com/1.1/statuses/user_timeline.json?screen_name=xxxx&count=100’) ¿Cómo realizar la autenticación con clave de cliente, secreto de cliente, token de acceso y secreto de acceso, […]

Error de importación para Oauth

Estoy usando Python en las ventanas que tienen el mismo código en el que funcionaba bien, ahora tengo un cambio repentino para la actualización del progtwig. Encontré el error ImportError: no puedo importar el nombre a_native_string. ¿ Puede ayudarme a explicar por qué ocurre este error? Traceback (most recent call last): File “C:\Users\inla\Desktop\tweepy2\tweepy1.py”, line 1, […]

Archivo POST XML con peticiones

Me estoy poniendo: You have an error in your XML syntax… cuando ejecuto este script de Python que acabo de escribir (soy un novato) import requests xml = “””xxx.xml””” headers = {‘Content-Type’:’text/xml’} r = requests.post(‘https://example.com/serverxml.asp’, data=xml) print (r.content); Aquí está el contenido del xxx.xml. 4.0 login xxxx xxxxx xxx@xyz.com 1 Sé que el xml es […]

Accediendo a las páginas públicas de LinkedIn usando Python

Quiero acceder a mi página de LinkedIn disponible públicamente. En mi máquina local, el siguiente código funciona: import requests url = “http://de.linkedin.com/pub/ankush-shah/73/9/982” html = requests.get(url).text print html Y da el html correcto de mi perfil. Pero cuando ejecuto el mismo código en mi servidor Heroku, (supongo) estoy redirigido a algún lugar y obtengo este html. […]

Ingresa al sitio web https usando Python

Soy nuevo en publicar en stackoverflow, así que, por favor, ¡no muerda! Tuve que recurrir a hacer una cuenta y pedir ayuda para evitar golpear mi cabeza sobre la mesa por más tiempo … Estoy intentando iniciar sesión en el siguiente sitio web https://account.socialbakers.com/login utilizando el módulo de solicitudes en python. Parece que el módulo […]