¿Cómo raspar los datos de URL del sitio de intranet usando python?

¡Necesito un Guerrero de Python para que me ayude (soy un novato)! Estoy tratando de raspar ciertos datos de un sitio dentro de la red usando el módulo urllib. Sin embargo, como el sitio web de mi empresa solo está disponible para que los empleados lo vean y no para el público, creo que es por eso que obtengo este código:

IOError: (‘error de http’, 401, ‘No autorizado’,)

¿Cómo puedo llegar a esto? Ni siquiera leerá el sitio usando htmlfile.read ()

Código de muestra para obtener sitio público:

import urllib import re htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL") htmltext = htmlfile.read() regex = '(.+?)' pattern = re.compile(regex) price = re.findall(pattern,htmltext) print price 

Intente las solicitudes con request_ntlm :

 import requests from requests_ntlm import HttpNtlmAuth r = requests.get("http://ntlm_protected_site.com",auth=HttpNtlmAuth('domain\\username','password')) print r.text 

Si necesita ayuda con alguna información específica de esta biblioteca y no puede encontrarla en los documentos, deje un comentario.