Me siento cómodo con las implementaciones de Django bastante unidimensionales, pero ahora estoy tratando de entender el proceso de múltiples sitios con cosas compartidas. He leído el Marco de Sitios de Django y muchas publicaciones sobre el tema, pero no entiendo lo básico sobre cómo iniciar un segundo sitio que usa la misma base de […]
He estado aprendiendo a trabajar con Scrapy desde el siguiente enlace: http://doc.scrapy.org/en/master/intro/tutorial.html Cuando bash ejecutar el código escrito en la sección de Rastreo ( scrapy crawl dmoz ), obtengo el siguiente error: AttributeError: ‘module’ object has no attribute ‘Spider ‘ Sin embargo, cambié “Spider” a “spider” y solo obtuve un nuevo error: TypeError: Error when […]
Tengo el rastreador implementado como a continuación. Está funcionando e iría a través de sitios regulados bajo el link extractor . Básicamente, lo que estoy tratando de hacer es extraer información de diferentes lugares en la página: – href y text () bajo la clase ‘news’ (si existe) – url de la imagen bajo la […]
La estructura de mi proyecto: kmss/ ├── kmss │ ├── __init__.py │ ├── items.py │ ├── pipelines.py │ ├── settings.py │ └── spiders │ ├── __init__.py │ └── first.py ├── README.rst ├── scrapy.cfg └── setup.py Lo estoy ejecutando en mac y mi carpeta de proyecto se crea en la ubicación: /user/username/kmss Y dentro de items.py […]