Articles of web

Web scraping: cómo identificar el contenido principal en una página web

Dada una página web de artículos de noticias (de cualquier fuente de noticias importante, como times o bloomberg), quiero identificar el contenido del artículo principal en esa página y desechar los demás elementos misceláneos como anuncios, menús, barras laterales, comentarios de usuarios. ¿Cuál es una forma genérica de hacer esto que funcione en la mayoría […]

La aplicación web está compartiendo el mismo almacenamiento de memoria

Estoy trabajando en una aplicación que uso para calcular los detalles del usuario. Pero de alguna manera, los valores de un usuario alteran los de otro usuario. A continuación se muestra un fragmento del código. def Compute_UserScore(self, details, ques_no): try: if(HomePage.answer_.strip() == “”): self.response.write(“”” alert(“Dear User, You can not answer same answer twice.. Take test […]

¿Descargar imágenes de Google Search usando Python da error?

Aquí está mi código: import os import sys import time from urllib import FancyURLopener import urllib2 import simplejson # Define search term searchTerm = “parrot” # Replace spaces ‘ ‘ in search term for ‘%20’ in order to comply with request searchTerm = searchTerm.replace(‘ ‘,’%20’) # Start FancyURLopener with defined version class MyOpener(FancyURLopener): version = […]

Rellenar datos de formulario web utilizando módulos Python incorporados

Está bien, así que he usado mecanizar, pedidos, una sopa hermosa e incluso selenium en mi empresa para hacer algo como esto y he llegado a la conclusión de que urllib y los otros módulos predeterminados son la mejor manera de hacerlo. El único problema es que no puedo entender cómo usarlo en absoluto. Entonces, […]

AttributeError: el objeto ‘módulo’ no tiene atributo ‘urls’

Python 2.7 y Django 1.10 ERROR: AttributeError: ‘module’ object has no attribute ‘urls’ main / urls.py from django.conf.urls import url, include from django.contrib import admin import article urlpatterns = [ url(r’^admin/’, include(admin.site.urls)), url(r’^’, include(article.urls)) ] articulo / urls.py from django.conf.urls import url from . import views urlpatterns = [ url(r’^$’, views.basic_one, name=’basic_one’) ] Estructura: APP […]

Django usando Nginx para servir contenido estático

Estoy tratando de configurar nginx para que sirva el contenido estático de mi proyecto django en un VPS remoto. Estoy usando la siguiente configuración para mi instancia de nginx: server { server_name myVPSip; access_log off; location /static/ { alias /usr/local/pcat/static/; } location / { proxy_pass http://127.0.0.1:8001; proxy_set_header X-Forwarded-Host $server_name; proxy_set_header X-Real-IP $remote_addr; add_header P3P ‘CP=”ALL […]

¿Cómo hacer que el decorador view_config funcione con una prueba de unidad de pirámide?

Escribí un decorador login_required para el marco web de la pirámide. En un servidor de prueba piramidal funciona bien. Pero en las pruebas de unidad de pirámide para el decorador @view_config no funcionan para todas las configuraciones (no solo el parámetro decorador). Este es el código: class MyViews(object): @view_config(decorator=login_required(login_url=LOGIN_URL), match_param=”action=change_password”, request_method=”GET”, renderer=”accounts/change_password.jinja2″) def change_password(self): form […]

No puedo cargar la imagen en mi plantilla django

Mis carpetas de proyectos son: mrdoorbeen manage.py mr_doorbeen setting.py mrdoorbeen migrations templates index.html profile profile.html Quiero incluir una imagen en mi archivo profile.html . Utilizo {% load staticfiles %} en la parte superior de profile.html y uso este código en la fuente de la imagen: y hago una carpeta en un mr_doorbeen y la llamo […]

django manage.py runserver se bloquea después de la segunda solicitud (intermitente)

Mi aplicación Django 1.11 (usando runserver) se cuelga después de varias solicitudes. No importa si es accedido por Chrome, Postman o curl. Cuando se cuelga, ni siquiera Ctrl + C puede cerrarlo. El proceso python.exe debe ser eliminado. Intenté depurarlo pero cuando Django está atascado, Python no puede pausarse para obtener los hilos / stack.

No se puede ejecutar el progtwig Scrapy

He estado aprendiendo a trabajar con Scrapy desde el siguiente enlace: http://doc.scrapy.org/en/master/intro/tutorial.html Cuando bash ejecutar el código escrito en la sección de Rastreo ( scrapy crawl dmoz ), obtengo el siguiente error: AttributeError: ‘module’ object has no attribute ‘Spider ‘ Sin embargo, cambié “Spider” a “spider” y solo obtuve un nuevo error: TypeError: Error when […]