PREGUNTA COMPLETA: escriba una función que tome como parámetro una lista de cadenas y devuelva una lista que contenga cada cadena en mayúsculas como un título. Es decir, si el parámetro de entrada es [“apple pie”, “brownies”,”chocolate”,”dulce de leche”,”eclairs”] , su función debería devolver [“Apple Pie”, “Brownies”,”Chocolate”,”Dulce De Leche”,”Eclairs”] . Mi progtwig (ACTUALIZADO): ¡Creo que […]
Estoy tratando de crear un modelo de regresión que predice la edad de los autores. Estoy usando (Nguyen et al, 2011) como mi base. Utilizando un Modelo de Bolsa de Palabras, cuento las ocurrencias de palabras por Documento (que son Publicaciones de Tableros) y creo el vector para cada Publicación. Limito el tamaño de cada […]
Estoy tratando de obtener los bigtwigs en las oraciones usando Frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = [“the mayor of new york was there”, “machine learning can be useful sometimes”,”new york mayor was present”] sentence_stream = [doc.split(” “) for doc in documents] #print(sentence_stream) bigram = […]
Por ejemplo la página web es el enlace: https://www.architecture.com/FindAnArchitect/FAAPractices.aspx?display=50 Debo tener el nombre de las firmas y su dirección y sitio web. He intentado lo siguiente para convertir el HTML en texto: import nltk from urllib import urlopen url = “https://www.architecture.com/FindAnArchitect/FAAPractices.aspx display=50” html = urlopen(url).read() raw = nltk.clean_html(html) print(raw) Pero devuelve el error: ImportError: cannot […]
Estoy trabajando en un proyecto que implica crear una base de datos del código federal de los EE. UU. En un formato determinado. He obtenido el código completo de la fuente oficial que no está bien estructurado. He logrado raspar el Código de los EE. UU. En el formato de abajo en archivos de texto […]
Tengo un archivo de texto con todos ellos que actualmente tienen el mismo carácter final (N), que se está utilizando para identificar el progreso del sistema. Quiero cambiar el carácter final a “Y” en caso de que el progtwig termine a través de un error u otras interrupciones para que al reiniciar el progtwig buscará […]
Tengo un código de trabajo que abre un archivo, busca una cadena e imprime la línea si contiene esa cadena. Estoy haciendo esto para poder decidir, manualmente, si la línea debe eliminarse de mi conjunto de datos o no. Pero sería mucho mejor si puedo decirle al progtwig que lea la parte de la línea […]
Quiero calcular la similitud entre dos listas de palabras, por ejemplo: [’email’,’user’,’this’,’email’,’address’,’customer’] es similar a esta lista: [’email’,’mail’,’address’,’netmail’] Quiero tener un mayor porcentaje de similitud que otra lista, por ejemplo: [‘address’,’ip’,’network’] incluso si la address existe en la lista.
Estoy buscando obtener el contenido de un archivo de texto alojado en mi sitio web usando Python. El servidor requiere que JavaScript esté habilitado en su navegador. Por eso cuando corro: import urllib2 target_url = “http://09hannd.me/ai/request.txt” data = urllib2.urlopen(target_url) Recibo una página html que dice habilitar JavaScript. Me preguntaba si había una manera de fingir […]
Tengo que iniciar una gran cantidad de cálculos, y tengo que guardar un texto de archivo 2D cada vez, por lo que me gustaría almacenar los resultados en “tiempo real” como un archivo de texto 3D con cada segmento correspondiente a un resultado de cálculo. El primer cálculo está bien, pero cuando hago el segundo […]