Articles of datos de

Usando reemplazar eficientemente en pandas

Estoy buscando usar la función de replace de una manera eficiente en python3. El código que tengo es lograr la tarea, pero es demasiado lento, ya que estoy trabajando con un gran conjunto de datos. Por lo tanto, mi prioridad es la eficiencia sobre la elegancia siempre que haya una compensación. Aquí hay un juguete […]

El almacén de datos de Appengine no actualiza varios registros

votergroup = db.GqlQuery(“SELECT * FROM Voter WHERE lastname = :1”, ‘AGEE’) for voter in votergroup: voter.email = ‘testemail@testemail.com’ db.put(votergroup) El código anterior no parece estar actualizando los registros como se muestra en la documentación de la aplicación. También traté de usar un objeto de consulta en vano. Sé que Votergroup está obteniendo registros, porque hice […]

Python – Folium Choropleth Map – colores incorrectos

Mi problema es que los suburbios no muestran el color correcto en el mapa de Folium. Por ejemplo, Dandenong y Frankston deben estar sombreados con el color más oscuro, ya que tienen la cuenta más alta en el dataframe, pero están sombreados con un color más claro. En el dataframe faltan algunos suburbios. Esos suburbios […]

Descargar Kaggle Dataset utilizando Python

He intentado descargar el kaggle dataset de kaggle dataset mediante el uso de Python. Sin embargo, me enfrenté a problemas mediante el uso del método de request y los archivos .csv de salida descargados son archivos html dañados. import requests # The direct link to the Kaggle data set data_url = ‘https://www.kaggle.com/crawford/gene-expression/downloads/actual.csv’ # The local […]

Creando df para generar json en el formato dado.

Estoy tratando de generar un df para producir esto por debajo de json. Datos de Json: { “name”: “flare”, “children”: [ { “name”: “K1”, “children”: [ {“name”: “Exact”, “size”: 4}, {“name”: “synonyms”, “size”: 14} ] }, { “name”: “K2”, “children”: [ {“name”: “Exact”, “size”: 10}, {“name”: “synonyms”, “size”: 20} ] }, { “name”: “K3”, “children”: […]

Obtención del último valor no nata entre filas en un dataframe de pandas

Tengo un dataframe de forma (40.500). Cada fila en el dataframe tiene algunos valores numéricos hasta el número de columna variable k, y todas las entradas después de eso son nan. Estoy tratando de obtener el valor de la última columna no nan en cada fila. ¿Hay alguna manera de hacer esto sin recorrer todas […]

Actualización de un gran número de entidades en un almacén de datos en Google App Engine

Me gustaría realizar una pequeña operación en todas las entidades de un tipo específico y reescribirlas en el almacén de datos. Actualmente tengo 20,000 entidades de este tipo, pero me gustaría una solución que se escalaría a cualquier monto. ¿Cuáles son mis opciones?

Analizar una cadena que representa una lista de tuplas

Tengo cuerdas que se parecen a esta: “(8, 12.25), (13, 15), (16.75, 18.5)” y me gustaría convertir cada uno de ellos en una estructura de datos de python. Preferiblemente una lista (o tupla) de tuplas que contienen un par de valores flotantes. Podría hacer eso con eval(“(8, 12.25), (13, 15), (16.75, 18.5)”) que me da […]

Pandas – Eliminar filas basadas en combinaciones de valores de NaN

Tengo un dataframe que se parece a esto: NUM ABCDEF p1 NaN -1.183 NaN NaN NaN 1.829711 p5 NaN NaN NaN NaN 1.267 -1.552721 p9 1.138 NaN NaN -1.179 NaN 1.227306 Siempre hay un valor no NaN en: columna F y al menos otra columna AE. Quiero crear una sub-tabla que contenga solo aquellas filas […]

: ¿Cómo puedo obtener statsmodel para devolver el valor de p de un objeto OLS?

Soy bastante nuevo en progtwigción y me lanzo a python para familiarizarme con el análisis de datos y el aprendizaje automático. Estoy siguiendo un tutorial sobre la eliminación hacia atrás para una regresión lineal múltiple. Aquí está el código ahora mismo: # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas […]