Articles of por

Agrupe objetos de fecha arbitrarios que estén dentro de un rango de tiempo entre sí

Quiero dividir el calendario en intervalos de dos semanas a partir de 2008-May-5 , o cualquier punto de partida arbitrario. Así que empiezo con varios objetos de fecha: import datetime as DT raw = (“2010-08-01”, “2010-06-25”, “2010-07-01”, “2010-07-08”) transactions = [(DT.datetime.strptime(datestring, “%Y-%m-%d”).date(), “Some data here”) for datestring in raw] transactions.sort() Al analizar manualmente las fechas, […]

¿Cómo contar valores distintos en una columna de un grupo de pandas por objeto?

Tengo un dataframe de pandas y lo col2 por dos columnas (por ejemplo, col1 y col2 ). Para valores fijos de col1 y col2 (es decir, para un grupo) puedo tener varios valores diferentes en col3 . Me gustaría contar el número de valores distintos de las terceras columnas. Por ejemplo, si tengo esto como […]

Pandas groupby y qcut

¿Hay alguna forma de estructurar los comandos Pandby groupby y qcut para devolver una columna que tenga mosaicos nesteds? Específicamente, suponga que tengo 2 grupos de datos y quiero que se aplique qcut a cada grupo y luego devuelva la salida a una columna. Esto sería similar al comando ntile () de MS SQL Server […]

TensorFlow Sigmoid Cross Entropy con Logits para datos 1D

Contexto Supongamos que tenemos algunos datos 1D (por ejemplo, series de tiempo), donde todas las series tienen una longitud fija l : # [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11] index example = [ 0, 1, 1, 0, 23, 22, 20, 14, 9, 2, 0, 0] # l = […]

Obtener la identificación del grupo de nuevo en el dataframe de pandas

Para el dataframe In [2]: df = pd.DataFrame({‘Name’: [‘foo’, ‘bar’] * 3, …: ‘Rank’: np.random.randint(0,3,6), …: ‘Val’: np.random.rand(6)}) …: df Out[2]: Name Rank Val 0 foo 0 0.299397 1 bar 0 0.909228 2 foo 0 0.517700 3 bar 0 0.929863 4 foo 1 0.209324 5 bar 2 0.381515 Estoy interesado en agrupar por nombre y […]

Iterando sobre grupos en un dataframe

El problema que tengo es que quiero agrupar el dataframe y luego usar funciones para manipular los datos después de que se hayan agrupado. Por ejemplo, quiero agrupar los datos por Fecha y luego iterar a través de cada fila en los grupos de fechas para analizar una función. El problema es que Groupby parece […]

Pandas groupby diff

Así que mi dataframe se ve así: from pandas.compat import StringIO d = StringIO(”’ date,site,country,score 2018-01-01,google,us,100 2018-01-01,google,ch,50 2018-01-02,google,us,70 2018-01-03,google,us,60 2018-01-02,google,ch,10 2018-01-01,fb,us,50 2018-01-02,fb,us,55 2018-01-03,fb,us,100 2018-01-01,fb,es,100 2018-01-02,fb,gb,100 ”’) df = pd.read_csv(d, sep=”,”) Cada sitio tiene una puntuación diferente dependiendo del país. Estoy tratando de encontrar la diferencia de puntuación de 1/3/5 día para cada combinación de sitio […]

Filtro de dataframe después de groupby y nunique en pandas

df.groupby(“item”)[“variable”].nunique() y devuelve un conteo único de cada objeto de item. quiero filtrar para devolver solo el recuento de “variable”> 3 condicional en el elemento Groupby … ¿hay un método?

Pandas – cuenta valores distintos por columna

Tengo un dataframe que se ve así: Id ActivityId ActivityCode 1 2 3 1 2 4 1 3 2 Necesito obtener un recuento de los distintos ID de actividad con los que está relacionado el ID. En el ejemplo anterior, el ID 1 devolvería 2 ya que hay 2 ID de actividad distintos para ese […]

Grupo de pandas por sum más grande

Estoy tratando de usar las groupby , nlargest y sum en Pandas juntos, pero tengo problemas para hacer que funcione. State County Population Alabama a 100 Alabama b 50 Alabama c 40 Alabama d 5 Alabama e 1 … Wyoming a.51 180 Wyoming b.51 150 Wyoming c.51 56 Wyoming d.51 5 Quiero usar groupby para […]