Articles of clasificando

Pandas multi index DataFrame: conserva las N entradas más grandes de una columna mientras agrupas en el índice de nivel 1

Este es un ejemplo de dataframe con múltiples filas de índice. row_idx_arr = list(zip([‘r0’, ‘r0’, ‘r0’, ‘r1’, ‘r1’, ‘r1’, ‘r2’, ‘r2’, ‘r2’, ‘r3’, ‘r3’, ‘r3’], [‘r-00’, ‘r-01’, ‘r-02’, ‘r-00’, ‘r-01’, ‘r-02’, ‘r-00’, ‘r-01’, ‘r-02’, ‘r-00’, ‘r-01’, ‘r-02’, ])) row_idx = pd.MultiIndex.from_tuples(row_idx_arr) d = pd.DataFrame((np.random.randn(36)*10).reshape(12,3), index=row_idx, columns=[‘c0’, ‘c1’, ‘returns’]) c0 c1 returns r0 r-00 3.553446 5.434018 […]

Criterios de clasificación avanzados para una lista de tuplas anidadas

Tengo una lista de tuplas anidadas de la forma: [(a, (b, c)), …] Ahora me gustaría elegir el elemento que maximiza un tiempo minimizando b y c al mismo tiempo. Por ejemplo en [(7, (5, 1)), (7, (4, 1)), (6, (3, 1))] el ganador debe ser (7, (4, 1)) Cualquier ayuda es apreciada.

clasificación por una lista personalizada en pandas

Después de leer: http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.sort.html Todavía no puedo encontrar la manera de ordenar una columna por una lista personalizada. Obviamente, el orden predeterminado es alfabético. Voy a dar un ejemplo. Aquí está mi dataframe (muy abreviado): Player Year Age Tm G 2967 Cedric Hunter 1991 27 CHH 6 5335 Maurice Baker 2004 25 VAN 7 13950 […]

¿Cómo puedo ordenar las particiones definidas por una columna pero dejar las particiones donde están?

Considere el df dataframe df = pd.DataFrame(dict( A=list(‘XXYYXXYY’), B=range(8, 0, -1) )) print(df) AB 0 X 8 1 X 7 2 Y 6 3 Y 5 4 X 4 5 X 3 6 Y 2 7 Y 1 Con el grupo ‘X’ definido por la columna ‘A’ , quiero ordenar [8, 7, 4, 3] al […]

Clasificación en matriz dispersa

Tengo una matriz dispersa. Necesito ordenar esta matriz fila por fila y crear otra matriz [dispersa]. El código puede explicarlo mejor: # for `rand` function, you need newer version of scipy. from scipy.sparse import * m = rand(6,6, density=0.6) d = m.getrow(0) print d Salida1 (0, 5) 0.874881629788 (0, 4) 0.352559852239 (0, 2) 0.504791645463 (0, […]

Clasificación personalizada con pandas

Tengo el siguiente dataframe que me gustaría ordenar primero por Criticality y luego por Nombre: Name Criticality baz High foo Critical baz Low foo Medium bar High bar Low bar Medium … He estado tratando de hacer esto usando la respuesta provista en esta publicación, pero simplemente no puedo hacer que funcione. El resultado final […]

Python clasifica tuple por diferentes criterios

Tengo una lista a = [(1,’a’), (1,’b’), (2,’c’)] , y quiero obtener esta lista: [(2,’c’), (1,’a’), (1,’b’)] Si hago esto: sorted(a, reverse=True) Solo puedo conseguir: [(2,’c’), (1,’b’), (1,’a’)] ¿Cómo puedo obtener la lista que quiero?

¿Cómo ordenar las listas anidadas en listas separadas con valores únicos en python?

Tengo dos variables: unique_val = [1,2,3] nested_list = [[‘name1’,1],[‘name2’,1],[‘name3’,3],[‘name4’,2],[‘name5’,2],[‘name6’,3]] Básicamente quiero listas separadas de los nombres en cada valor único. Luché para armar un conjunto de bucles nesteds en vano. Idealmente la salida sería algo como esto: list_1 = [‘name1′,’name2’] list_2 = [‘name4′,’name5’] list_3 = [‘name3′,name6’]

Ordenar una lista de tuplas en función de dos elementos

Posible duplicado: Python: cómo ordenar una lista compleja en dos claves diferentes Tengo una lista de tuplas. Quiero ordenarlos según dos elementos. Aquí está el siguiente ejemplo unsorted = [(‘a’, 4, 2), (‘a’, 4, 3), (‘a’, 7, 2), (‘a’, 7, 3), (‘b’, 4, 2), (‘b’, 4, 3), (‘b’, 7, 2), (‘b’, 7, 3)] sorted = […]

¿Cómo ordenar el dataframe de pandas usando valores de varias columnas?

Tengo el siguiente dataframe: df = pandas.DataFrame([{‘c1′:3,’c2’:10},{‘c1’:2, ‘c2’:30},{‘c1′:1,’c2’:20},{‘c1′:2,’c2’:15},{‘c1′:2,’c2’:100}]) O, en forma legible para humanos: c1 c2 0 3 10 1 2 30 2 1 20 3 2 15 4 2 100 El siguiente comando de clasificación funciona como se espera: df.sort([‘c1′,’c2’], ascending=False) Salida: c1 c2 0 3 10 4 2 100 1 2 30 3 […]