p-ajuste de valor Mann-Whitney U prueba en python

Tengo un archivo de lista bidimensional (nombre – ‘hcl_file’). Una versión abreviada del archivo para mayor claridad. Observaciones verticales, número de experimento horizontal:

ID type First Second Third

 gerg I 0.02695 0 0.00135 0.31312 11P I 0.02695 0 0.00135 0.31312 112HP II 0.02695 0 0.00135 0.31312 1454HP II 0.02695 0 0.00135 0.31312 11544H III 0.02695 0 0.00135 0.31312 657BF III 0.02695 0 0.00135 0.31312 785DS III 0.02695 0 0.00135 0.31312 

Soy nuevo en la progtwigción. ¿Podría decirme cómo puedo calcular el significado de las diferencias entre los tipos I, II, III y luego hacer un ajuste de BH (Bennamini y Hochbberg)? Para evitar malentendidos, permítanme aclarar que estamos realizando un experimento para diferentes grupos (I, II, III) y encontrar el valor p para ellos, pero luego lo repetimos para otros datos que requieren un ajuste del valor p para comparaciones múltiples . Tengo dificultades para hacer esto en un ciclo, por favor avise la dirección de más movimiento. Mi guion:

para línea en hcl_file:

  substrings = (len(line)) 

mientras j <subcadenas:

 k1 = [] # list of values in I-st group k2 = [] II k3 = [] III for line in hcl_file: if line[1] == 'I': v1 = float(line[j]) k1.append(v1) elif line[1] == 'II': v2 = float(line[j]) k2.append(v2) elif line[1] == 'III': v3 = float(line[j]) k3.append(v3) import pandas from scipy.stats import mannwhitneyu print(mannwhitneyu(k1, k2)) j += 1 

Si vas a usar pandas, usa pandas para cargar los datos también.

 import pandas from scipy.stats import mannwhitneyu hcl_data = pandas.read_table(hcl_file, sep="\t") print(mannwhitneyu(hcl_data.loc[hcl_data['type'] == "II"], hcl_data.loc[hcl_data['type'] == "III"])) 

No estoy completamente seguro de qué columnas está intentando probar, por lo que no puedo ser más específico. Es posible que deba aplanar los datos antes de pasarlos a Scipy.