Leyendo un archivo .arff e intentando ignorar el encabezado

Soy nuevo en Python y necesito ayuda con mi código. Estoy leyendo un Arff con mi cuaderno jupyter usando pyhton2.7. Me gustaría saber qué argumento necesito poner en arff.lodarff, u otra forma de hacerlo, así puedo ignorar el encabezado de mis datos.

rain,meta = arff.loadarff(open('train.arff', 'r')) 

Después de leer el archivo, estoy haciendo algunas operaciones matemáticas y obtuve este error.

Espero que alguien me pueda ayudar a averiguar.

 train,meta = arff.loadarff(open('train.arff', 'r')) train = pd.DataFrame(train) print(train) --------------------------------------------------------------------------- ValueError Traceback (most recent call last)  in () ----> 1 ne = getNeighbors(X_train, y_train, X_test, k = 3) 2 print(ne)  in getNeighbors(X_train, y_train, X_test, k) 6 for (trainpoint,y_train_label) in zip(X_train,y_train): 7 # calculate the distance and append it to a distances_label with the associated label. ----> 8 distances_label.append((distance(testpoint, trainpoint), y_train_label)) 9 k_neighbors_with_labels += [sorted(distances_label)[0:k]] # sort the distances and taken the first k neighbors 10 return k_neighbors_with_labels  in distance(testpoint, trainpoint) 2 def distance(testpoint, trainpoint): 3 # distance between testpoint and trainpoint. ----> 4 dist = np.sqrt(np.sum(np.power(float(testpoint)-float(trainpoint), 2))) 5 return dis 6 ValueError: could not convert string to float: sepal_length 

Usted asume que el punto de testpoint es una matriz en su función de distancia.

Pero ¿y si no lo es?

Estás utilizando marcos de datos de pandas, estos no son solo arreglos, y es por eso que obtienes nombres de columnas.