La reindexación de pandas solo es válida con objetos de índice de valor único

Se instaló la última versión de pandas 0.9.0 en caso de que esto fuera un error. EDIT: se olvidó de mencionar esto es Python 2.7. Tratando de leer el archivo de Excel. Esa parte parece estar bien. Originalmente, estaba probando iteritems () para cada fila del dataframe de pandas, ya que la id_company debía verificarse con una base de datos mysql (código no incluido). Mensaje de error igual / similar para ponerlo en una tupla (el código está debajo). El mensaje de error sigue.

Tenga en cuenta que hay un .reindex () pero tampoco funcionó antes. El reindexar () fue una especie de mariquita.

Como solución temporal, es probable que simplemente importe desde mi sql de destino y haga una unión. Estoy preocupado por el tamaño de los conjuntos de datos.

import pandas as pd def runNow(): #identify sheet source = 'C:\Users\jlalonde\Desktop\startup_geno\startupgenome_w_id_xl_20121109.xlsx' xls_file = pd.ExcelFile(source) sd = xls_file.parse('Sheet1') source_u = sd.drop_duplicates(cols = 'id_company', take_last=False) source_r = source_u[['id_company','id_good','description', 'website','keyword', 'company_name','founded_month', 'founded_year', 'description']] source_i = source_r.reindex() #hail mary tup_r = [tuple(x) for x in source_i.values] 

Aquí está el error:

 Traceback (most recent call last): File "", line 1, in  sg_sql_2.runNow() File "sg_sql_2.py", line 31, in runNow tup_r = [tuple(x) for x in source_r.values] File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1443, in as_matrix return self._data.as_matrix(columns).T File "C:\Python27\lib\site-packages\pandas\core\internals.py", line 723, in as_matrix mat = self._interleave(self.items) File "C:\Python27\lib\site-packages\pandas\core\internals.py", line 743, in _interleave indexer = items.get_indexer(block.items) File "C:\Python27\lib\site-packages\pandas\core\index.py", line 748, in get_indexer raise Exception('Reindexing only valid with uniquely valued Index ' Exception: Reindexing only valid with uniquely valued Index objects 

Entonces, después de golpear mi cabeza contra la pared en la mayor parte del día, ¿puede alguien decirme si esto es un error o si me falta algo realmente obvio?

Se corrigió el error subyacente hoy en GitHub: https://github.com/pydata/pandas/issues/2236