error: el código en la columna numérica de pandas se rompe con un error de formato de cadena

Estoy leyendo en una tabla con pandas , y una de las columnas tiene fechas en el formato YYYYMMMDD. Se lee como una columna numérica en todos mis bashs hasta ahora.

Podría digerirlo correctamente (aunque lentamente) primero con código torpe, pero luego la versión actual tiene un problema que no entiendo.

Entonces, esto funcionó:

 treatments['month'] = treatments['INDATUMA'] % 10000 treatments['day'] = treatments['INDATUMA'] % 100 treatments['month'] = (treatments['month']-treatments['day'])/100 

(Aunque esto se ejecutó por última vez en marcos de datos más pequeños, la versión actual se ejecutó en la concatenación de todos ellos. En datos de prueba más pequeños, el código aún funciona bien y se interrumpe en todos los datos).

Esto se rompe:

 all_treatments['month'] = all_treatments.INDATUMA % 10000 // 100 

Este es el mensaje de error:

 File "treatments2_noiopro.py", line 92, in  all_treatments['month'] = all_treatments.INDATUMA % 10000 // 100 File "/home/seidav/anaconda/lib/python2.7/site-packages/pandas/core/ops.py", line 532, in wrapper return left._constructor(wrap_results(na_op(lvalues, rvalues)), File "/home/seidav/anaconda/lib/python2.7/site-packages/pandas/core/ops.py", line 479, in na_op result[mask] = op(x[mask], y) TypeError: not all arguments converted during string formatting 

Estoy usando las versiones pandas 0.16.2 np19py26_0 y python 2.7.10 0 bajo Linux.

Creo que la forma más fácil de hacer esto es usar la funcionalidad de fecha y hora nativa de pandas en el dataframe concatenado final, por ejemplo

 treatments['date'] = pandas.to_datetime(treatments['INDATUMA']) #Now you can split up the date easy as pie treatments['year'] = treatments['date'].dt.year treatments['month'] = treatments['date'].dt.month treatments['day'] = treatments['date'].dt.day 

ACTUALIZADO