Actualización de pandas a la versión 0.19 en Azure ML Studio

Realmente me gustaría obtener acceso a algunas de las funciones actualizadas en pandas 0.19, pero el estudio Azure ML utiliza pandas 0.18 como parte del paquete Anaconda 4.0. ¿Hay alguna manera de actualizar la versión que se usa dentro de los componentes de “Ejecutar script de Python”?

Le ofrezco los siguientes pasos para que muestre cómo actualizar la versión de la biblioteca de pandas en Execute Python Script .

Paso 1 : use el componente virtualenv para crear un entorno de tiempo de ejecución Python independiente en su sistema. Instálelo primero con el comando pip install virtualenv si no lo tiene.

Si lo instaló con éxito, podría verlo en su archivo python / Scripts.

introduzca la descripción de la imagen aquí

Paso 2 : Ejecuta el comando para crear un entorno de tiempo de ejecución Python independiente.

introduzca la descripción de la imagen aquí

Paso 3 : Luego vaya a la carpeta Scripts del directorio creado y actívelo (este paso es importante, no se lo pierda)

No cierre esta ventana de comandos y use pip install pandas==0.19 para descargar bibliotecas externas en esta ventana de comandos.

introduzca la descripción de la imagen aquí

Paso 4 : Comprima todos los archivos en la carpeta Lib / site-packages en un paquete zip (lo llamo pandas – paquete aquí)

introduzca la descripción de la imagen aquí

Paso 5 : Cargue el paquete zip en el DataSet de Azure Machine Learning WorkSpace.

introduzca la descripción de la imagen aquí

pasos específicos por favor refiérase a las Notas Técnicas .

Después del éxito, verá el paquete cargado en la lista de DataSet

introduzca la descripción de la imagen aquí

Paso 6 : Antes de la definición del método azureml_main en el módulo Execute Python Script, debe eliminar los módulos de pandas antiguos y sus dependencias, y luego volver a importarlos, como se azureml_main en el siguiente código.

 import sys import pandas as pd print(pd.__version__) del sys.modules['pandas'] del sys.modules['numpy'] del sys.modules['pytz'] del sys.modules['six'] del sys.modules['dateutil'] sys.path.insert(0, '.\\Script Bundle') for td in [m for m in sys.modules if m.startswith('pandas.') or m.startswith('numpy.') or m.startswith('pytz.') or m.startswith('dateutil.') or m.startswith('six.')]: del sys.modules[td] import pandas as pd print(pd.__version__) # The entry point function can contain up to two input arguments: # Param: a pandas.DataFrame # Param: a pandas.DataFrame def azureml_main(dataframe1 = None, dataframe2 = None): 

Luego puede ver el resultado de los registros como se muestra a continuación, primero imprima la versión anterior 0.14.0 , luego imprima la nueva versión 0.19.0 del archivo zip cargado.

 [Information] 0.14.0 [Information] 0.19.0 

También puede referirse a estos hilos: acceda al archivo blob utilizando la marca de tiempo en Azure y vuelva a cargar con restablecer .

Espero que te ayude.

Azure Machine Learning Workbench permite una mayor flexibilidad al configurar entornos con Docker. Me mudé a usar esa herramienta.