error con snappy al importar fastparquet en python

He instalado los siguientes módulos instalados en mi servidor EC2 que ya tiene python (3.6) y anaconda instalados:

  • rápido
  • pyarrow
  • s3fs
  • parquet rápido

excepto fastparquet todo lo demás funciona en la importación. Cuando bash importar fastparquet, se produce el siguiente error:

[username@ip8 ~]$ conda -V conda 4.2.13 [username@ip-~]$ python Python 3.6.0 |Anaconda custom (64-bit)| (default, Dec 23 2016, 12:22:00) [GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux Type "help", "copyright", "credits" or "license" for more information. import fastparquet Traceback (most recent call last): File "", line 1, in  File "/home/username/anaconda3/lib/python3.6/site-packages/fastparquet/__init__.py", line 15, in  from .core import read_thrift File "/home/username/anaconda3/lib/python3.6/site-packages/fastparquet/core.py", line 11, in  from .compression import decompress_data File "/home/username/anaconda3/lib/python3.6/site-packages/fastparquet/compression.py", line 43, in  compressions['SNAPPY'] = snappy.compress AttributeError: module 'snappy' has no attribute 'compress' 

¿Cómo hago para arreglar esto?

Desafortunadamente, hay muchas cosas en python-land llamadas “snappy”. Creo que puede tener el incorrecto, en cuyo caso uno de los siguientes comandos de Conda debería resolver esto por usted:

 conda install python-snappy 

o

 conda install python-snappy -c conda-forge 

donde este último es un poco más reciente (libera la GIL que puede ser importante en aplicaciones de subprocesos).