Articles of cuda

Multiproceso Python con PyCUDA

Tengo un problema que quiero dividir en varios dispositivos CUDA, pero sospecho que la architecture actual de mi sistema me está frenando; Lo que he configurado es una clase de GPU, con funciones que realizan operaciones en la GPU (extraño que). Estas operaciones son del estilo. for iteration in range(maxval): result[iteration]=gpuinstance.gpufunction(arguments,iteration) Me había imaginado que […]

Iterando a través de un array 2D en PyCUDA

Estoy intentando iterar a través de una matriz 2D en PyCUDA pero termino con valores de matriz repetidos. Inicialmente lanzo una pequeña matriz de enteros aleatorios y funciona como se esperaba, pero cuando le lanzo una imagen, veo los mismos valores una y otra vez. Aqui esta mi codigo img = np.random.randint(20, size = (4,5)) […]

pynvrtc en Google Colab: libnvrtc.so no se encuentra

En un cuaderno de Google Colab, estoy instalando un paquete de python que usa pynvrtc para comstackr algunos códigos CUDA. Me salió el error OSError: libnvrtc.so: cannot open shared object file: No such file or directory Corro !find / -name ‘libnvrtc.*’ Y obtengo /usr/lib/x86_64-linux-gnu/libnvrtc.so.8.0.61 /usr/lib/x86_64-linux-gnu/libnvrtc.so.8.0 Mi pregunta es: ¿Debo tener libnvrtc.so en mi sistema Google […]

NumbaPro en dispositivo Cuda sobre conexión ssh

Estoy usando Python / NumbaPro para usar mi GPU compatible con CUDA en un cuadro de Windows. Utilizo Cygwin como shell y desde una consola cygwin no tengo problemas para encontrar mi dispositivo CUDA. Pruebo con el simple comando numbapro.check_cuda() Pero cuando estoy conectado al cuadro a través de OpenSSH (como parte de mi configuración […]

Interpretación de “demasiados recursos para lanzar”

Considere el siguiente código de Python: from numpy import float64 from pycuda import compiler, gpuarray import pycuda.autoinit # N > 960 is crucial! N = 961 code = “”” __global__ void kern(double *v) { double a = v[0]*v[2]; double lmax = fmax(0.0, a), lmin = fmax(0.0, -a); double smax = sqrt(lmax), smin = sqrt(lmin); if(smax […]

pycuda; nvcc fatal: No se pudo encontrar el archivo de configuración de Visual Studio ‘(null)’

Estoy intentando ejecutar el tutorial introductorio de pycuda después de instalar Visual C ++ Express 2010 y todo tipo de controladores Nvidia, SDK, etc. Llego a mod = SourceModule(“”” __global__ void doublify(float *a) { int idx = threadIdx.x + threadIdx.y*4; a[idx] *= 2; } “””) sin errores. Pero esta llamada en IPython cede. CompileError: nvcc […]

La función getrs de cuSolver sobre pycuda no funciona correctamente

Estoy tratando de hacer una envoltura de pycuda inspirada en la biblioteca scikits-cuda para algunas operaciones proporcionadas en la nueva biblioteca cuSolver de Nvidia. Quiero resolver un sistema lineal de la forma AX = B por factorización de LU, para hacer eso primero use el método cublasSgetrfBatched de scikits-cuda, que me da la LU de […]

¿Qué puedo hacer contra ‘La versión del controlador CUDA es insuficiente para la versión en tiempo de ejecución CUDA’?

Cuando voy a /usr/local/cuda/samples/1_Utilities/deviceQuery y ejecuto moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make clean rm -f deviceQuery deviceQuery.o rm -rf ../../bin/x86_64/linux/release/deviceQuery moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make “/usr/local/cuda-7.0″/bin/nvcc -ccbin g++ -I../../common/inc -m64 -gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 -gencode arch=compute_50,code=sm_50 -gencode arch=compute_52,code=sm_52 -gencode arch=compute_52,code=compute_52 -o deviceQuery.o -c deviceQuery.cpp “/usr/local/cuda-7.0″/bin/nvcc -ccbin g++ -m64 -gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30 […]

tratando de instalar pycuda, obteniendo un error zip?

Windows 10, Python 2.7 64 bit Hola, siguiendo una guía para este paso: pip install pipwin pipwin install pycuda me da esas opciones Package `pycuda` found in cache Choose version to download. [0] : 2014.1+cuda6514 [1] : 2015.1.3+cuda7518 No importa lo que elija, recibo el siguiente error (última línea): File “c:\users\skpok\anaconda2\lib\zipfile.py”, line 811, in _RealGetContents […]

Error de importación de tensorflow

Estoy tratando de instalar tensorflow que soporta GPU. Probé la información en el siguiente enlace. https://www.tensorflow.org/install/install_windows CUDA® Toolkit 8.0 cuDNN v6.0 Tarjeta de GPU con capacidad de cálculo de CUDA 3.0 – GeForce 940MX Luego usé pip3 install –upgrade tensorflow-gpu para instalar tensorflow. Pero me aparece el siguiente error al intentar importar tensorflow. Traceback (most […]