Articles of cuda

Cuda: biblioteca nvvm no encontrada

Estoy intentando ejecutar el siguiente código, pero se informa de un error: NvvmSupportError: libNVVM no se puede encontrar. conda install cudatoolkit : library nvvm no encontrado Mi entorno de desarrollo es: Ubuntu 17.04, Spyder / Python3.5 y lo he instalado a través de conda (numba y cudatoolkit). GPU Nvidia (GTX 1070 y GTX 1060). import […]

PyCuda / Multiprocessing Issue en OS X 10.8

Estoy trabajando en un proyecto en el que distribuyo tareas de proceso a varios procesos de Python, cada uno asociado a su propio dispositivo CUDA. Al generar los subprocesos, uso el siguiente código: import pycuda.driver as cuda class ComputeServer(object): def _init_workers(self): self.workers = [] cuda.init() for device_id in range(cuda.Device.count()): print “initializing device {}”.format(device_id) worker = […]

Multiproceso Python con PyCUDA

Tengo un problema que quiero dividir en varios dispositivos CUDA, pero sospecho que la architecture actual de mi sistema me está frenando; Lo que he configurado es una clase de GPU, con funciones que realizan operaciones en la GPU (extraño que). Estas operaciones son del estilo. for iteration in range(maxval): result[iteration]=gpuinstance.gpufunction(arguments,iteration) Me había imaginado que […]

Iterando a través de un array 2D en PyCUDA

Estoy intentando iterar a través de una matriz 2D en PyCUDA pero termino con valores de matriz repetidos. Inicialmente lanzo una pequeña matriz de enteros aleatorios y funciona como se esperaba, pero cuando le lanzo una imagen, veo los mismos valores una y otra vez. Aqui esta mi codigo img = np.random.randint(20, size = (4,5)) […]

pynvrtc en Google Colab: libnvrtc.so no se encuentra

En un cuaderno de Google Colab, estoy instalando un paquete de python que usa pynvrtc para comstackr algunos códigos CUDA. Me salió el error OSError: libnvrtc.so: cannot open shared object file: No such file or directory Corro !find / -name ‘libnvrtc.*’ Y obtengo /usr/lib/x86_64-linux-gnu/libnvrtc.so.8.0.61 /usr/lib/x86_64-linux-gnu/libnvrtc.so.8.0 Mi pregunta es: ¿Debo tener libnvrtc.so en mi sistema Google […]

NumbaPro en dispositivo Cuda sobre conexión ssh

Estoy usando Python / NumbaPro para usar mi GPU compatible con CUDA en un cuadro de Windows. Utilizo Cygwin como shell y desde una consola cygwin no tengo problemas para encontrar mi dispositivo CUDA. Pruebo con el simple comando numbapro.check_cuda() Pero cuando estoy conectado al cuadro a través de OpenSSH (como parte de mi configuración […]

Interpretación de “demasiados recursos para lanzar”

Considere el siguiente código de Python: from numpy import float64 from pycuda import compiler, gpuarray import pycuda.autoinit # N > 960 is crucial! N = 961 code = “”” __global__ void kern(double *v) { double a = v[0]*v[2]; double lmax = fmax(0.0, a), lmin = fmax(0.0, -a); double smax = sqrt(lmax), smin = sqrt(lmin); if(smax […]

pycuda; nvcc fatal: No se pudo encontrar el archivo de configuración de Visual Studio ‘(null)’

Estoy intentando ejecutar el tutorial introductorio de pycuda después de instalar Visual C ++ Express 2010 y todo tipo de controladores Nvidia, SDK, etc. Llego a mod = SourceModule(“”” __global__ void doublify(float *a) { int idx = threadIdx.x + threadIdx.y*4; a[idx] *= 2; } “””) sin errores. Pero esta llamada en IPython cede. CompileError: nvcc […]

La función getrs de cuSolver sobre pycuda no funciona correctamente

Estoy tratando de hacer una envoltura de pycuda inspirada en la biblioteca scikits-cuda para algunas operaciones proporcionadas en la nueva biblioteca cuSolver de Nvidia. Quiero resolver un sistema lineal de la forma AX = B por factorización de LU, para hacer eso primero use el método cublasSgetrfBatched de scikits-cuda, que me da la LU de […]

¿Qué puedo hacer contra ‘La versión del controlador CUDA es insuficiente para la versión en tiempo de ejecución CUDA’?

Cuando voy a /usr/local/cuda/samples/1_Utilities/deviceQuery y ejecuto moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make clean rm -f deviceQuery deviceQuery.o rm -rf ../../bin/x86_64/linux/release/deviceQuery moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make “/usr/local/cuda-7.0″/bin/nvcc -ccbin g++ -I../../common/inc -m64 -gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 -gencode arch=compute_50,code=sm_50 -gencode arch=compute_52,code=sm_52 -gencode arch=compute_52,code=compute_52 -o deviceQuery.o -c deviceQuery.cpp “/usr/local/cuda-7.0″/bin/nvcc -ccbin g++ -m64 -gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30 […]