Articles of cuda

Cómo realizar la inversión de la matriz de PyCUDA 4×4 con la misma precisión que la función numpy linalg “inv” o “pinv”

Estoy enfrentando un problema de precisión sobre mi código que realiza un número (128, 256, 512) de inversiones de matriz 4×4. Cuando uso la versión original, es decir, la función np.linalg.inv o np.linalg.pinv , todo funciona bien. Desafortunadamente, con el código CUDA a continuación, obtengo los valores nan e inf en la matriz invertida. Para […]

Numba.vectorize para CUDA: ¿Cuál es la firma correcta para devolver arrays?

Tengo una función de la siguiente estructura, @numba.jit(nopython = True) def foo(X,N): ”’ :param X: 1D numpy array :param N: Integer :rtype: 2D numpy array of shape len(X) x N ”’ out = np.ones((len(X),N)) out[:,0] = X for i in range(1,N): out[:,i] = X**i+out[:,i-1] return out que ahora estoy tratando de ejecutar en mi GPU. […]

¿Cómo perfilar el código de PyCuda con el Visual Profiler?

Cuando creo una nueva sesión y le digo al Visual Profiler que inicie mis scripts de python / pycuda, recibo el siguiente mensaje de error: Execution run #1 of program ” failed, exit code: 255 Estas son mis preferencias: Lanzamiento: python “/pathtopycudafile/mysuperkernel.py” Directorio de trabajo: “/pathtopycudafile/mysuperkernel.py” Argumentos: [empty] Yo uso CUDA 4.0 bajo Ubuntu 10.10. […]

Progtwigción GPU Python

Actualmente estoy trabajando en un proyecto en Python, y me gustaría hacer uso de la GPU para algunos cálculos. A primera vista parece que hay muchas herramientas disponibles; A segunda vista, siento que me estoy perdiendo algo. Copperhead luce increíble pero aún no ha sido lanzado. Parece que estoy limitado a escribir kernels CUDA o […]

Instalando theano en Windows 8 con GPU habilitada

Entiendo que el soporte de Theano para Windows 8.1 está solo en fase experimental, pero me pregunto si alguien tuvo suerte con la resolución de mis problemas. Dependiendo de mi configuración, obtengo tres tipos distintos de errores. Supongo que la resolución de cualquiera de mis errores resolvería mi problema. He instalado Python utilizando el sistema […]

TensorFlow: libcudart.so.7.5: no se puede abrir el archivo de objeto compartido: no existe tal archivo o directorio

Estoy ejecutando TensorFlow en Ubuntu 15.10. Cuando entro en pip show tensorflow , veo que TF se ha instalado correctamente. Sin embargo, cuando escribo import tensorflow as tf , import tensorflow as tf el siguiente mensaje de error: Traceback (most recent call last): File “”, line 1, in File “/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/__init__.py”, line 23, in from tensorflow.python […]

¿Por qué no puedo obtener la sum correcta de la matriz 1D con numba (cuda python)?

Intento usar cuda python con numba. El código es calcular la sum de una matriz 1D de la siguiente manera, pero no sé cómo obtener un resultado de valor en lugar de tres valores. python3.5 con numba + CUDA8.0 import os,sys,time import pandas as pd import numpy as np from numba import cuda, float32 os.environ[‘NUMBAPRO_NVVM’]=r’D:\NVIDIA […]