Articles of nan

Eliminar una tupla que contiene nan en la lista de tuplas – Python

Tengo una larga lista de tuplas y quiero eliminar cualquier tupla que tenga un nan en Python. Lo que tengo actualmente: x = [(‘Inicio de grabación’, 0), (nan, 4), (nan, 7), …, (‘Marcador de evento 1’, 150)] Resultado que estoy buscando: x = [(‘Inicio de grabación’, 0), (‘Marcador de evento 1’, 150)] He intentado usar […]

Correlación de Pearson y valores de nan

Tengo dos archivos CSV con cientos de columnas y quiero calcular el coeficiente de correlación de Pearson y el valor de p para cada una de las columnas de dos archivos CSV. El problema es que cuando faltan datos “NaN” en una columna, me da un error. Cuando “.dropna” elimina el valor nan de las […]

StandardScaler -ValueError: la entrada contiene NaN, infinito o un valor demasiado grande para dtype (‘float64’)

Tengo el siguiente código X = df_X.as_matrix(header[1:col_num]) scaler = preprocessing.StandardScaler().fit(X) X_nor = scaler.transform(X) Y consiguió los siguientes errores: File “/Users/edamame/Library/python_virenv/lib/python2.7/site-packages/sklearn/utils/validation.py”, line 54, in _assert_all_finite ” or a value too large for %r.” % X.dtype) ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’). Solía: print(np.isinf(X)) print(np.isnan(X)) Lo que me da la salida […]

No se puede llenar NaN con ceros en un Dataframe de Pandas

Tengo el siguiente problema: estoy leyendo un archivo csv con valores perdidos usando pd.read_csv(f_name, sep=sep, header=hdr, parse_dates=True, index_col=date_col, quotechar=quote) El dataframe que obtengo tiene un nan (estaba esperando ‘NaN’s con los casos Superiores). Ahora si trato de reemplazar esos nan con zerosby usando df.fillna(0) mi df no cambia (todavía veo a nan en) Supongo que […]

¿Cómo se soluciona el problema “NaN o infinito” para la matriz dispersa en python?

Soy totalmente nuevo en Python. He usado un código encontrado en línea y traté de trabajar en él. Así que estoy creando una matriz de documentos de texto y quiero agregar algunas características adicionales antes de entrenar un modelo de regresión logística. Aunque he verificado mis datos con R y no obtengo ningún error, cuando […]

¿Por qué se considera que `NaN` es“ más pequeño ”que` -np.inf` en numpy?

¿Cuál es la razón por la que los NaN se consideran menos que -np.inf en cualquier comparación que involucre np.min o np.argmin ? import numpy as np In [73]: m = np.array([np.nan, 1., 0., -np.inf]) In [74]: n = np.array([-np.inf, 1., 0., np.nan]) # Huh?? In [75]: np.min(m) Out[75]: nan In [76]: np.min(n) Out[76]: nan […]

RuntimeWarning: se encontró un valor no válido en el máximo

Comportamiento extraño (bug ??) en numpy. Contrariamente a los documentos, el siguiente código proporciona un RuntimeWarning: un valor no válido encontrado en fmax a = np.random.uniform(0.1, 0.4, (5, 5)) b = np.random.uniform(0, 3.5, (5, 5)) b[0, 0] = np.nan c = np.fmax(a, b) # Same problem with c = np.maximum(a, b) Estoy atascado porque necesito […]

Scikit NaN o mensaje de error infinito

Estoy importando algunos datos de un archivo csv. El archivo tiene valores nan marcados con el texto ‘NA’. Importe los datos con: X = genfromtxt(data, delimiter=’,’, dtype=float, skip_header=1) Utilizo este código para reemplazar nan por una media de columna calculada previamente. inds = np.where(np.isnan(X)) X[inds]=np.take(col_mean,inds[1]) Luego ejecuto un par de cheques y obtengo matrices vacías: […]

Valores cero de una matriz a convertir a valores nan

Tengo una matriz de 1200 * 1200. Algunos de sus valores son cero. Quiero convertir los valores cero a valores numpy.nan. Esta es mi solución: import numpy for i in range(1200): for j in range(1200): if data_a[i, j] == 0: data_a[i, j] = numpy.nan Pero obtuve este error: data_a[i,j] = numpy.nan ValueError: cannot convert float […]

Error al trazar el dataframe que contiene NaN con Pandas 0.12.0 y Matplotlib 1.3.1 en Python 3.3.2

En primer lugar, esta pregunta no es la misma que esta . El problema que tengo es que cuando bash trazar un DataFrame que contiene un NaN numpy en una celda, aparece un error: C:\>\Python33x86\python.exe Python 3.3.2 (v3.3.2:d047928ae3f6, May 16 2013, 00:03:43) [MSC v.1600 32 bit (Intel)] on win32 Type “help”, “copyright”, “credits” or “license” […]