Articles of data science

Python Pandas – Reenviar rellenando filas completas con el valor de una columna anterior

Nuevo en el desarrollo de los pandas. ¿Cómo reenvío rellenar un DataFrame con el valor contenido en una columna vista anteriormente? Ejemplo autocontenido: import pandas as pd import numpy as np O = [1, np.nan, 5, np.nan] H = [5, np.nan, 5, np.nan] L = [1, np.nan, 2, np.nan] C = [5, np.nan, 2, np.nan] […]

Cuente el número de condados por estado usando python {census}

Me preocupa contar el número de condados que usan datos famosos de cenus.csv . Tarea: contar el número de condados en cada estado. Frente a la comparación (creo) / Por favor, lea a continuación? He intentado esto: df = pd.read_csv(‘census.csv’) dfd = df[:][‘STNAME’].unique() //Gives out names of state serr = pd.Series(dfd) // converting to series […]

Python Pandas: compare dos marcos de datos en una columna y devuelva el contenido de las filas de ambos marcos de datos en otro dataframe

Estoy trabajando con dos archivos csv e importados como dataframe, df1 y df2 df1 tiene 50000 filas y df2 tiene 150000 filas. Quiero comparar (iterar a través de cada fila) el “tiempo” de df2 con df1, encontrar la diferencia en el tiempo y devolver los valores de todas las columnas correspondientes a una fila similar, […]

Python Pandas Series si más cuadro de la ttwig

Tengo muchos datos en formato de diccionario y estoy intentando usar pandas para imprimir una cadena basada en una statement IF ELSE. Para mi ejemplo, componeré algunos datos en dict y convertirlos en Pandas: df = pd.DataFrame(dict(a=[1.5,2.8,9.3],b=[7.2,3.3,4.9],c=[13.1,4.9,15.9],d=[1.1,1.9,2.9])) df Esto devuelve: abcd 0 1.5 7.2 13.1 1.1 1 2.8 3.3 4.9 1.9 2 9.3 4.9 15.9 […]

Obtener desviación estándar para un GridSearchCV

Antes de scikit-learn 0.20, podríamos usar result.grid_scores_[result.best_index_] para obtener la desviación estándar. (Se devolvió por ejemplo: mean: 0.76172, std: 0.05225, params: {‘n_neighbors’: 21} ) ¿Cuál es la mejor manera en scikit-learn 0.20 para obtener la desviación estándar de la mejor puntuación?

‘Conda’ no se reconoce como comando interno o externo

Instalé Anaconda3 4.4.0 (32 bits) en mi máquina con Windows 7 Professional e importé NumPy y Pandas en la notebook Jupyter, así que asumo que Python se instaló correctamente. Pero cuando conda list y conda –version en el símbolo del sistema, dice que conda is not recognized as internal or external command. He establecido la […]

¿Cómo saber qué modelo de Keras es mejor?

No entiendo qué precisión usar en la salida para comparar mis modelos de 2 Keras para ver cuál es mejor. ¿Utilizo el “acc” (de los datos de entrenamiento) uno o el “val acc” (de los datos de validación)? Hay diferentes accs y val accs para cada época. ¿Cómo sé el acc o val acc para […]

¿Cómo configuro los valores para el eje x en matplot en python?

plt.figure(figsize=(15,5)) plt.plot(data[‘Unemployment Rate’]) plt.axis([1948,2017,0,15]) plt.show() Este código devolvió un gráfico vacío. La tabla contiene 2 columnas, datos [‘Año’] y datos [‘Tasa de desempleo’]. El año es entre 1948 y 2017. Lo que estoy tratando de lograr es generar un gráfico para la tasa de desempleo y usar los valores en los datos [‘Año’] como el […]

sklearn partial_fit () no muestra resultados precisos como fit ()

Estoy entrenando 3 listas de datos L1, L2, L3. Primero entreno a todos ellos con SGDClassifier fit () y luego instancia por instancia con partial_fit (). II probar los datos con L4, L5. [Los datos en las listas son datos de imagen y L4, las imágenes L5 son iguales a L2]. Las predicciones con fit […]

cómo trazar dos columnas de un solo DataFrame en el eje Y del linegraph

Tengo dataframe total_year que contiene tres columnas (año, acción, comedia). total_year Quiero trazar la columna del año en el eje X y (acción y comedia) en el eje Y. Cómo puedo trazar dos columnas (acción y comedia) en el eje Y. Aquí está mi código. Traza solo 1 columna en el eje Y. total_year[-15:].plot(x=’year’, y=’action’ […]