Articles of data science

Python Pandas: compare dos marcos de datos en una columna y devuelva el contenido de las filas de ambos marcos de datos en otro dataframe

Estoy trabajando con dos archivos csv e importados como dataframe, df1 y df2 df1 tiene 50000 filas y df2 tiene 150000 filas. Quiero comparar (iterar a través de cada fila) el “tiempo” de df2 con df1, encontrar la diferencia en el tiempo y devolver los valores de todas las columnas correspondientes a una fila similar, […]

Python Pandas Series si más cuadro de la ttwig

Tengo muchos datos en formato de diccionario y estoy intentando usar pandas para imprimir una cadena basada en una statement IF ELSE. Para mi ejemplo, componeré algunos datos en dict y convertirlos en Pandas: df = pd.DataFrame(dict(a=[1.5,2.8,9.3],b=[7.2,3.3,4.9],c=[13.1,4.9,15.9],d=[1.1,1.9,2.9])) df Esto devuelve: abcd 0 1.5 7.2 13.1 1.1 1 2.8 3.3 4.9 1.9 2 9.3 4.9 15.9 […]

Obtener desviación estándar para un GridSearchCV

Antes de scikit-learn 0.20, podríamos usar result.grid_scores_[result.best_index_] para obtener la desviación estándar. (Se devolvió por ejemplo: mean: 0.76172, std: 0.05225, params: {‘n_neighbors’: 21} ) ¿Cuál es la mejor manera en scikit-learn 0.20 para obtener la desviación estándar de la mejor puntuación?

‘Conda’ no se reconoce como comando interno o externo

Instalé Anaconda3 4.4.0 (32 bits) en mi máquina con Windows 7 Professional e importé NumPy y Pandas en la notebook Jupyter, así que asumo que Python se instaló correctamente. Pero cuando conda list y conda –version en el símbolo del sistema, dice que conda is not recognized as internal or external command. He establecido la […]

¿Cómo saber qué modelo de Keras es mejor?

No entiendo qué precisión usar en la salida para comparar mis modelos de 2 Keras para ver cuál es mejor. ¿Utilizo el “acc” (de los datos de entrenamiento) uno o el “val acc” (de los datos de validación)? Hay diferentes accs y val accs para cada época. ¿Cómo sé el acc o val acc para […]

¿Cómo configuro los valores para el eje x en matplot en python?

plt.figure(figsize=(15,5)) plt.plot(data[‘Unemployment Rate’]) plt.axis([1948,2017,0,15]) plt.show() Este código devolvió un gráfico vacío. La tabla contiene 2 columnas, datos [‘Año’] y datos [‘Tasa de desempleo’]. El año es entre 1948 y 2017. Lo que estoy tratando de lograr es generar un gráfico para la tasa de desempleo y usar los valores en los datos [‘Año’] como el […]

sklearn partial_fit () no muestra resultados precisos como fit ()

Estoy entrenando 3 listas de datos L1, L2, L3. Primero entreno a todos ellos con SGDClassifier fit () y luego instancia por instancia con partial_fit (). II probar los datos con L4, L5. [Los datos en las listas son datos de imagen y L4, las imágenes L5 son iguales a L2]. Las predicciones con fit […]

cómo trazar dos columnas de un solo DataFrame en el eje Y del linegraph

Tengo dataframe total_year que contiene tres columnas (año, acción, comedia). total_year Quiero trazar la columna del año en el eje X y (acción y comedia) en el eje Y. Cómo puedo trazar dos columnas (acción y comedia) en el eje Y. Aquí está mi código. Traza solo 1 columna en el eje Y. total_year[-15:].plot(x=’year’, y=’action’ […]

Importar selectivamente desde otro cuaderno Jupyter

data.ipynb mis cuadernos Jupyter en: data.ipynb , data.ipynb y results.ipynb . ¿Cómo puedo importar celdas selectivamente de los cuadernos de datos y métodos para usar en el cuaderno de resultados ? Sé de nbimporter y ipynb pero ninguno de ellos ofrece importación selectiva de variables. Hay una opción para importar definiciones, incluidas las variables en […]

light gbm – API de python vs API de Scikit-learn

Estaba tratando de aplicar lgbm en uno de mis problemas. Para eso estaba revisando ” http://lightgbm.readthedocs.io/en/latest/Python-API.html “. Sin embargo, tengo una pregunta básica. ¿Hay alguna diferencia entre Training API y Scikit-learn API? ¿Podemos usar ambas API para lograr el mismo resultado para el mismo problema? Gracias, Dipanjan.