Articles of r

Obtener la media a través de múltiples marcos de datos de Pandas

Estoy generando una serie de marcos de datos con la misma forma, y ​​quiero compararlos entre sí. Quiero poder obtener la media y la mediana a través de los marcos de datos. Source.0 Source.1 Source.2 Source.3 cluster 0 0.001182 0.184535 0.814230 0.000054 1 0.000001 0.160490 0.839508 0.000001 2 0.000001 0.173829 0.826114 0.000055 3 0.000432 0.180065 […]

¿Entorno virtual en R?

He encontrado varias publicaciones sobre mejores prácticas, reproducibilidad y flujo de trabajo en R, por ejemplo: Cómo boost la reproducibilidad a largo plazo de la investigación (particularmente usando R y Sweave) Ejemplos sustantivos completos de investigación reproducible usando R Una de las principales preocupaciones es garantizar la portabilidad del código, en el sentido de que […]

Reducción de dimensión en datos categóricos con valores perdidos

Tengo un modelo de regresión en el que la variable dependiente es continua, pero el noventa por ciento de las variables independientes son categóricas (tanto ordenadas como desordenadas) y alrededor del treinta por ciento de los registros tienen valores faltantes (para empeorar las cosas, faltan al azar sin ningún patrón, es decir, más de cuarenta […]

Instalar rpy2 sin privilegios de administrador

Estoy teniendo problemas para instalar el paquete rpy2 de Python. Ya he comstackdo R como una biblioteca compartida, pero no tengo privilegios de administrador, así que estoy tratando de instalar rpy2 con: pip install -user rpy2 Sin embargo, estoy recibiendo el siguiente error: ./rpy/rinterface/_rinterface.c:86:31: error fatal: readline / readline.h: No existe tal archivo o directorio […]

dplyr resumen equivalente en pandas

Solía ​​trabajar con R y realmente me encanta el paquete dplyr que puede agrupar y resumir fácilmente. Sin embargo, en pandas, no veo un equivalente de resumen y aquí es cómo lo logro en Python: import pandas as pd data = pd.DataFrame( {‘col1’:[1,1,1,1,1,2,2,2,2,2], ‘col2’:[1,2,3,4,5,6,7,8,9,0], ‘col3’:[-1,-2,-3,-4,-5,-6,-7,-8,-9,0] } ) result = [] for k,v in data.groupby(‘col1’): result.append([k, […]

¿Por qué las pandas se fusionaron en python más rápido que los datos? ¿La tabla se fusiona en R en 2012?

Hace poco me encontré con la biblioteca de pandas para python, que según este punto de referencia realiza fusiones en memoria muy rápidas. Es incluso más rápido que el paquete data.table en R (mi idioma de elección para análisis). ¿Por qué los pandas son mucho más rápidos que data.table ? ¿Es debido a una ventaja […]

Trazar mapa de color con códigos postales en R o Python

Tengo algunos datos demográficos y firmográficos de los Estados Unidos. Me gustaría trazar áreas de código postal en un estado o una región más pequeña (por ejemplo, ciudad). Cada área se anotaría por color y / o texto específico para esa área. La salida sería similar a http://maps.huge.info/ pero a) con texto anotado; b) salida […]

Cómo crear un vector R vacío para agregar nuevos elementos

Quiero usar R en Python, como lo proporciona el módulo Rpy2. Observo que R tiene operaciones [] muy convenientes mediante las cuales puede extraer columnas o líneas específicas. ¿Cómo podría lograr tal función con los scripts de Python? Mi idea es crear un vector R y agregar los elementos deseados en este vector para que […]

¿Ajustando los datos a las distribuciones?

No soy un estadístico (más de un desarrollador web de investigación) pero he estado escuchando mucho sobre scipy y R en estos días. Así que, por curiosidad, quise hacer esta pregunta (aunque podría parecer una tontería para los expertos de aquí) porque no estoy seguro de los avances en esta área y quiero saber cómo […]

¿Cómo pasar una función y sus argumentos a través de una función de envoltorio en R? Similar a * args y * kwargs en python

Quiero escribir una función de envoltorio en R. Debería tomar una función y sus argumentos. Haga algo y luego llame a la función con los argumentos proporcionados. Sé cómo hacerlo en python, pero busco una implementación en R. En python escribiría: def wrapper(func, *args, **kwargs): #do something here return func(*args, **kwargs)