¿Cómo inicializar una variable de gensim corpus con un csr_matrix?

Tengo X como un csr_matrix que obtuve usando el vectorizador tfidf de scikit, y y que es una matriz

Mi plan es crear características utilizando LDA, sin embargo, no pude encontrar cómo inicializar una variable de corpus de gensim con X como csr_matrix. En otras palabras, no quiero descargar un corpus como se muestra en la documentación de gensim ni convertir X en una matriz densa, ya que consumiría mucha memoria y la computadora podría colgarse.

En resumen, mis preguntas son las siguientes,

  1. ¿Cómo se inicializa un cuerpo gensim dado que tengo una csr_matrix (dispersa) que representa todo el cuerpo?
  2. ¿Cómo usas LDA para extraer características?

Gensim tiene una función semi-bien escondida que puede hacer esto por ti:

http://radimrehurek.com/gensim/matutils.html#gensim.matutils.Sparse2Corpus

“class gensim.matutils.Sparse2Corpus (sparse, documents_columns = True) Convierte una matriz en formato scipy.sparse en un corpus gensim de transmisión.”

He tenido cierto éxito con un corpus extraído con CountVectorizer, luego cargado en gensim.