Estadísticas SOLR del Home del Administrador - crai-unrn/DSpace GitHub Wiki

Apache SOLR (de sus siglas en inglés, Searching On Lucine Replication) es una plataforma de búsquedas basada en Apache Lucene, que funciona como un "servidor de búsquedas". Sus principales características incluyen búsquedas de texto completo, resaltado de resultados, clustering dinámico, y manejo de documentos como Word y PDF. Solr es escalable, permitiendo realizar búsquedas distribuidas y replicación de índices, y actualmente se está usando en muchos de los sitios más grandes de Internet. SOLR se usa en Dspace para lograr dos funcionalidades: estadísticas y búsquedas. De esta forma, podemos obtener estadísticas cómo:

  • Fecha de la última publicación depositada
  • Publicaciones más descargados por un usuario específico
  • Número de publicaciones en una comunidad específica
  • Número de publicaciones enviadas por mes
  • Número de descargas totales en un período de tiempo determinado
  • Número de descargas (vistas de artículos) de un artículo específico por mes

Más información en https://wiki.lyrasis.org/display/DSDOC6x/Command+Line+Operations#CommandLineOperations-Legacystatistics

Activar las estadísticas

DSpace compila estadísticas a través de un conjunto de aplicaciones de línea de comandos en `installer/bin/dspace. Es decir, no es posible ver las estadísticas hasta que se ejecute el comando correcto. Para realizar esta tarea de forma regular es necesaria la creación de un cronjob.

El archivo de configuración, para los comandos de las estadísticas, es dstat.cfg. Acá se puede configurar el mes y año de inicio de las estadísticas, el tipo de recursos, si mostrar o no el mail de los usuarios, los reportes requeridos, entre otras cosas.

Comandos de SOLR

Los comandos deben ejecutarse en un orden preestablecido. En primer lugar, y por única vez, deben ejecutarse los siguientes comandos:

./dspace stat-initial
./dspace stat-report-initial

Estos comandos iniciarán el sistema de estadísticas de SOLR, para la vista del home del adminsitrador.

  • stat-initial: compila las estadísticas iniciales
  • stat-report-initial: crea el informe de estadísticas inicial

Seguidamente, podemos ejecutar cualquiera de los siguientes comandos:

  • Reportes Generales

    • stat-general: compila las estadísticas generales
    • stat-report-general: crea el informe de estadísticas generales
  • Reportes mensuales

    • stat-monthly: compila las estadísticas mensuales
    • stat-report-monthly: crea el informe de estadísticas mensual

Cronjob

El cron debe ejectutarse con el usuario dspace del sistema.

# Update the general and monthly SOLR stats
# (stat-monthly and stat-general would be scheduled for 12:30am and 12:35am respectively. While their corresponding report scripts would run at 1:30am and 1:35am respectively)
30 0 * * *	dspace	$DSPACE/bin/dspace stat-monthly
35 0 * * *	dspace	$DSPACE/bin/dspace stat-general
30 1 * * *	dspace	$DSPACE/bin/dspace stat-report-monthly
35 1 * * *	dspace	$DSPACE/bin/dspace stat-report-general

Otros comandos

Scripts para las estadísticas que se almacenan en SOLR:

  • solr-export-statistics: exporta datos de estadísticas de Solr a CSV (para realizar copias de seguridad o moverlos a otro servidor)
  • solr-import-statistics: Importa datos estadísticos de Solr desde CSV (para restaurarlos o moverlos a otro servidor)
  • solr-reindex-statistics: datos estadísticos de Reindex Solr (para actualizaciones o actualizaciones del esquema de Solr)
  • stats-log-converter: convierta archivos dspace.log listos para importar en estadísticas de solr
  • stats-log-import: importa archivos de registro previamente convertidos en estadísticas de solr
  • stats-log-import-elasticsearch: Importa archivos de registro convertidos en formato solr a Elasticsearch Usage Statistics (obsoleto)
  • stats-util: cliente de estadísticas para el mantenimiento de índices estadísticos de Solr