Gestión y análisis de datos de investigación con Excel y Access – II Bases de datos - torressalinas/repositorio-de-guiones GitHub Wiki


Resumen: Muchas veces los investigadores nos vemos abrumados por la cantidad de datos que tenemos que gestionar y analizar, además nos encontramos con múltiples y complejos programas estadísticos. Esta situación es aún más dramática para los que somos de ciencias sociales y humanidades. Sin embargo muchas veces la solución para trabajar con nuestros datos es más rápida y está en nuestros ordenadores por defecto: Microsoft Excel y Access. En esta épica trilogía aprenderemos a exprimir estos programas ofimáticos con propósitos científicos. *** Segunda parte de la trilogía: sin duda Access es una de nuestras aplicaciones más queridas de Microsoft, con access podrás crear bases de datos de toda la vida de forma rápida. Podrás dar solución al almacenamiento de datos de forma rápida segura. En este curso tenemos tres objetivos claros 1) Aprender que es una base de datos relacional y como diseñarla 2) Crear tablas, describirlas y conectarlas … 3) Aprender a realizar consultas y analizar tus datos

#Introducción

  • Access es un sistema de administración de base de datos. Permite por tanto almacenar, buscar datos, organizarlos
  • En un sistema de base de datos relacional, es decir almacenamos la información en tablas que se relacionan Vamos a ver este ejemplo
  • Aunque no siempre es así, podemos utilizar para almacenar cualquier información de un proyecto pero también puede tener usos puntuales para analizar y tratar datos e información científica (este curso de hoy va más en este sentido, Ejemplo)

#Elementos fundamentales (I)

  • Tablas
  • Consultas

#Caso práctico, trabajando con datos externos

Los datos

  • Descripción de mi conjunto de datos: trabajo en un proyecto de investigación y cada investigador ha estado recopilando datos por su cuenta, debemos combinar esos datos para visualizarlos de manera conjunta. Además como son tan simpáticos cada uno nos ha mandado los datos en un formato diferente
  • Descripción del set con el que vamos a trabajar. Son publicaciones científicas con datos repartidos en ficheros XLS, CSV, XML, ACCDB. (si quieres puedes descargar los datos que vamos a usar)
  • Nuestro objetivo final saber la información completa que se ha recopilado para cada publicación científica. Además queremos calcular una serie de indicadores finales sobre las revistas científicas. Tanto las publicaciones completas como los indicadores a nivel de revistas que son los que tengo que enviar al IP en un formato excel (XLS)
  • Evidentemente lo primero que tendremos que hacer es crear una base de datos en blanco

Importar los datos

  • Hay que utilizar el menú de "Datos Externos"
  • Importación del fichero CSV "a-publicaciones" como "nueva tabla"
  • Elementos del asistente de importación
  • Edición del tipo de datos en una tabla y operaciones básicas en una tabla (filtros, búsqueda, reemplazamientos, eliminar, introducir..)
  • Importación del fichero CSV "b-indicadores principales" como "tabla vinculada"
  • Importación del fichero accdb "c-indicadores secundarios" como "nueva tabla"
  • Importación de los ficheros XLS "d-Base de datos" y "e-Categoria" como "tabla vinculada" (renombrar al importar)
  • Importación de los ficheros XML "f-resumen" como "nueva tabla" (renombrar al importar)

Combinar los datos

  • Obtener una visión general de los datos con la herramienta relaciones
  • Buscar el campo que nos permita vincular las tablas, en nuestro caso el DOI
  • Obtener un informe de relaciones

Consultas y cálculos

  • Quiero ver cuantas de las publicaciones recopiladas (a) tiene indicadores (b) (c) (combinación de diferentes tablas)
  • Quiero guardar la consulta anterior como tabla para reutilizarla (consulta de creación de tabla)
  • Quiero conocer cuántas publicaciones están indexadas en Web of Science (a) (d) (consulta de selección)
  • Quiero guardar la consulta anterior y ver si esos trabajos tienen resumen disponible (f) (comando is not null)
  • Los totales: quiero conocer cuantos artículos (a) hay en cada categoría (e)
  • Quiero conocer los indicadores principales (b) para cada categoría (e) (consulta guardada), sus sumas totales, promedios y desviaciones estandar
  • Quiero crear una tabla que me diga cuantos artículos hay por revista (a) y los sumatorios de sus indicadores principales (b). Quiero crear una tabla con esa consulta y además renombrar el nombre de las columnas, vamos a llamar a esta tabla P
  • Quiero hacer operaciones con las diferentes columnas de la tabla P

Exportar los datos

  • Exportar: nos sirve como herramienta para transformar datos, por ejemplo pasar de un excel a un xml sin dramas
  • Exportar: podemos exportar tablas y consultas

#Elementos fundamentales (II) - Introducción básica

  • Formularios - Formulario de navegación
  • Informes - Impresión de informes