Proyecto Bimestre I - programacion-taw-utpl-001/trabajo-final-primer-bimestre-final-008 GitHub Wiki

PROYECTO FINAL DE BIMESTRE


TEMA:

Proyecto de Visualización de Datos


LOGO - PYTHON

TEMÁTICA EXTRAIDA DE ECUADOR EN CIFRAS:

NACIDOS VIVOS 2016


INEC-Nacimientos en Ecuador


Objetivo general

Representar gráficamente información para el análisis estadístico de la temática extraida de ECUADOR EN CIFRAS: "Nacidos Vivos 2016" haciendo uso tanto de pandas como de bokeh y presentarlas en jupyter.

Marco teórico

  • Python

Python es un lenguaje de programación poderoso y fácil de aprender. Cuenta con estructuras de datos eficientes y de alto nivel y un enfoque simple pero efectivo a la programación orientada a objetos. La elegante sintaxis de Python y su tipado dinámico, junto con su naturaleza interpretada, hacen de éste un lenguaje ideal para scripting y desarrollo rápido de aplicaciones en diversas áreas y sobre la mayoría de las plataformas.

python

  • Pandas

Es un paquete de Python que proporciona estructuras de datos, Pandas proporciona herramientas que nos permite leer y escribir datos en diferentes formatos: CSV, Microsoft Excel, bases SQL y formato HDF5, seleccionar y filtrar de manera sencilla tablas de datos en función de posición, valor o etiquetas, manipulación de series temporales y hacer gráficas. Pandas

  • Bokeh

Bokeh es una biblioteca de visualización interactiva de Python que se dirige a navegadores web modernos para su presentación. Su objetivo es proporcionar una construcción elegante y concisa de gráficos novedosos al estilo de D3.js y ampliar esta capacidad con interactividad de alto rendimiento en conjuntos de datos de gran tamaño o de transmisión. Bokeh puede ayudar a cualquiera que desee crear trazados interactivos, cuadros de mando y aplicaciones de datos de manera rápida y fácil. Bokeh

  • Jupyter

Jupyter es una aplicación Web que nos permite crear y compartir documentos que contienen código vivo, ecuaciones, textos, visualizaciones, etc. De esta forma se puede crear tutoriales interactivos, donde el lector pueda ir probando y comprobando, sin necesidad de instalar nada en su ordenador, aquellos conceptos o ejercicios que le vamos mostrando. Jupyter

Descripción de obtención de la información

LOGO - ECUADOR EN CIFRAS

De la página ECUADOR EN CIFRAS hemos extraido la información sobre Nacidos Vivos 2016 que tiene como objetivo ser repesentada o visualizada a traves de las herramientas: Pandas y Bokeh. Esta base de datos Nacidos Vivos 2016 con formato csv, la cual nos facilito el trabajo al momento de representar la información en ** pandas y bokeh**; esta temática constituye todos los hechos vitales de nacidos vivos ocurridos en el país durante el año de investigación e inscritos en el Registro Civil del Ecuador. La información proviene de registros administrativos; para el levantamiento de datos se cuenta con el "Informe Estadístico de Nacido Vivo", el mismo que es diseñado y distribuido por el INEC a cada una de las oficinas del Registro Civil, Jefaturas Provinciales de Estadística del Ministerio de Salud Pública, Hospitales y Clínicas de sectores público y privado del país.

Base de Datos Tomada de la siguiente dirección: Nacimientos Y Defunciones


Formato de la Base de Datos encontrada: csv. Fecha de publicación Base de Datos: 30 de junio del 2017. Version 1.1(año 2016). Idioma: Español. csv datos

Herramientas Utilizadas

  1. Instalación Pandas: Extracción de datos, filtro de datos. Pandas
  2. Instalación de Bokeh: Utilización de herramienta para graficar Bokeh
  3. Instalación de Jupyter: Ejecutor Jupyter

Otras herramientas utilizadas

  1. Uso de entorno virtual entorno

Propuesta de Visualización

  • Gráfica 1 En la presente gráfica representa el número de bebes hombres y mujeres nacidos vivos en el año 2016. En donde se puede visualizar que en dicho año han nacido más hombres que mujeres, pero su diferencia es poca.

  • Gráfica 2 En esta gráfica representa la cantidad de nacimientos que se han registrado por mes en dicho año, en donde se puede visualizar que en los meses Julio, Mayo y Agosto se han registrado mas nacimientos y que el mes de Febrero y Enero son los meses que tienen menos registros.

  • Gráfica 3 En esta grafica se representa la cantidad de inscripciones que se han registrado en 5 provincias que se presentan de manera aleatoria, en donde en cada provincia se especifica el número de inscripciones en tres meses que se han registrado durante ese año. Podemos notar que los resultados que muestra la grafica es que en la provincia de Azuay y en los meses de Enero, Diciembre y Septiembre se han registrado más inscripciones.

  • Gráfica 4 En está gráfica se puede ver la edad de las mujeres embarazadas y cual es su nivel de instrucción o educación, el programa genera de manera aleatoria 3 edades que en este caso son 10, 45 y 22 y de la misma manera genera 6 niveles de instrucción que son: Educación Básica, Secundaria, Primaria Centro de Alfabetización, Sin Información, Educación Media Bachillerato. La barra que le pertence a Sin Información significa que las mujeres embarazadas no han dado información acerca de su nivel de educación. Podemos notar que según la gráfica, existen más mujeres embarazadas con nivel de instrucción Secundaria, en donde la mayoría tienen 22 años y muy pocas tienen 45 años.

  • Gráfica 5 Está gráfica representa la etnia y el estado civil de la madre, en donde se puede visualizar que existen más mujeres embarazadas de etnia mestiza solteras, y pocas mujeres que separadas y sin información.

  • Gráfica 6 Esta gráfica representa la talla y el peso de cada bebe, en donde podemos notar que más bebes de talla: 50cm pesan 3400g.

Anexos

  • Código de la primera gráfica 1

  • Código de la segunda gráfica 2

  • Código de la tercera gráfica Anexo3

3

  • Código de la cuarta gráfica 4

4

  • Código de la quinta gráfica

  • Código de la sexta gráfica

Bibliografía

  1. [1] http://docs.python.org.ar/tutorial/3/real-index.html
  2. [2] https://pandas.pydata.org/pandas-docs/stable/
  3. [3] https://www.datacamp.com/community/blog/bokeh-cheat-sheet-python
  4. [4] https://www.datacamp.com/community/tutorials/tutorial-jupyter-notebook