Informe del Proyecto - programacion-taw-utpl-001/trabajo-final-primer-bimestre-final-006 GitHub Wiki

Documentación del Proyecto - Librerías en Python: Jupyter, Pandas, Bokeh


1. CONCEPTOS

* Python:

Básicamente, Python es un lenguaje de programación de alto nivel, interpretado y multipropósito. En los últimos años su utilización ha ido constantemente creciendo y en la actualidad es uno de los lenguajes de programación más empleados para el desarrollo de software.

Entre las principales razones para elegir Python, son muhos los que argumentan que sus principales características lo convierten en un lenguaje muy productivo. Se trata de un lenguaje potente, flexible y con una sintaxis clara y concisa. Además, no requiere dedicar tiempo a su compilación debido a que es interpretado.

* Jupyter Notebook:

El Jupyter Notebook es una aplicación web de código abierto que le permite crear y compartir documentos que contengan códigos, ecuaciones, visualizaciones y textos narrativos en vivo. Los usos incluyen: limpieza y transformación de datos, simulación numérica, modelado estadístico, visualización de datos, aprendizaje automático y mucho más.

* Bokeh:

Bokeh es una biblioteca de visualización interactiva de Python que se dirige a navegadores web modernos para su presentación. Su objetivo es proporcionar una construcción elegante y concisa de gráficos novedosos al estilo de D3.js y ampliar esta capacidad con interactividad de alto rendimiento en conjuntos de datos de gran tamaño o de transmisión. Bokeh puede ayudar a cualquiera que desee crear trazados interactivos, cuadros de mando y aplicaciones de datos de manera rápida y fácil.

* Pandas:

Pandas es un paquete de Python que proporciona estructuras de datos similares a los dataframes de R.

Pandas proporciona herramientas que permiten:

1. leer y escribir datos en diferentes formatos: CSV, Microsoft Excel, bases SQL y formato HDF5

2. seleccionar y filtrar de manera sencilla tablas de datos en función de posición, valor o etiquetas

3. fusionar y unir datos

4. transformar datos aplicando funciones tanto en global como por ventanas

5. manipulación de series temporales

6. hacer gráficas

Python es open source, cualquiera puede contribuir a su desarrollo y divulgación. Además, no es necesario pagar ninguna licencia para distribuir software desarrollado con esté lenguaje. Hasta su intérprete se distribuye de forma gratuita para diferentes plataformas.


2. PASOS A SEGUIR

Paso 1: hay que Descargar el Modulo "PIP3" si Python es de la Version 3 en adelante o Comando "PIP" si la Version es abajo de la 3. El comando se ingresa en el Modulo del Sistema de Windows "pip install matplotlib"

Instalar PIP3


##NOTA: Si Pasas de la Version 2 de Python a la 3, Hay que asegurarse que esten Bien instaladas lo que es el SetupTools, PIP y Wheel y esto se hace con el comando "pip install -U pip setuptools wheel"


Paso 2: Instalar Librería Bokeh comando "pip install bokeh"


Paso 3: Verificar Version: En el simbolo de sistema entramos por medio de las variables de entorno a Python, ingresamos "Import bokeh" enter, despues "bokeh.version".


Paso 4: Instalar Librería Jupyter comando: "pip install jupyter"


Paso 5: Instalar Librería Pandas comando: "pip install pandas"


Paso 6: Ejecutar el libro Jupyter comando: "jupyter notebook"


Paso 7: Importamos PANDAS para poder leer el Archivo CSV.


Paso 8: Leemos el Archivo csv, Tambien lo vamos acomodando con comando, por ejemplo SEPS: que es por lo que esta separado, en este caso por Punto y Coma; encoding='latin1 que da a entender que el Idioma es el Latino


Paso 9: Limitamos la Columnas, pido que me Salga solo las INCIDENCIAS DE Quito, Guayaquil, Cuenca, Machala y Ambato


Paso 10: Verifico el Tipo de mi Tabla de Datos, y efectivamente es DataFrame de Pandas


Paso 11: Importo las LIBRERIAS de BOKEH que me van a ayudar a la Visualizacion de Datos, creo un objeto ciudades que obtiene las etiquetas que despues son ubicadas en el eje X, creamos el data que son los datos de cada ciduad, ColumnDataSource ayuda a dirigir la tabla con los datos

En "p" creamos la figura, le damos en rango X y Y el Tamaño, el Titulo

p.vbar Vamos dando Valores a las etiquetas que pusimos en el principio.

Show(p) Imprime la Grafica


Paso 12: Creamos otra figura que es Lineal, igualmente en P, creamos la figura con el Rango x y el Y le damos un tamaño de 700 y su respectivo Titulo

p.line Les Asignamos sus Datos acerca de la Severidad de la Pobreza del Ecuador


Paso 13: Creamos un diagrama de puntos, en P creamos la figura con sus rangos de X y Y el tamaño de la cabecera, Titulo

p.circle agregamos sus datos correspondientes, color, Tamaño

3. BIBLIOGRAFIA

Pandas

Bokeh

Jupyter Notebook