Modulo 5: Consultar en BigQuery - guillermopetcho/Coursera-Certificate----Data-Analytics-Google GitHub Wiki
Ha llegado el momento de empezar a trabajar con los datos de nacimientos de los CDC. Examine el conjunto de datos que acaba de cargar. Familiarícese con las columnas y los campos disponibles:
SELECT *
FROM bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
LIMIT 1000
SELECT *
FROM bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
ORDER
BY --This is a SQL sort order function
Births --Applies the sorting to the Births column
LIMIT 10
Examine la columna Nacimientos. Observe que está ordenada de menor a mayor. Cuando se aplica la función ORDER BY para ordenar una columna determinada, SQL ordenará por defecto en orden ascendente, que ordena los elementos de menor a mayor.
Si desea que el número más grande aparezca en primer lugar, deberá especificar que el orden de clasificación sea descendente añadiendo una orden a la cláusula ORDER BY. Puede hacer que su código sea más fácil de leer utilizando un comando para especificar cualquiera de los dos órdenes de ordenación. He aquí los comandos correspondientes:
ASC = Ascendente DESC = Descendente
A continuación, utilizará la misma consulta, pero esta vez indicará explícitamente el orden de su función ORDER BY utilizando ASC. Introduzca y ejecute la siguiente consulta SQL:
SELECT *
FROM bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
ORDER BY Births ASC --Place the ASC or DESC specifier directly after the column name separated by a space (no other punctuation)
LIMIT 10
Observe que los resultados no han cambiado. El condado de Tompkins, en Nueva York, solo tuvo 735 nacimientos en 2018, el recuento de nacimientos más bajo de todos los condados de EE. UU. entre 2016 y 2018.
Ahora, cambie el orden de ascendente (ASC) a descendente (DESC) para encontrar el mayor número de nacimientos. Introduzca y ejecute esta consulta:
SELECT *
FROM bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
ORDER BY Births DESC --Note that this is the only change you've made
LIMIT 10
Utilizar datos para responder preguntas
Ahora que se ha familiarizado con los conceptos básicos de las funciones de ordenación, utilícelas para responder a preguntas sobre sus datos. Este ejercicio requerirá que aplique tanto sus aprendizajes previos (especialmente el filtrado con la cláusula WHERE) como su nueva comprensión de la ordenación.
En su trabajo como investigador de salud pública, está explorando si las tendencias de la tasa de natalidad en varios condados del norte del estado de Nueva York han aumentado o disminuido, y si siguen el mismo patrón.
Para responder a esto, necesitará la siguiente información:
Resultados de los condados de Erie, Niágara y Chautauqua en el estado de Nueva York
Resultados ordenados por condado de residencia y año para encontrar la tendencia
La siguiente Consulta filtrará los resultados por condado y ordenará los resultados poraño y condado. Esto le permitirá determinar si el número de nacimientos está aumentando o disminuyendo en cada condado.
Introduzca la siguiente consulta en el Editor de consultas y, a continuación, seleccione EJECUTAR.
SELECT *
FROM bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
WHERE
County_of_Residence = 'Erie County, NY'
OR County_of_Residence = 'Niagara County, NY'
OR County_of_Residence = 'Chautauqua County, NY'
ORDER BY
County_of_Residence,
Year
Una pregunta
La última consulta que realizó le devolvió los nacimientos en tres condados, ordenados por año y condado. Ahora, desea identificar el mayor número de nacimientos en los condados de Erie, Chautauqua o Niágara entre 2016 y 2018. Modifique la consulta anterior para ordenar los datos por Nacimientos en orden descendente y facilitar así su identificación. ¿Cuántos nacimientos se produjeron en el condado con mayor número de nacimientos en un año?
SELECT
*
FROM
bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
WHERE
(County_of_Residence = 'Erie County, NY'
OR County_of_Residence = 'Niagara County, NY'
OR County_of_Residence = 'Chautauqua County, NY')
AND EXTRACT(YEAR FROM Year) BETWEEN 2016 AND 2018
ORDER BY
County_of_Residence,
Year;
Otra respuesta correcta es la siguiente:
SELECT
*
FROM
bigquery-public-data.sdoh_cdc_wonder_natality.county_natality
WHERE
(County_of_Residence = 'Erie County, NY'
OR County_of_Residence = 'Niagara County, NY'
OR County_of_Residence = 'Chautauqua County, NY')
AND Year BETWEEN 2016 AND 2018
ORDER BY
County_of_Residence,
Year;