Historias de datos eficaces (modulo 6) - guillermopetcho/Coursera-Certificate----Data-Analytics-Google GitHub Wiki
En la Analítica de datos, la Narración de datos consiste en comunicar el significado de un conjunto de datos mediante imágenes y una narración adaptada a un público concreto. En el periodismo de datos, los periodistas atraen a su audiencia de lectores combinando visualizaciones, narrativa y contexto en artículos basados en datos. ¡Resulta que los analistas de datos y los periodistas de datos tienen mucho en común! Como analista de datos junior, podría aprender algunas cosas sobre la narración eficaz del periodismo de datos. Siga leyendo para explorar la función y el trabajo de un periodista de datos a la hora de contar una buena historia.
Nota: Esta lectura hace referencia a un artículo publicado en The New Yorker . Los no suscriptores pueden acceder a varios artículos gratuitos cada mes. Si ya ha alcanzado su límite mensual de artículos gratuitos, marque el artículo y vuelva a esta lectura más tarde.
Haga un recorrido por un artículo basado en datos
Ben Wellington escritor colaborador de The New Yorker y profesor del Pratt Institute, utilizó el portal de datos abiertos de la ciudad de Nueva York portal de Datos abiertos para rastrear las quejas por ruido a partir de las solicitudes de servicio registradas. Analizó los datos para obtener una comprensión más cuantitativa de dónde procedía el ruido y qué barrios eran los más ruidosos. A continuación, presentó sus conclusiones en el artículo Mapping New York's Noisyest Neighborhoods
.
En primer lugar, haga clic en el enlace anterior para hojear el artículo y familiarizarse con las visualizaciones de datos. Después, ¡únase a la visita guiada por los datos! Se le dirigirá a tres visualizaciones (paradas del recorrido) para que observe cómo cada visualización ayudó a reforzar la narración general del artículo. Parada 1: establecer el contexto
Anteriormente en el entrenamiento, usted aprendió cómo el contexto es importante para entender los datos. Contexto es la condición en la que algo existe o sucede. Basándose en la categorización de las quejas por ruido, el periodista de datos estableció el contexto en el artículo definiendo lo que la gente consideraba ruido.
En el artículo, revise la tabla combinada y el Gráfico de barras
que categoriza las quejas por ruido. Evalúe la visualización:
¿Cómo ayuda la visualización a establecer el contexto?
La tabla combinada y el Gráfico de barras son eficaces para resumir las categorías de ruido como porcentajes de las quejas registradas. Esto ayuda a establecer el contexto respondiendo a la pregunta "¿qué es el ruido?" Observe que el periodista de datos creó una tabla combinada y un Gráfico de barras en lugar de un gráfico circular. Con 11 categorías de ruido, una Lista con un Gráfico de barras que muestre las proporciones relativas es una representación elegante. Un Gráfico circular con 11 categorías habría sido más difícil de leer.
¿Cómo ayuda la visualización a aclarar los datos?
Si se suman los porcentajes de las categorías en la tabla combinada y el gráfico de barras, el total es noventa y ocho por ciento. Hay una diferencia del dos por ciento que no se puede contabilizar en la visualización. Así que, en lugar de aclarar los datos, la visualización causa en realidad un poco de confusión. Una lección es asegurarse siempre de que sus porcentajes suman correctamente. A veces, redondear los decimales hacia arriba o hacia abajo hace que los porcentajes se desvíen y no sumen el 100%.
¿Se ha dado cuenta de una práctica recomendada de visualización de datos? Ha aprendido que una tabla complementaria en Tableau muestra los datos de una forma diferente en caso de que algunos miembros de su audiencia prefieran las tablas. Parece que el periodista de datos tuvo la misma idea al utilizar una tabla combinada y un gráfico de barras.
Nota: Como recordatorio, una tabla complementaria en Tableau se muestra justo al lado de una visualización. Una tabla complementaria muestra los mismos datos que la visualización, pero en formato de tabla. Puede volver a ver el vídeo [Getting ](https://www.coursera.org/learn/visualize-data/lecture/Eytgs/getting-creative)
Creative que incluye un ejemplo de tabla complementaria.
Parada 2: análisis de variables
Tras establecer el contexto identificando las categorías de ruido, el periodista de datos describe su análisis de los datos de ruido. Un análisis interesante es el de la distribución de las quejas por ruido en función de la hora del día.
En el artículo, revise el gráfico de área apilado
para ver la distribución de las quejas por ruido según la hora del día. Evalúe la visualización:
¿Cómo se comporta la visualización frente a la regla de los cinco segundos?
Recordemos que la regla de los cinco segundos establece que se debe entender lo que se transmite en los primeros cinco segundos de ver un gráfico. Suponemos que esta visualización funciona bastante bien Los Gráficos de área de la música alta y los ladridos de perros ayudan al público a comprender que el mayor número de quejas por este tipo de ruido se produjo durante las horas de la noche y la madrugada (entre las 22:00 y las 2:00). Observe también que la programación de colores de la Leyenda se alinea con los colores del Gráfico. La leyenda de un gráfico normalmente tiene la categoría más grande en la parte superior, pero el periodista de datos eligió ordenar la leyenda para que la categoría más grande, "Música alta o fiesta" aparezca en la parte inferior en su lugar. ¿Cuánto tiempo cree que esta alineación ahorró a los lectores?
¿Cómo ayuda la visualización a clarificar los datos? A diferencia de la visualización de la parada anterior, esta visualización hace un mejor trabajo al mostrar claramente que todos los porcentajes suman 100%.
¿Se da cuenta de una práctica recomendada de visualización de datos ? Como práctica recomendada, tanto el eje X como el eje Y deberían estar etiquetados. Pero, el periodista de datos optó por incluir % o A.M. y P.M. con cada marca en un eje. Como resultado, etiquetar el Eje X "Hora del día'' y el Eje Y "Porcentaje de quejas por ruido" no es necesario. Esto demuestra que un poco de creatividad con el etiquetado puede ayudarle a conseguir un gráfico más limpio.
Parada 3: sacar conclusiones
Tras describir cómo se analizaron los datos, el periodista de datos comparte qué barrios son los más ruidosos utilizando una variedad de visualizaciones: tabla combinada y Gráfico de barras , mapa de densidad y mapa del barrio
.
En el artículo, revise el mapa del vecindario
para saber lo cerca que está un barrio ruidoso de un barrio tranquilo. Evalúe la visualización:
¿Cómo ayuda la visualización a aclarar un punto?
El periodista de datos observó que uno de los barrios más ruidosos estaba justo al lado de uno de los más tranquilos. El mapa del barrio es eficaz para enfatizar esta observación como un área azul oscuro frente a un área blanca.
¿Cómo ayuda la visualización a clarificar los datos?
La visualización clasifica los datos por barrios y permite a la audiencia seguirla cuando el periodista se centra específicamente en los barrios de Williamsburg, Williamsburg Este y North Side/South Side.
¿Nota una buena práctica de visualización de datos ? Cada barrio está directamente etiquetado, por lo que no es necesaria una leyenda.
Fin del recorrido: inspirarse
Esperamos que haya disfrutado de su recorrido por el trabajo de un periodista de datos Que esto inspire su narración de datos para que sea lo más atractiva posible. Si desea más información sobre la eficacia de la narración de datos, lea estos artículos:
[¿Qué es la Narración de datos? ](https://www.nugit.co/what-is-data-storytelling/)
Utilice datos y análisis para contar una historia
Cuente una Historia Significativa con Datos