Términos del glosario del Módulo 6.2 - guillermopetcho/Coursera-Certificate----Data-Analytics-Google GitHub Wiki

Términos y definiciones para el Curso 6, Módulo 2

Gráfico de área: Visualización de datos que utiliza puntos de datos individuales para una variable cambiante conectados por una línea continua con un área rellena debajo

Diagrama de caja: Visualización de datos que muestra la distribución de valores a lo largo de un eje X

Gráfico de burbujas : Visualización de datos que muestra puntos de datos individuales como burbujas, comparando valores numéricos por su tamaño relativo.

Gráfico de viñetas: Visualización de datos que muestra los datos como un gráfico de barras horizontales que se mueven hacia un valor deseado.

Vista en círculo: Una visualización de datos que muestra la fuerza comparativa de los datos

Gráfico de columnas : Una visualización de datos que utiliza puntos de datos individuales para una variable cambiante, representados como columnas verticales

Gráfico combinado: Una visualización de datos que combina más de un tipo de visualización

Mapa de densidad : Visualización de datos que representa concentraciones, con colores que representan el número o la frecuencia de puntos de datos en un área determinada de un mapa

Gráfico de distribución: Visualización de datos que muestra la frecuencia de varios resultados en una muestra.

Paleta de color divergente: Un tema de color que muestra dos rangos de valores de datos utilizando dos tonalidades diferentes, con una intensidad de color que representa la magnitud de los valores

Gráfico de anillos : Visualización de datos en la que los segmentos de un anillo representan valores de datos que suman un todo

Mapa coroplético: Visualización de datos que colorea zonas de un mapa basándose en medidas o dimensiones

Diagrama de Gantt: Visualización de datos que muestra la duración de eventos o actividades en una línea de tiempo

Gráfico de calibre : Una visualización de datos que muestra un único resultado dentro de un rango progresivo de valores

Resaltar tabla: Una visualización de datos que utiliza el formato condicional y el color en una tabla

Gráfico de burbujas agrupadas: Una visualización de datos que muestra los datos en círculos agrupados

Mapa de símbolos: Una visualización de datos que muestra una marca sobre una longitud y latitud determinadas Términos y definiciones de módulos anteriores A

Pruebas A/B: El proceso de probar dos variaciones de la misma página web para determinar qué página tiene más éxito a la hora de atraer tráfico de usuarios y generar Ingresos

Referencia absoluta: Una referencia dentro de una función que está bloqueada para que las filas y columnas no cambien si se copia la función

Control de acceso: Características como la protección por contraseña, los permisos de usuario y la encriptación que se utilizan para proteger una hoja de cálculo.

Exactitud: El grado en que los datos se ajustan a la entidad real que se está midiendo o describiendo

Pregunta orientada a la acción: Una pregunta cuyas respuestas conducen al cambio

Metadatos administrativos: Metadatos que indican la fuente técnica de un recurso digital

Agenda : Lista de citas programadas

Agregación: El proceso de reunir o juntar muchas piezas separadas en un todo

Algoritmo: Un proceso o conjunto de reglas seguidas para una tarea específica

Asignación de alias: Denominación temporal de una tabla o columna en una consulta para facilitar su lectura y escritura

Texto alternativo: Texto que ofrece una alternativa al contenido no textual, como imágenes y vídeos

Destrezas analíticas: Cualidades y características asociadas a la utilización de hechos para resolver problemas

Pensamiento analítico: El proceso de identificar y definir un problema, para luego resolverlo utilizando datos de forma organizada y paso a paso

Anotación: Texto que explica brevemente los datos o ayuda a centrar la atención del público en un aspecto concreto de los datos de una visualización

Array: Una colección de valores en las celdas de una hoja de cálculo

Atributo : Característica o cualidad de los Datos que se utiliza para etiquetar una columna de una tabla

Archivo de audio: Almacenamiento de audio digitalizado normalmente en formato MP3, AAC u otro formato comprimido

AVERAGE : Función de una hoja de cálculo que devuelve una media de los valores de un rango seleccionado

AVERAGEIF: Una función de hoja de cálculo que devuelve la media de todos los valores de las celdas de un rango determinado que cumplen una condición especificada B

Fuente de datos erróneos: Una fuente de Datos que no es fiable, original, completa, actual y citada (ROCCC)

Equilibrio: Principio de diseño que consiste en crear atractivo estético y claridad en una visualización de datos mediante la distribución uniforme de los elementos visuales

Gráfico de barras: Una visualización de datos que utiliza el tamaño para contrastar y comparar dos o más valores

Sesgo : Preferencia consciente o subconsciente a favor o en contra de una persona, grupo de personas o cosa

Big data: Conjuntos de datos grandes y complejos que suelen abarcar largos periodos de tiempo y que permiten a los analistas de datos abordar problemas empresariales de gran alcance.

Datos booleanos: Tipo de datos con sólo dos valores posibles, normalmente verdadero o falso

Bordes : Líneas que se pueden añadir alrededor de dos o más celdas de una hoja de cálculo

Tarea empresarial: La cuestión o el problema que el análisis de datos resuelve para un negocio do

Campo calculado: Un nuevo campo dentro de una tabla dinámica que lleva a cabo ciertos cálculos basados en los valores de otros campos

Cálculo: Una rama de las matemáticas que implica el estudio de las tasas de cambio y los cambios entre valores que están relacionados por una función

CASE : Una sentencia SQL que devuelve registros que cumplen condiciones mediante la inclusión de una sentencia if/then en una consulta

CAST: Una función SQL que convierte datos de un tipo de datos a otro

Causalidad: Cuando una acción conduce directamente a un resultado, como una relación causa-efecto

Referencia de celda: Célula o rango de celdas de una hoja de cálculo que se utiliza normalmente en fórmulas y funciones

Registro de cambios: Un archivo que contiene una lista ordenada cronológicamente de las modificaciones realizadas en un proyecto

Canal: Aspecto visual o variable que representa características de los datos en una visualización

Gráfico: Una representación gráfica de los datos de una hoja de cálculo

Datos limpios: Datos completos, correctos y relevantes para el problema que se está resolviendo

Nube: Lugar donde se guardan los Datos en línea, en lugar del disco duro de una computadora

Clúster: Una colección de puntos de datos en una visualización de datos con valores similares

COALESCE: Una función SQL que devuelve valores no nulos en una lista

Compatibilidad : capacidad de dos o más conjuntos de datos para trabajar juntos

Exhaustividad: Grado en que los Datos contienen todos los componentes o medidas deseados

CONCAT: Una función SQL que suma cadenas para crear nuevas cadenas de texto que pueden utilizarse como claves únicas

CONCATENAR : Una función de hoja de cálculo que une dos o más cadenas de texto

Formato condicional: Una herramienta de la hoja de cálculo que cambia el aspecto de las celdas cuando los valores cumplen unas condiciones específicas

Intervalo de confianza: Rango de valores que transmite la probabilidad de que una estimación estadística refleje la población

Nivel de confianza: La probabilidad de que el tamaño de una muestra refleje con exactitud la población mayor

Sesgo de confirmación: La tendencia a buscar o interpretar la información de forma que confirme las creencias preexistentes

Consentimiento: Aspecto de la ética de los datos que presupone el derecho de una persona a saber cómo y por qué se utilizarán sus datos personales antes de aceptar proporcionarlos

Coherencia: El grado en que los datos son repetibles desde diferentes puntos de entrada o recogida

Contexto: La condición en la que algo existe o sucede

Datos continuos: Datos que se miden y pueden tener casi cualquier valor numérico

CONVERT : Función SQL que cambia la unidad de medida de un valor en los datos

Cookie: Pequeño archivo almacenado en una computadora que contiene información sobre sus usuarios

CORRELACIÓN: La medida del grado en que dos variables cambian en relación con la otra

COUNT : Función de una hoja de cálculo que cuenta el número de celdas de un rango

COUNTA : Función de una hoja de cálculo que cuenta el número total de valores de un rango que cumplen unos criterios especificados

COUNTIF: Una función de hoja de cálculo que devuelve el número de celdas de un rango que coinciden con un valor especificado

COUNT DISTINCT : Una función SQL que sólo devuelve los valores distintos de un rango especificado

CREATE TABLE: Una cláusula SQL que añade una tabla temporal a una base de datos que puede ser utilizada por varias personas

Validación de campos cruzados: Un proceso que garantiza que se cumplen determinadas condiciones para varios campos de datos

Archivo CSV (valores separados por coma): Un archivo de texto delimitado que utiliza una coma para separar los Valores

Moneda: Aspecto de la ética de los datos que presupone que las personas deben ser conscientes de las transacciones financieras derivadas del uso de sus datos personales y de la magnitud de dichas transacciones D

Panel: Una herramienta que monitoriza los datos entrantes en directo

Datos: Una colección de hechos

Agregación de datos: El proceso de recopilar datos de múltiples fuentes y combinarlos en una única colección resumida

Análisis de datos: La recopilación, transformación y organización de datos con el fin de extraer conclusiones, hacer predicciones e impulsar la toma de decisiones informadas

Proceso de análisis de datos: Las seis fases de preguntar, preparar, procesar, analizar, compartir y actuar cuyo propósito es obtener estadísticas que impulsen la toma de decisiones informadas

Analista de datos: Persona que recopila, transforma y organiza los datos para extraer conclusiones, hacer predicciones e impulsar la toma de decisiones con conocimiento de causa

Analítica de datos: La ciencia de los datos

Anonimización de datos: El proceso de proteger los datos privados o sensibles de las personas eliminando la información que las identifica

Sesgo de los datos: Cuando una preferencia a favor o en contra de una persona, grupo de personas o cosa sesga sistemáticamente los resultados del análisis de datos en una dirección determinada

Composición de datos: El proceso de combinar las partes individuales en una visualización y mostrarlas juntas como un todo

Limitaciones de datos: Los criterios que determinan si un dato está limpio y es válido

Diseño de datos: Cómo se organiza la Información

Toma de decisiones basada en datos: El uso de los datos para orientar la estrategia empresarial

Ecosistema de datos: Los diversos elementos que interactúan entre sí para producir, gestionar, almacenar, organizar, analizar y compartir datos

Elemento de datos: Una pieza de información de en un conjunto de datos

Ingeniero de datos: Profesional que transforma los datos en un formato útil para el análisis y los dota de una infraestructura fiable

Ética de los datos: Estándares bien fundados de lo correcto y lo incorrecto que dictan cómo se recopilan, comparten y utilizan los Datos

Gobierno de datos: Proceso para garantizar la gestión formal de los recursos de datos de una empresa

Toma de decisiones inspirada en datos: Exploración de diferentes fuentes de datos para averiguar qué tienen en común

Integridad de datos: La exactitud, exhaustividad, coherencia y fiabilidad de los Datos a lo largo de su ciclo de vida

Interoperabilidad de los datos: La capacidad de integrar datos de múltiples fuentes y un factor clave que conduce al éxito del uso de datos abiertos entre empresas y gobiernos

Ciclo de vida de los datos: La secuencia de etapas que experimentan los datos, que incluyen la planificación, la captura, la gestión, el análisis, el archivo y la destrucción

Manipulación de datos: El proceso de modificar los Datos para hacerlos más organizados y fáciles de leer

Mapeo de datos: El proceso de hacer coincidir campos de una fuente de datos con otra

Fusión de datos: El proceso de combinar dos o más conjuntos de datos en uno solo

Modelo de datos: Una herramienta para organizar los elementos de datos y cómo se relacionan entre sí

Privacidad de los datos: Preservación de la información de un sujeto de datos cada vez que se produce una transacción de datos

Rango de datos: Valores numéricos que se encuentran entre valores máximos y mínimos predefinidos

Replicación de datos: El proceso de almacenamiento de Datos en múltiples ubicaciones

Ciencia de datos: Campo de estudio que utiliza datos brutos para crear nuevas formas de modelar y comprender lo desconocido.

Seguridad de los datos: Protección de los Datos contra el acceso no autorizado o la corrupción mediante la adopción de medidas de seguridad

Estrategia de datos: La gestión de las personas, los procesos y las herramientas utilizadas en el análisis de datos

Transferencia de datos: El proceso de copiar datos de un dispositivo de almacenamiento a la memoria de una computadora o de una computadora a otra

Tipo de datos: Atributo que describe un dato en función de sus Valores, su lenguaje de programación o las operaciones que puede realizar

Validación de datos: Una herramienta para comprobar la exactitud y la calidad de los Datos

Proceso de validación de datos: Proceso de comprobar y volver a comprobar la calidad de los Datos para que sean completos, exactos, seguros y coherentes

Visualización de datos: La representación gráfica de los Datos

Especialista en Almacenamiento de datos: Un profesional que desarrolla procesos y procedimientos para almacenar y organizar los Datos de forma eficaz

Base de datos: Una colección de datos almacenados en un sistema informático

Conjunto de datos: Una colección de datos que pueden manipularse o analizarse como una unidad

DATEDIF: Función de una hoja de cálculo que calcula el número de días, meses o años entre dos fechas

Árbol de decisiones: Herramienta que ayuda a los analistas a tomar decisiones sobre las características críticas de una visualización

Delimitador: Carácter que indica el principio o el final de un elemento de Datos

Metadatos descriptivos: Metadatos que describen un dato y pueden utilizarse para identificarlo en un momento posterior

Design thinking: Un proceso utilizado para resolver problemas complejos de una forma centrada en el usuario

Foto digital: Una imagen electrónica o basada en computadora generalmente en formato BMP o JPG

Datos sucios: Datos incompletos, incorrectos o irrelevantes para el problema a resolver

Datos discretos: Datos que se cuentan y tienen un número limitado de valores

DISTINTO: Palabra clave que se añade a una sentencia SELECT de SQL para recuperar sólo las entradas no duplicadas

Gráfico de distribución: Visualización de datos que muestra la frecuencia de varios resultados en una muestra.

DROP TABLE: cláusula SQL que elimina una tabla temporal de una base de datos

Datos duplicados: Cualquier registro que inadvertidamente comparta datos con otro registro

Visualizaciones dinámicas: Visualizaciones de datos que son interactivas o cambian con el tiempo E

Énfasis: Principio de diseño consistente en disponer los elementos visuales para centrar la atención del público en la información importante de una visualización de datos

Ecuación: Cálculo que implica suma, resta, multiplicación o división (también llamada expresión matemática)

Tasa de respuesta estimada: El número medio de personas que suelen completar una encuesta

Ética: Estándares bien fundados de lo correcto y lo incorrecto que prescriben lo que los seres humanos deben hacer, normalmente en términos de derechos, obligaciones, beneficios para la sociedad, equidad o virtudes específicas

Sesgo del experimentador: La tendencia de distintas personas a observar las cosas de forma diferente (Consulte Sesgo del observador)

Datos externos: Datos que viven, y se generan, fuera de una organización F

Equidad: Calidad del análisis de datos que no crea ni refuerza sesgos.

Campo: Una sola pieza de información de una fila o columna de una hoja de cálculo; en una tabla de datos, normalmente una columna de la tabla

Longitud de campo: Una herramienta para determinar cuántos caracteres pueden introducirse en un campo de una hoja de cálculo

Controlador de relleno: Cuadro situado en la esquina inferior derecha de una celda seleccionada de una hoja de cálculo que puede arrastrarse por las celdas vecinas para continuar una instrucción

Filtrado: El proceso de mostrar sólo los Datos que cumplen un criterio especificado y ocultar el resto

Buscar y reemplazar: Una herramienta que encuentra un término de búsqueda especificado y lo sustituye por otra cosa

Datos de primera fuente: Datos recopilados por un individuo o grupo utilizando sus propios recursos

Flotante: Un número que contiene un decimal

Clave foránea: Campo dentro de una tabla de base de datos que es una clave primaria en otra tabla (Consulte clave primaria)

Fórmula: Un conjunto de instrucciones utilizadas para realizar un cálculo utilizando los datos de una hoja de cálculo

FROM: La sección de una consulta que indica de qué tabla(s) extraer los datos

Función: Comando preestablecido que realiza automáticamente un proceso o tarea específicos utilizando los Datos de una hoja de cálculo GRAMO

Análisis de déficits: Método para examinar y evaluar el estado actual de un proceso con el fin de identificar oportunidades de mejora en el futuro

Reglamento General de Protección de Datos de la Unión Europea (RGPD): Órgano normativo de la Unión Europea creado para ayudar a proteger a las personas y sus Datos

Geolocalización: La ubicación geográfica de una persona o dispositivo mediante información digital

Fuente de datos correctos: Una fuente de Datos que es fiable, original, completa, actual y citada (ROCCC)

GROUP BY: Una cláusula SQL que agrupa las filas que tienen los mismos valores de una tabla en filas de resumen h

HAVING : Una cláusula SQL que añade un filtro a una consulta en lugar de la tabla subyacente que sólo se puede utilizar con funciones de agregación

Encabezado: La primera fila de una hoja de cálculo que etiqueta el tipo de datos de cada columna

Encabezado: Texto en la parte superior de una visualización que comunica los datos que se están presentando

Mapa de calor: Visualización de datos que utiliza el contraste de colores para comparar las categorías de un conjunto de datos

Histograma: Visualización de datos que muestra la frecuencia con la que los valores de los datos se sitúan en determinados rangos

Testeo de hipótesis: Un proceso para determinar si una encuesta o experimento tiene resultados significativos I

Datos incompletos: Datos a los que les faltan campos importantes

Datos incoherentes: Datos que utilizan diferentes formatos para representar lo mismo

Datos incorrectos/inexactos: Datos que están completos pero son inexactos

INNER JOIN : Función SQL que devuelve registros con valores coincidentes en ambas tablas

Consulta interna: Una Subconsulta SQL que está dentro de otra sentencia SQL

Datos internos: Datos que viven dentro de los propios sistemas de una empresa

Sesgo de interpretación: La tendencia a interpretar las situaciones ambiguas de forma positiva o negativa J

JOIN : Una función SQL que se utiliza para combinar filas de dos o más tablas basándose en una columna relacionada K L

Etiqueta: Texto en una visualización que identifica un valor o describe una escala

Pregunta principal: Pregunta que orienta a las personas hacia una respuesta determinada

LEFT: Función que devuelve un número determinado de caracteres de la parte izquierda de una cadena de texto

LEFT JOIN : Una función SQL que devolverá todos los registros de la tabla izquierda y sólo los registros coincidentes de la tabla derecha

Leyenda: Una herramienta que identifica el significado de varios elementos en una Visualización de datos

LEN: Función que devuelve la longitud de una cadena de texto contando el número de caracteres que contiene

Longitud: El número de caracteres de una cadena de texto

LIMIT: Una cláusula SQL que especifica el número máximo de registros devueltos en una consulta

Gráfico de líneas: Visualización de datos que utiliza una o varias líneas para mostrar los cambios en los Datos a lo largo del tiempo

Datos en formato largo: Conjunto de datos en el que cada fila es un punto temporal por sujeto, por lo que cada sujeto tiene datos en varias filas M

Obligatorio: Un valor de datos que no puede dejarse en blanco o vacío

Mapa: Una visualización de datos que organiza los datos geográficamente

Margen de error: La cantidad máxima que se espera que difieran los resultados de la muestra de los de la población real

Marca: Objeto visual en una visualización de datos, como un punto, una línea o una forma

MATCH: Función de una hoja de cálculo utilizada para localizar la posición de un valor de búsqueda específico

Expresión matemática: Un cálculo que implica suma, resta, multiplicación o división (también llamado ecuación)

Función matemática: Una función que se utiliza como parte de una fórmula matemática

MAX : Una función que devuelve el mayor valor numérico de un rango de celdas

MAXIFS: Función de una hoja de cálculo que devuelve el valor máximo de un rango dado que cumple una condición especificada

Pregunta medible: Una pregunta cuyas respuestas pueden cuantificarse y evaluarse

Modelo mental: Proceso de pensamiento y enfoque de un analista de datos ante un problema

Mentor: Alguien que comparte conocimientos, habilidades y experiencia para ayudar a otro a crecer tanto profesional como personalmente

Fusión: Acuerdo que une dos organizaciones en una sola nueva

Metadatos: Datos sobre datos

Repositorio de metadatos: Base de datos creada para almacenar metadatos

Métricas: Un tipo de datos único y cuantificable que se utiliza para la medición

Objetivo métrico : Objetivo cuantificable fijado por una empresa y evaluado mediante métricas

MID : Una función que devuelve un segmento de la mitad de una cadena de texto

MIN : Función de una hoja de cálculo que devuelve el valor numérico más pequeño de un rango de celdas

MINIFS : Una función de hoja de cálculo que devuelve el valor mínimo de un rango dado que cumple una condición especificada

Modulo: Operador (%) que devuelve el resto cuando se divide un número por otro

Movimiento: Principio de diseño que consiste en disponer los elementos visuales para guiar la mirada del público de una parte a otra de una visualización de datos norte

Convenciones de nomenclatura: Pautas coherentes que describen el contenido, la fecha de creación y la versión de un archivo en su nombre

Narrativa : (Referirse a la Historia)

Redes: Establecer relaciones conociendo a gente tanto en persona como en línea

Datos nominales: Un tipo de datos cualitativos que se categorizan sin un orden establecido

Base de datos normalizada: Base de datos en la que sólo se almacenan datos relacionados en cada tabla

Notebook: Entorno de programación interactivo y editable para crear Informes de datos y mostrar las habilidades en materia de datos

Nulo: Indicación de que un valor no existe en un conjunto de datos oh

Observación: Los atributos que describen un dato contenido en una fila de una tabla

Sesgo del observador: La tendencia de distintas personas a observar las cosas de forma diferente (también llamado sesgo del experimentador)

Datos abiertos: Datos que están a disposición del público

Apertura: Aspecto de la ética de los datos que promueve el libre acceso, uso y puesta en común de los datos

Operador: Símbolo que nombra la operación o el cálculo que debe realizarse

ORDER BY: Una cláusula SQL que ordena los resultados devueltos en una consulta

Orden de las operaciones: Uso de paréntesis para agrupar valores de una hoja de cálculo con el fin de aclarar el orden en que deben realizarse las operaciones

Datos ordinales: Datos cualitativos con un orden o escala establecidos

Datos desactualizados: Cualquier dato que haya sido sustituido por información más reciente y precisa

OUTER JOIN : Función SQL que combina RIGHT y LEFT JOIN para devolver todos los registros coincidentes de ambas tablas

Consulta externa: Una sentencia SQL que contiene una subconsulta

Responsabilidad: Aspecto de la ética de los datos que presupone que los individuos son propietarios de los datos brutos que proporcionan y tienen el control principal sobre su uso, procesamiento y puesta en común. PAG

Patrón: Principio de diseño que consiste en utilizar elementos visuales similares para mostrar tendencias y relaciones en la visualización de datos

Gráfico circular: Visualización de datos que utiliza segmentos de un círculo para representar las proporciones de cada categoría de datos en comparación con el total

Tabla dinámica: Gráfico creado a partir de los campos de una tabla dinámica

Tabla dinámica: Herramienta de resumen de datos que se utiliza para clasificar, reorganizar, agrupar, contar, totalizar o promediar datos

Píxel: En imagen digital, pequeña área de iluminación en una pantalla de visualización que, al combinarse con otras áreas adyacentes, forma una imagen digital

Población: En Analítica de datos, todos los valores de datos posibles en un conjunto de datos

Atributos preatencionales: Elementos de una visualización de datos que un público reconoce automáticamente sin esfuerzo consciente

Clave primaria: Un identificador en una base de datos que hace referencia a una columna en la que cada valor es único (Referirse a clave foránea)

Dominio del problema: El ámbito de análisis que abarca todas las actividades que afectan o se ven afectadas por un problema

Tipos de problemas: Los diversos problemas a los que se enfrentan los analistas de datos, como categorizar cosas, descubrir conexiones, encontrar patrones, identificar temas, hacer predicciones y detectar algo inusual

Margen de beneficio: Porcentaje que indica cuántos céntimos de beneficio se han generado por cada dólar de venta

Proporción: Principio de diseño que consiste en utilizar el tamaño relativo y la disposición de los elementos visuales para mostrar la información en una visualización de datos q

Datos cualitativos: Medida subjetiva y explicativa de una Calidad o característica

Datos cuantitativos: Una medida específica y objetiva, como un número, una cantidad o un Rango

Consulta: Una solicitud de datos o información de una base de datos

Lenguaje de consulta: Lenguaje de programación de una computadora utilizado para comunicarse con una base de datos R

R: Lenguaje de programación utilizado para el análisis estadístico, la visualización y otros análisis de datos.

Muestreo aleatorio: Forma de seleccionar una muestra de una población de modo que todos los tipos posibles de la muestra tengan las mismas posibilidades de ser elegidos

Rango: Conjunto de dos o más celdas de una hoja de cálculo

Clasificación: Un sistema para situar los valores de un conjunto de datos dentro de una escala de logros o estatus

Registro A: Una colección de datos relacionados en una tabla de datos, normalmente sinónimo de fila

Redundancia: Cuando el mismo dato se almacena en dos o más lugares

Reformulación: El proceso de replantear un problema o desafío, y luego redirigirlo hacia una posible resolución

Expresión regular (RegEx) : regla que establece que los valores de una tabla deben coincidir con un patrón prescrito

Base de datos relacional: Base de datos que contiene una serie de tablas que pueden conectarse para formar relaciones

Relatividad: El proceso de considerar las observaciones en relación o proporción con otra cosa

Pregunta relevante: Una pregunta que tiene importancia para el problema que hay que resolver

Quitar duplicados: Herramienta de hoja de cálculo que busca y elimina automáticamente las entradas duplicadas de una hoja de cálculo

Repetición: El principio de diseño de repetir elementos visuales para demostrar el significado en una Visualización de datos

Informe: Una colección estática de Datos que se entrega periódicamente a las partes interesadas

Retorno de la inversión (ROI): Una fórmula que utiliza las métricas de inversión y beneficio para evaluar el éxito de una inversión

Ingresos: La cantidad total de ingresos generados por la venta de bienes o servicios

Ritmo: El principio de diseño que consiste en crear movimiento y flujo en una visualización de datos para atraer al público

RIGHT : Función que devuelve un número determinado de caracteres de la parte derecha de una cadena de texto

RIGHT JOIN : Una función SQL que devolverá todos los registros de la tabla derecha y sólo los registros coincidentes de la izquierda.

Causa raíz: La razón por la que se produce un problema

ROUND : Una función SQL que devuelve un número redondeado a un determinado número de decimales S

Muestra: En Analítica de datos, segmento de una población que es representativo de toda la población

Sesgo del muestreo: Representación excesiva o insuficiente de determinados miembros de una población como resultado de trabajar con una muestra que no es representativa del conjunto de la población

Diagrama de dispersión: Visualización de datos que representa las relaciones entre diferentes variables con puntos de datos individuales sin una línea de conexión

Schema: Una forma de describir cómo se organiza algo, como los Datos

Alcance del trabajo (SOW): Un esquema acordado de las tareas que deben realizarse durante un proyecto

Datos de segunda fuente: Datos recopilados por un grupo directamente de su público y luego vendidos

SELECT INTO: La sección de una consulta que indica de qué columna(s) extraer los datos

SELECT INTO : Cláusula SQL que copia los datos de una tabla en una tabla temporal sin añadir la nueva tabla a la base de datos

Microdatos: Puntos de datos pequeños y específicos que suelen referirse a un breve periodo de tiempo y que son útiles para tomar decisiones cotidianas

Metodología SMART: Herramienta para determinar la eficacia de una pregunta en función de si es específica, medible, orientada a la acción, pertinente y limitada en el tiempo.

Redes sociales: Sitios web y aplicaciones a través de los cuales los usuarios crean y comparten contenidos o participan en redes sociales

Habilidades interpersonales: Rasgos y comportamientos no técnicos relacionados con la forma de trabajar de las personas

Rango de ordenación: Función del menú de una hoja de cálculo que ordena un rango especificado y conserva las celdas fuera del rango

Ordenar hoja: Función del menú de una hoja de cálculo que ordena todos los datos según la Clasificación de una columna específica ordenada y mantiene los datos juntos en todas las filas

Ordenación: Proceso de organizar los datos en un orden significativo para facilitar su comprensión, análisis y visualización

Pregunta específica: Pregunta simple, significativa y centrada en un único tema o en unas pocas ideas estrechamente relacionadas

SPLIT : Función de una hoja de cálculo que divide el texto en torno a un carácter especificado y coloca cada fragmento en una celda nueva y separada

Patrocinador: Defensor profesional que se compromete a hacer avanzar la carrera de otro

Hoja de cálculo: Una hoja de cálculo digital

SQL : (Consulte Lenguaje de Consulta Estructurado)

Interesados: Personas que invierten tiempo y recursos en un proyecto y están interesadas en su resultado

Visualización estática: Una visualización de datos que no cambia con el tiempo a menos que se edite

Poder estadístico : La probabilidad de que una prueba de significación reconozca un efecto presente

Significación estadística: La probabilidad de que los resultados de la muestra no se deban al azar

Estadísticas: El estudio de cómo recopilar, analizar, resumir y presentar datos

Historia: La narración de una presentación de datos que la hace significativa e interesante

Tipo de datos de cadena: Secuencia de caracteres y signos de puntuación que contiene información textual (también llamado tipo de datos de texto)

Metadatos estructurales: Metadatos que indican cómo está organizada una pieza de datos y si forma parte de una o más colecciones de datos

Datos estructurados: Datos organizados en un formato determinado, como filas y columnas

Lenguaje de Consulta Estructurada: Lenguaje de programación informática utilizado para comunicarse con una base de datos

Pensamiento estructurado: El proceso de reconocer el problema o la situación actual, organizar la información disponible, revelar lagunas y oportunidades e identificar opciones

Subconsulta: Una consulta SQL que está anidada dentro de una consulta mayor

SUBSTR : Una función SQL que extrae una subcadena de una variable de cadena

Subcadena: Un subconjunto de una cadena de texto

Subtítulo: Texto que apoya un titular añadiendo contexto y descripción

SUM: Una función que suma los valores de un rango de celdas seleccionado

SUMIF: Una función de hoja de cálculo que añade datos numéricos basándose en una condición

Tabla de resumen: Una tabla utilizada para resumir información estadística sobre datos

SUMPRODUCTO: Una función que multiplica matrices y devuelve la suma de esos productos

Sintaxis: La estructura predeterminada de un lenguaje que incluye todas las palabras, símbolos y signos de puntuación necesarios, así como su correcta colocación T

Tableau: Una plataforma de inteligencia empresarial y análisis que ayuda a las personas a visualizar, comprender y tomar decisiones con datos

Mentalidad técnica: La capacidad de dividir las cosas en pasos o piezas más pequeñas y trabajar con ellas de forma ordenada y lógica

Tabla temporal: Una tabla de base de datos que se crea y existe temporalmente en un servidor de base de datos

Tipo de datos de texto: Secuencia de caracteres y signos de puntuación que contiene información textual (también denominado Tipo de datos de cadena)

Cadena de texto: Un grupo de caracteres dentro de una celda, compuesto en la mayoría de los casos por letras

Datos de terceros: Datos proporcionados por fuentes externas que no los recogieron directamente

Pregunta con límite de tiempo: Pregunta que especifica un marco temporal a estudiar

Transparencia de la transacción: El aspecto de la Ética de los datos que presume que todas las actividades de procesamiento de datos y algoritmos deben ser explicables y comprensibles por la persona que proporciona los datos

Habilidades transferibles: Habilidades y cualidades que pueden transferirse de un trabajo o industria a otro

TRIM : Función que elimina los espacios iniciales, finales y repetidos de los datos

Tasa de rotación: La tasa a la que los empleados abandonan voluntariamente una empresa

Conversión de tipos: Conversión de datos de un tipo a otro Ud.

Muestreo imparcial: Cuando la muestra de la población que se mide es representativa del conjunto de la población

Guiones bajos : Líneas utilizadas para subrayar palabras y conectar caracteres de texto

Pregunta injusta: Pregunta que hace suposiciones o es difícil de responder con sinceridad

Único: Un valor que no puede tener un duplicado

Oficina del Censo de los Estados Unidos: Agencia del Departamento de Comercio de EE.UU. que es el principal proveedor nacional de datos de calidad sobre su población y su economía

Unidad: Principio de diseño consistente en utilizar elementos visuales que se complementan entre sí para crear atractivo estético y claridad en una visualización de datos

Datos no estructurados: Datos que no están organizados de ninguna manera fácilmente identificable V

Validez: El grado en que los datos se ajustan a las restricciones cuando se introducen, recopilan o crean

VALUE : Función de una hoja de cálculo que convierte una cadena de texto que representa un número en un valor numérico

Variedad: Principio de diseño que consiste en utilizar distintos tipos de elementos visuales en una visualización de datos para captar la atención del público

Verificación: Un proceso para confirmar que un esfuerzo de limpieza de datos fue bien ejecutado y que los datos resultantes son precisos y fiables

Archivo de vídeo: Una colección de imágenes, archivos de audio y otros datos normalmente codificados en un formato comprimido como MP4, MV4, MOV, AVI o FLV

Formato visual: La apariencia de una visualización de datos que le confiere estructura y atractivo estético

Visualización : (Consulte Visualización de datos)

VLOOKUP : Función de una hoja de cálculo que busca verticalmente un determinado valor en una columna para devolver la información correspondiente W.

WHERE: La sección de una consulta que especifica los criterios que deben cumplir los datos solicitados

Datos en formato ancho: Conjunto de datos en el que cada sujeto de datos tiene una única fila con varias columnas para contener los valores de varios atributos del sujeto

CON : Una cláusula SQL que crea una tabla temporal que puede consultarse varias veces

Organización Mundial de la Salud: Organización cuya función principal es dirigir y coordinar la sanidad internacional dentro del sistema de las Naciones Unidas incógnita

Eje X: La línea horizontal de un gráfico situada normalmente en la parte inferior, que suele utilizarse para representar escalas temporales y categorías discretas Y

Eje Y: La línea vertical de un gráfico situada normalmente a la izquierda, que suele utilizarse para representar frecuencias y otras variables numéricas z