Términos del glosario del Módulo 6.2 - guillermopetcho/Coursera-Certificate----Data-Analytics-Google GitHub Wiki
Términos y definiciones para el Curso 6, Módulo 2
Gráfico de área: Visualización de datos que utiliza puntos de datos individuales para una variable cambiante conectados por una línea continua con un área rellena debajo
Diagrama de caja: Visualización de datos que muestra la distribución de valores a lo largo de un eje X
Gráfico de burbujas : Visualización de datos que muestra puntos de datos individuales como burbujas, comparando valores numéricos por su tamaño relativo.
Gráfico de viñetas: Visualización de datos que muestra los datos como un gráfico de barras horizontales que se mueven hacia un valor deseado.
Vista en círculo: Una visualización de datos que muestra la fuerza comparativa de los datos
Gráfico de columnas : Una visualización de datos que utiliza puntos de datos individuales para una variable cambiante, representados como columnas verticales
Gráfico combinado: Una visualización de datos que combina más de un tipo de visualización
Mapa de densidad : Visualización de datos que representa concentraciones, con colores que representan el número o la frecuencia de puntos de datos en un área determinada de un mapa
Gráfico de distribución: Visualización de datos que muestra la frecuencia de varios resultados en una muestra.
Paleta de color divergente: Un tema de color que muestra dos rangos de valores de datos utilizando dos tonalidades diferentes, con una intensidad de color que representa la magnitud de los valores
Gráfico de anillos : Visualización de datos en la que los segmentos de un anillo representan valores de datos que suman un todo
Mapa coroplético: Visualización de datos que colorea zonas de un mapa basándose en medidas o dimensiones
Diagrama de Gantt: Visualización de datos que muestra la duración de eventos o actividades en una línea de tiempo
Gráfico de calibre : Una visualización de datos que muestra un único resultado dentro de un rango progresivo de valores
Resaltar tabla: Una visualización de datos que utiliza el formato condicional y el color en una tabla
Gráfico de burbujas agrupadas: Una visualización de datos que muestra los datos en círculos agrupados
Mapa de símbolos: Una visualización de datos que muestra una marca sobre una longitud y latitud determinadas Términos y definiciones de módulos anteriores A
Pruebas A/B: El proceso de probar dos variaciones de la misma página web para determinar qué página tiene más éxito a la hora de atraer tráfico de usuarios y generar Ingresos
Referencia absoluta: Una referencia dentro de una función que está bloqueada para que las filas y columnas no cambien si se copia la función
Control de acceso: Características como la protección por contraseña, los permisos de usuario y la encriptación que se utilizan para proteger una hoja de cálculo.
Exactitud: El grado en que los datos se ajustan a la entidad real que se está midiendo o describiendo
Pregunta orientada a la acción: Una pregunta cuyas respuestas conducen al cambio
Metadatos administrativos: Metadatos que indican la fuente técnica de un recurso digital
Agenda : Lista de citas programadas
Agregación: El proceso de reunir o juntar muchas piezas separadas en un todo
Algoritmo: Un proceso o conjunto de reglas seguidas para una tarea específica
Asignación de alias: Denominación temporal de una tabla o columna en una consulta para facilitar su lectura y escritura
Texto alternativo: Texto que ofrece una alternativa al contenido no textual, como imágenes y vídeos
Destrezas analíticas: Cualidades y características asociadas a la utilización de hechos para resolver problemas
Pensamiento analítico: El proceso de identificar y definir un problema, para luego resolverlo utilizando datos de forma organizada y paso a paso
Anotación: Texto que explica brevemente los datos o ayuda a centrar la atención del público en un aspecto concreto de los datos de una visualización
Array: Una colección de valores en las celdas de una hoja de cálculo
Atributo : Característica o cualidad de los Datos que se utiliza para etiquetar una columna de una tabla
Archivo de audio: Almacenamiento de audio digitalizado normalmente en formato MP3, AAC u otro formato comprimido
AVERAGE : Función de una hoja de cálculo que devuelve una media de los valores de un rango seleccionado
AVERAGEIF: Una función de hoja de cálculo que devuelve la media de todos los valores de las celdas de un rango determinado que cumplen una condición especificada B
Fuente de datos erróneos: Una fuente de Datos que no es fiable, original, completa, actual y citada (ROCCC)
Equilibrio: Principio de diseño que consiste en crear atractivo estético y claridad en una visualización de datos mediante la distribución uniforme de los elementos visuales
Gráfico de barras: Una visualización de datos que utiliza el tamaño para contrastar y comparar dos o más valores
Sesgo : Preferencia consciente o subconsciente a favor o en contra de una persona, grupo de personas o cosa
Big data: Conjuntos de datos grandes y complejos que suelen abarcar largos periodos de tiempo y que permiten a los analistas de datos abordar problemas empresariales de gran alcance.
Datos booleanos: Tipo de datos con sólo dos valores posibles, normalmente verdadero o falso
Bordes : Líneas que se pueden añadir alrededor de dos o más celdas de una hoja de cálculo
Tarea empresarial: La cuestión o el problema que el análisis de datos resuelve para un negocio do
Campo calculado: Un nuevo campo dentro de una tabla dinámica que lleva a cabo ciertos cálculos basados en los valores de otros campos
Cálculo: Una rama de las matemáticas que implica el estudio de las tasas de cambio y los cambios entre valores que están relacionados por una función
CASE : Una sentencia SQL que devuelve registros que cumplen condiciones mediante la inclusión de una sentencia if/then en una consulta
CAST: Una función SQL que convierte datos de un tipo de datos a otro
Causalidad: Cuando una acción conduce directamente a un resultado, como una relación causa-efecto
Referencia de celda: Célula o rango de celdas de una hoja de cálculo que se utiliza normalmente en fórmulas y funciones
Registro de cambios: Un archivo que contiene una lista ordenada cronológicamente de las modificaciones realizadas en un proyecto
Canal: Aspecto visual o variable que representa características de los datos en una visualización
Gráfico: Una representación gráfica de los datos de una hoja de cálculo
Datos limpios: Datos completos, correctos y relevantes para el problema que se está resolviendo
Nube: Lugar donde se guardan los Datos en línea, en lugar del disco duro de una computadora
Clúster: Una colección de puntos de datos en una visualización de datos con valores similares
COALESCE: Una función SQL que devuelve valores no nulos en una lista
Compatibilidad : capacidad de dos o más conjuntos de datos para trabajar juntos
Exhaustividad: Grado en que los Datos contienen todos los componentes o medidas deseados
CONCAT: Una función SQL que suma cadenas para crear nuevas cadenas de texto que pueden utilizarse como claves únicas
CONCATENAR : Una función de hoja de cálculo que une dos o más cadenas de texto
Formato condicional: Una herramienta de la hoja de cálculo que cambia el aspecto de las celdas cuando los valores cumplen unas condiciones específicas
Intervalo de confianza: Rango de valores que transmite la probabilidad de que una estimación estadística refleje la población
Nivel de confianza: La probabilidad de que el tamaño de una muestra refleje con exactitud la población mayor
Sesgo de confirmación: La tendencia a buscar o interpretar la información de forma que confirme las creencias preexistentes
Consentimiento: Aspecto de la ética de los datos que presupone el derecho de una persona a saber cómo y por qué se utilizarán sus datos personales antes de aceptar proporcionarlos
Coherencia: El grado en que los datos son repetibles desde diferentes puntos de entrada o recogida
Contexto: La condición en la que algo existe o sucede
Datos continuos: Datos que se miden y pueden tener casi cualquier valor numérico
CONVERT : Función SQL que cambia la unidad de medida de un valor en los datos
Cookie: Pequeño archivo almacenado en una computadora que contiene información sobre sus usuarios
CORRELACIÓN: La medida del grado en que dos variables cambian en relación con la otra
COUNT : Función de una hoja de cálculo que cuenta el número de celdas de un rango
COUNTA : Función de una hoja de cálculo que cuenta el número total de valores de un rango que cumplen unos criterios especificados
COUNTIF: Una función de hoja de cálculo que devuelve el número de celdas de un rango que coinciden con un valor especificado
COUNT DISTINCT : Una función SQL que sólo devuelve los valores distintos de un rango especificado
CREATE TABLE: Una cláusula SQL que añade una tabla temporal a una base de datos que puede ser utilizada por varias personas
Validación de campos cruzados: Un proceso que garantiza que se cumplen determinadas condiciones para varios campos de datos
Archivo CSV (valores separados por coma): Un archivo de texto delimitado que utiliza una coma para separar los Valores
Moneda: Aspecto de la ética de los datos que presupone que las personas deben ser conscientes de las transacciones financieras derivadas del uso de sus datos personales y de la magnitud de dichas transacciones D
Panel: Una herramienta que monitoriza los datos entrantes en directo
Datos: Una colección de hechos
Agregación de datos: El proceso de recopilar datos de múltiples fuentes y combinarlos en una única colección resumida
Análisis de datos: La recopilación, transformación y organización de datos con el fin de extraer conclusiones, hacer predicciones e impulsar la toma de decisiones informadas
Proceso de análisis de datos: Las seis fases de preguntar, preparar, procesar, analizar, compartir y actuar cuyo propósito es obtener estadísticas que impulsen la toma de decisiones informadas
Analista de datos: Persona que recopila, transforma y organiza los datos para extraer conclusiones, hacer predicciones e impulsar la toma de decisiones con conocimiento de causa
Analítica de datos: La ciencia de los datos
Anonimización de datos: El proceso de proteger los datos privados o sensibles de las personas eliminando la información que las identifica
Sesgo de los datos: Cuando una preferencia a favor o en contra de una persona, grupo de personas o cosa sesga sistemáticamente los resultados del análisis de datos en una dirección determinada
Composición de datos: El proceso de combinar las partes individuales en una visualización y mostrarlas juntas como un todo
Limitaciones de datos: Los criterios que determinan si un dato está limpio y es válido
Diseño de datos: Cómo se organiza la Información
Toma de decisiones basada en datos: El uso de los datos para orientar la estrategia empresarial
Ecosistema de datos: Los diversos elementos que interactúan entre sí para producir, gestionar, almacenar, organizar, analizar y compartir datos
Elemento de datos: Una pieza de información de en un conjunto de datos
Ingeniero de datos: Profesional que transforma los datos en un formato útil para el análisis y los dota de una infraestructura fiable
Ética de los datos: Estándares bien fundados de lo correcto y lo incorrecto que dictan cómo se recopilan, comparten y utilizan los Datos
Gobierno de datos: Proceso para garantizar la gestión formal de los recursos de datos de una empresa
Toma de decisiones inspirada en datos: Exploración de diferentes fuentes de datos para averiguar qué tienen en común
Integridad de datos: La exactitud, exhaustividad, coherencia y fiabilidad de los Datos a lo largo de su ciclo de vida
Interoperabilidad de los datos: La capacidad de integrar datos de múltiples fuentes y un factor clave que conduce al éxito del uso de datos abiertos entre empresas y gobiernos
Ciclo de vida de los datos: La secuencia de etapas que experimentan los datos, que incluyen la planificación, la captura, la gestión, el análisis, el archivo y la destrucción
Manipulación de datos: El proceso de modificar los Datos para hacerlos más organizados y fáciles de leer
Mapeo de datos: El proceso de hacer coincidir campos de una fuente de datos con otra
Fusión de datos: El proceso de combinar dos o más conjuntos de datos en uno solo
Modelo de datos: Una herramienta para organizar los elementos de datos y cómo se relacionan entre sí
Privacidad de los datos: Preservación de la información de un sujeto de datos cada vez que se produce una transacción de datos
Rango de datos: Valores numéricos que se encuentran entre valores máximos y mínimos predefinidos
Replicación de datos: El proceso de almacenamiento de Datos en múltiples ubicaciones
Ciencia de datos: Campo de estudio que utiliza datos brutos para crear nuevas formas de modelar y comprender lo desconocido.
Seguridad de los datos: Protección de los Datos contra el acceso no autorizado o la corrupción mediante la adopción de medidas de seguridad
Estrategia de datos: La gestión de las personas, los procesos y las herramientas utilizadas en el análisis de datos
Transferencia de datos: El proceso de copiar datos de un dispositivo de almacenamiento a la memoria de una computadora o de una computadora a otra
Tipo de datos: Atributo que describe un dato en función de sus Valores, su lenguaje de programación o las operaciones que puede realizar
Validación de datos: Una herramienta para comprobar la exactitud y la calidad de los Datos
Proceso de validación de datos: Proceso de comprobar y volver a comprobar la calidad de los Datos para que sean completos, exactos, seguros y coherentes
Visualización de datos: La representación gráfica de los Datos
Especialista en Almacenamiento de datos: Un profesional que desarrolla procesos y procedimientos para almacenar y organizar los Datos de forma eficaz
Base de datos: Una colección de datos almacenados en un sistema informático
Conjunto de datos: Una colección de datos que pueden manipularse o analizarse como una unidad
DATEDIF: Función de una hoja de cálculo que calcula el número de días, meses o años entre dos fechas
Árbol de decisiones: Herramienta que ayuda a los analistas a tomar decisiones sobre las características críticas de una visualización
Delimitador: Carácter que indica el principio o el final de un elemento de Datos
Metadatos descriptivos: Metadatos que describen un dato y pueden utilizarse para identificarlo en un momento posterior
Design thinking: Un proceso utilizado para resolver problemas complejos de una forma centrada en el usuario
Foto digital: Una imagen electrónica o basada en computadora generalmente en formato BMP o JPG
Datos sucios: Datos incompletos, incorrectos o irrelevantes para el problema a resolver
Datos discretos: Datos que se cuentan y tienen un número limitado de valores
DISTINTO: Palabra clave que se añade a una sentencia SELECT de SQL para recuperar sólo las entradas no duplicadas
Gráfico de distribución: Visualización de datos que muestra la frecuencia de varios resultados en una muestra.
DROP TABLE: cláusula SQL que elimina una tabla temporal de una base de datos
Datos duplicados: Cualquier registro que inadvertidamente comparta datos con otro registro
Visualizaciones dinámicas: Visualizaciones de datos que son interactivas o cambian con el tiempo E
Énfasis: Principio de diseño consistente en disponer los elementos visuales para centrar la atención del público en la información importante de una visualización de datos
Ecuación: Cálculo que implica suma, resta, multiplicación o división (también llamada expresión matemática)
Tasa de respuesta estimada: El número medio de personas que suelen completar una encuesta
Ética: Estándares bien fundados de lo correcto y lo incorrecto que prescriben lo que los seres humanos deben hacer, normalmente en términos de derechos, obligaciones, beneficios para la sociedad, equidad o virtudes específicas
Sesgo del experimentador: La tendencia de distintas personas a observar las cosas de forma diferente (Consulte Sesgo del observador)
Datos externos: Datos que viven, y se generan, fuera de una organización F
Equidad: Calidad del análisis de datos que no crea ni refuerza sesgos.
Campo: Una sola pieza de información de una fila o columna de una hoja de cálculo; en una tabla de datos, normalmente una columna de la tabla
Longitud de campo: Una herramienta para determinar cuántos caracteres pueden introducirse en un campo de una hoja de cálculo
Controlador de relleno: Cuadro situado en la esquina inferior derecha de una celda seleccionada de una hoja de cálculo que puede arrastrarse por las celdas vecinas para continuar una instrucción
Filtrado: El proceso de mostrar sólo los Datos que cumplen un criterio especificado y ocultar el resto
Buscar y reemplazar: Una herramienta que encuentra un término de búsqueda especificado y lo sustituye por otra cosa
Datos de primera fuente: Datos recopilados por un individuo o grupo utilizando sus propios recursos
Flotante: Un número que contiene un decimal
Clave foránea: Campo dentro de una tabla de base de datos que es una clave primaria en otra tabla (Consulte clave primaria)
Fórmula: Un conjunto de instrucciones utilizadas para realizar un cálculo utilizando los datos de una hoja de cálculo
FROM: La sección de una consulta que indica de qué tabla(s) extraer los datos
Función: Comando preestablecido que realiza automáticamente un proceso o tarea específicos utilizando los Datos de una hoja de cálculo GRAMO
Análisis de déficits: Método para examinar y evaluar el estado actual de un proceso con el fin de identificar oportunidades de mejora en el futuro
Reglamento General de Protección de Datos de la Unión Europea (RGPD): Órgano normativo de la Unión Europea creado para ayudar a proteger a las personas y sus Datos
Geolocalización: La ubicación geográfica de una persona o dispositivo mediante información digital
Fuente de datos correctos: Una fuente de Datos que es fiable, original, completa, actual y citada (ROCCC)
GROUP BY: Una cláusula SQL que agrupa las filas que tienen los mismos valores de una tabla en filas de resumen h
HAVING : Una cláusula SQL que añade un filtro a una consulta en lugar de la tabla subyacente que sólo se puede utilizar con funciones de agregación
Encabezado: La primera fila de una hoja de cálculo que etiqueta el tipo de datos de cada columna
Encabezado: Texto en la parte superior de una visualización que comunica los datos que se están presentando
Mapa de calor: Visualización de datos que utiliza el contraste de colores para comparar las categorías de un conjunto de datos
Histograma: Visualización de datos que muestra la frecuencia con la que los valores de los datos se sitúan en determinados rangos
Testeo de hipótesis: Un proceso para determinar si una encuesta o experimento tiene resultados significativos I
Datos incompletos: Datos a los que les faltan campos importantes
Datos incoherentes: Datos que utilizan diferentes formatos para representar lo mismo
Datos incorrectos/inexactos: Datos que están completos pero son inexactos
INNER JOIN : Función SQL que devuelve registros con valores coincidentes en ambas tablas
Consulta interna: Una Subconsulta SQL que está dentro de otra sentencia SQL
Datos internos: Datos que viven dentro de los propios sistemas de una empresa
Sesgo de interpretación: La tendencia a interpretar las situaciones ambiguas de forma positiva o negativa J
JOIN : Una función SQL que se utiliza para combinar filas de dos o más tablas basándose en una columna relacionada K L
Etiqueta: Texto en una visualización que identifica un valor o describe una escala
Pregunta principal: Pregunta que orienta a las personas hacia una respuesta determinada
LEFT: Función que devuelve un número determinado de caracteres de la parte izquierda de una cadena de texto
LEFT JOIN : Una función SQL que devolverá todos los registros de la tabla izquierda y sólo los registros coincidentes de la tabla derecha
Leyenda: Una herramienta que identifica el significado de varios elementos en una Visualización de datos
LEN: Función que devuelve la longitud de una cadena de texto contando el número de caracteres que contiene
Longitud: El número de caracteres de una cadena de texto
LIMIT: Una cláusula SQL que especifica el número máximo de registros devueltos en una consulta
Gráfico de líneas: Visualización de datos que utiliza una o varias líneas para mostrar los cambios en los Datos a lo largo del tiempo
Datos en formato largo: Conjunto de datos en el que cada fila es un punto temporal por sujeto, por lo que cada sujeto tiene datos en varias filas M
Obligatorio: Un valor de datos que no puede dejarse en blanco o vacío
Mapa: Una visualización de datos que organiza los datos geográficamente
Margen de error: La cantidad máxima que se espera que difieran los resultados de la muestra de los de la población real
Marca: Objeto visual en una visualización de datos, como un punto, una línea o una forma
MATCH: Función de una hoja de cálculo utilizada para localizar la posición de un valor de búsqueda específico
Expresión matemática: Un cálculo que implica suma, resta, multiplicación o división (también llamado ecuación)
Función matemática: Una función que se utiliza como parte de una fórmula matemática
MAX : Una función que devuelve el mayor valor numérico de un rango de celdas
MAXIFS: Función de una hoja de cálculo que devuelve el valor máximo de un rango dado que cumple una condición especificada
Pregunta medible: Una pregunta cuyas respuestas pueden cuantificarse y evaluarse
Modelo mental: Proceso de pensamiento y enfoque de un analista de datos ante un problema
Mentor: Alguien que comparte conocimientos, habilidades y experiencia para ayudar a otro a crecer tanto profesional como personalmente
Fusión: Acuerdo que une dos organizaciones en una sola nueva
Metadatos: Datos sobre datos
Repositorio de metadatos: Base de datos creada para almacenar metadatos
Métricas: Un tipo de datos único y cuantificable que se utiliza para la medición
Objetivo métrico : Objetivo cuantificable fijado por una empresa y evaluado mediante métricas
MID : Una función que devuelve un segmento de la mitad de una cadena de texto
MIN : Función de una hoja de cálculo que devuelve el valor numérico más pequeño de un rango de celdas
MINIFS : Una función de hoja de cálculo que devuelve el valor mínimo de un rango dado que cumple una condición especificada
Modulo: Operador (%) que devuelve el resto cuando se divide un número por otro
Movimiento: Principio de diseño que consiste en disponer los elementos visuales para guiar la mirada del público de una parte a otra de una visualización de datos norte
Convenciones de nomenclatura: Pautas coherentes que describen el contenido, la fecha de creación y la versión de un archivo en su nombre
Narrativa : (Referirse a la Historia)
Redes: Establecer relaciones conociendo a gente tanto en persona como en línea
Datos nominales: Un tipo de datos cualitativos que se categorizan sin un orden establecido
Base de datos normalizada: Base de datos en la que sólo se almacenan datos relacionados en cada tabla
Notebook: Entorno de programación interactivo y editable para crear Informes de datos y mostrar las habilidades en materia de datos
Nulo: Indicación de que un valor no existe en un conjunto de datos oh
Observación: Los atributos que describen un dato contenido en una fila de una tabla
Sesgo del observador: La tendencia de distintas personas a observar las cosas de forma diferente (también llamado sesgo del experimentador)
Datos abiertos: Datos que están a disposición del público
Apertura: Aspecto de la ética de los datos que promueve el libre acceso, uso y puesta en común de los datos
Operador: Símbolo que nombra la operación o el cálculo que debe realizarse
ORDER BY: Una cláusula SQL que ordena los resultados devueltos en una consulta
Orden de las operaciones: Uso de paréntesis para agrupar valores de una hoja de cálculo con el fin de aclarar el orden en que deben realizarse las operaciones
Datos ordinales: Datos cualitativos con un orden o escala establecidos
Datos desactualizados: Cualquier dato que haya sido sustituido por información más reciente y precisa
OUTER JOIN : Función SQL que combina RIGHT y LEFT JOIN para devolver todos los registros coincidentes de ambas tablas
Consulta externa: Una sentencia SQL que contiene una subconsulta
Responsabilidad: Aspecto de la ética de los datos que presupone que los individuos son propietarios de los datos brutos que proporcionan y tienen el control principal sobre su uso, procesamiento y puesta en común. PAG
Patrón: Principio de diseño que consiste en utilizar elementos visuales similares para mostrar tendencias y relaciones en la visualización de datos
Gráfico circular: Visualización de datos que utiliza segmentos de un círculo para representar las proporciones de cada categoría de datos en comparación con el total
Tabla dinámica: Gráfico creado a partir de los campos de una tabla dinámica
Tabla dinámica: Herramienta de resumen de datos que se utiliza para clasificar, reorganizar, agrupar, contar, totalizar o promediar datos
Píxel: En imagen digital, pequeña área de iluminación en una pantalla de visualización que, al combinarse con otras áreas adyacentes, forma una imagen digital
Población: En Analítica de datos, todos los valores de datos posibles en un conjunto de datos
Atributos preatencionales: Elementos de una visualización de datos que un público reconoce automáticamente sin esfuerzo consciente
Clave primaria: Un identificador en una base de datos que hace referencia a una columna en la que cada valor es único (Referirse a clave foránea)
Dominio del problema: El ámbito de análisis que abarca todas las actividades que afectan o se ven afectadas por un problema
Tipos de problemas: Los diversos problemas a los que se enfrentan los analistas de datos, como categorizar cosas, descubrir conexiones, encontrar patrones, identificar temas, hacer predicciones y detectar algo inusual
Margen de beneficio: Porcentaje que indica cuántos céntimos de beneficio se han generado por cada dólar de venta
Proporción: Principio de diseño que consiste en utilizar el tamaño relativo y la disposición de los elementos visuales para mostrar la información en una visualización de datos q
Datos cualitativos: Medida subjetiva y explicativa de una Calidad o característica
Datos cuantitativos: Una medida específica y objetiva, como un número, una cantidad o un Rango
Consulta: Una solicitud de datos o información de una base de datos
Lenguaje de consulta: Lenguaje de programación de una computadora utilizado para comunicarse con una base de datos R
R: Lenguaje de programación utilizado para el análisis estadístico, la visualización y otros análisis de datos.
Muestreo aleatorio: Forma de seleccionar una muestra de una población de modo que todos los tipos posibles de la muestra tengan las mismas posibilidades de ser elegidos
Rango: Conjunto de dos o más celdas de una hoja de cálculo
Clasificación: Un sistema para situar los valores de un conjunto de datos dentro de una escala de logros o estatus
Registro A: Una colección de datos relacionados en una tabla de datos, normalmente sinónimo de fila
Redundancia: Cuando el mismo dato se almacena en dos o más lugares
Reformulación: El proceso de replantear un problema o desafío, y luego redirigirlo hacia una posible resolución
Expresión regular (RegEx) : regla que establece que los valores de una tabla deben coincidir con un patrón prescrito
Base de datos relacional: Base de datos que contiene una serie de tablas que pueden conectarse para formar relaciones
Relatividad: El proceso de considerar las observaciones en relación o proporción con otra cosa
Pregunta relevante: Una pregunta que tiene importancia para el problema que hay que resolver
Quitar duplicados: Herramienta de hoja de cálculo que busca y elimina automáticamente las entradas duplicadas de una hoja de cálculo
Repetición: El principio de diseño de repetir elementos visuales para demostrar el significado en una Visualización de datos
Informe: Una colección estática de Datos que se entrega periódicamente a las partes interesadas
Retorno de la inversión (ROI): Una fórmula que utiliza las métricas de inversión y beneficio para evaluar el éxito de una inversión
Ingresos: La cantidad total de ingresos generados por la venta de bienes o servicios
Ritmo: El principio de diseño que consiste en crear movimiento y flujo en una visualización de datos para atraer al público
RIGHT : Función que devuelve un número determinado de caracteres de la parte derecha de una cadena de texto
RIGHT JOIN : Una función SQL que devolverá todos los registros de la tabla derecha y sólo los registros coincidentes de la izquierda.
Causa raíz: La razón por la que se produce un problema
ROUND : Una función SQL que devuelve un número redondeado a un determinado número de decimales S
Muestra: En Analítica de datos, segmento de una población que es representativo de toda la población
Sesgo del muestreo: Representación excesiva o insuficiente de determinados miembros de una población como resultado de trabajar con una muestra que no es representativa del conjunto de la población
Diagrama de dispersión: Visualización de datos que representa las relaciones entre diferentes variables con puntos de datos individuales sin una línea de conexión
Schema: Una forma de describir cómo se organiza algo, como los Datos
Alcance del trabajo (SOW): Un esquema acordado de las tareas que deben realizarse durante un proyecto
Datos de segunda fuente: Datos recopilados por un grupo directamente de su público y luego vendidos
SELECT INTO: La sección de una consulta que indica de qué columna(s) extraer los datos
SELECT INTO : Cláusula SQL que copia los datos de una tabla en una tabla temporal sin añadir la nueva tabla a la base de datos
Microdatos: Puntos de datos pequeños y específicos que suelen referirse a un breve periodo de tiempo y que son útiles para tomar decisiones cotidianas
Metodología SMART: Herramienta para determinar la eficacia de una pregunta en función de si es específica, medible, orientada a la acción, pertinente y limitada en el tiempo.
Redes sociales: Sitios web y aplicaciones a través de los cuales los usuarios crean y comparten contenidos o participan en redes sociales
Habilidades interpersonales: Rasgos y comportamientos no técnicos relacionados con la forma de trabajar de las personas
Rango de ordenación: Función del menú de una hoja de cálculo que ordena un rango especificado y conserva las celdas fuera del rango
Ordenar hoja: Función del menú de una hoja de cálculo que ordena todos los datos según la Clasificación de una columna específica ordenada y mantiene los datos juntos en todas las filas
Ordenación: Proceso de organizar los datos en un orden significativo para facilitar su comprensión, análisis y visualización
Pregunta específica: Pregunta simple, significativa y centrada en un único tema o en unas pocas ideas estrechamente relacionadas
SPLIT : Función de una hoja de cálculo que divide el texto en torno a un carácter especificado y coloca cada fragmento en una celda nueva y separada
Patrocinador: Defensor profesional que se compromete a hacer avanzar la carrera de otro
Hoja de cálculo: Una hoja de cálculo digital
SQL : (Consulte Lenguaje de Consulta Estructurado)
Interesados: Personas que invierten tiempo y recursos en un proyecto y están interesadas en su resultado
Visualización estática: Una visualización de datos que no cambia con el tiempo a menos que se edite
Poder estadístico : La probabilidad de que una prueba de significación reconozca un efecto presente
Significación estadística: La probabilidad de que los resultados de la muestra no se deban al azar
Estadísticas: El estudio de cómo recopilar, analizar, resumir y presentar datos
Historia: La narración de una presentación de datos que la hace significativa e interesante
Tipo de datos de cadena: Secuencia de caracteres y signos de puntuación que contiene información textual (también llamado tipo de datos de texto)
Metadatos estructurales: Metadatos que indican cómo está organizada una pieza de datos y si forma parte de una o más colecciones de datos
Datos estructurados: Datos organizados en un formato determinado, como filas y columnas
Lenguaje de Consulta Estructurada: Lenguaje de programación informática utilizado para comunicarse con una base de datos
Pensamiento estructurado: El proceso de reconocer el problema o la situación actual, organizar la información disponible, revelar lagunas y oportunidades e identificar opciones
Subconsulta: Una consulta SQL que está anidada dentro de una consulta mayor
SUBSTR : Una función SQL que extrae una subcadena de una variable de cadena
Subcadena: Un subconjunto de una cadena de texto
Subtítulo: Texto que apoya un titular añadiendo contexto y descripción
SUM: Una función que suma los valores de un rango de celdas seleccionado
SUMIF: Una función de hoja de cálculo que añade datos numéricos basándose en una condición
Tabla de resumen: Una tabla utilizada para resumir información estadística sobre datos
SUMPRODUCTO: Una función que multiplica matrices y devuelve la suma de esos productos
Sintaxis: La estructura predeterminada de un lenguaje que incluye todas las palabras, símbolos y signos de puntuación necesarios, así como su correcta colocación T
Tableau: Una plataforma de inteligencia empresarial y análisis que ayuda a las personas a visualizar, comprender y tomar decisiones con datos
Mentalidad técnica: La capacidad de dividir las cosas en pasos o piezas más pequeñas y trabajar con ellas de forma ordenada y lógica
Tabla temporal: Una tabla de base de datos que se crea y existe temporalmente en un servidor de base de datos
Tipo de datos de texto: Secuencia de caracteres y signos de puntuación que contiene información textual (también denominado Tipo de datos de cadena)
Cadena de texto: Un grupo de caracteres dentro de una celda, compuesto en la mayoría de los casos por letras
Datos de terceros: Datos proporcionados por fuentes externas que no los recogieron directamente
Pregunta con límite de tiempo: Pregunta que especifica un marco temporal a estudiar
Transparencia de la transacción: El aspecto de la Ética de los datos que presume que todas las actividades de procesamiento de datos y algoritmos deben ser explicables y comprensibles por la persona que proporciona los datos
Habilidades transferibles: Habilidades y cualidades que pueden transferirse de un trabajo o industria a otro
TRIM : Función que elimina los espacios iniciales, finales y repetidos de los datos
Tasa de rotación: La tasa a la que los empleados abandonan voluntariamente una empresa
Conversión de tipos: Conversión de datos de un tipo a otro Ud.
Muestreo imparcial: Cuando la muestra de la población que se mide es representativa del conjunto de la población
Guiones bajos : Líneas utilizadas para subrayar palabras y conectar caracteres de texto
Pregunta injusta: Pregunta que hace suposiciones o es difícil de responder con sinceridad
Único: Un valor que no puede tener un duplicado
Oficina del Censo de los Estados Unidos: Agencia del Departamento de Comercio de EE.UU. que es el principal proveedor nacional de datos de calidad sobre su población y su economía
Unidad: Principio de diseño consistente en utilizar elementos visuales que se complementan entre sí para crear atractivo estético y claridad en una visualización de datos
Datos no estructurados: Datos que no están organizados de ninguna manera fácilmente identificable V
Validez: El grado en que los datos se ajustan a las restricciones cuando se introducen, recopilan o crean
VALUE : Función de una hoja de cálculo que convierte una cadena de texto que representa un número en un valor numérico
Variedad: Principio de diseño que consiste en utilizar distintos tipos de elementos visuales en una visualización de datos para captar la atención del público
Verificación: Un proceso para confirmar que un esfuerzo de limpieza de datos fue bien ejecutado y que los datos resultantes son precisos y fiables
Archivo de vídeo: Una colección de imágenes, archivos de audio y otros datos normalmente codificados en un formato comprimido como MP4, MV4, MOV, AVI o FLV
Formato visual: La apariencia de una visualización de datos que le confiere estructura y atractivo estético
Visualización : (Consulte Visualización de datos)
VLOOKUP : Función de una hoja de cálculo que busca verticalmente un determinado valor en una columna para devolver la información correspondiente W.
WHERE: La sección de una consulta que especifica los criterios que deben cumplir los datos solicitados
Datos en formato ancho: Conjunto de datos en el que cada sujeto de datos tiene una única fila con varias columnas para contener los valores de varios atributos del sujeto
CON : Una cláusula SQL que crea una tabla temporal que puede consultarse varias veces
Organización Mundial de la Salud: Organización cuya función principal es dirigir y coordinar la sanidad internacional dentro del sistema de las Naciones Unidas incógnita
Eje X: La línea horizontal de un gráfico situada normalmente en la parte inferior, que suele utilizarse para representar escalas temporales y categorías discretas Y
Eje Y: La línea vertical de un gráfico situada normalmente a la izquierda, que suele utilizarse para representar frecuencias y otras variables numéricas z