Big Data - lucasximenes-br/Tecnoclogia-Digitais-Emergentes GitHub Wiki
BIG DATA
Big Data como Tecnologia Digital Emergente definida utilizando uma matriz 5W2H
Carla Fabiana Gomes de Souza - [email protected] Emerson Martins da Silva - [email protected] Jamerson Dias Ramos - [email protected] Lucas Ximenes da Fonseca - [email protected]
Objeto de Estudo - BIG DATA
Será utilizado a matriz 5W2H para justificar a escolha de Big Data como Objeto de Estudo de Tecnologia Digital Emergente:
- What: Big Data é o termo dado ao crescimento exponencial em uma série temporal de dados estruturados e não estruturados de elevada dimensionalidade e caracterizado pelos 5V's (Volume, Variedade, Velocidade, Veracidade, Valor);
- Why: Com esse crescimento desenfreado de informações, iniciado pela Era dos Smartphones agregado ao surgimento do IOT, se fez necessário o surgimento de um novo paradigma para processar essa gama de informações;
- When: Deve ser utilizado quando há um volume massivo de Dados multivariados aos quais ferramentas de sistemas tradicionais como RDBMS não são capazes de processar em tempo hábil a enorme demanda;
- Who: Seu uso está em alta e conseguimos observar dentro dos mais diversificados setores. A Nasa para controlar 16 satélites; a Nike para coordenas 13 linhas difentes em mais de 250 países; o Ministério da Justiça para identificar ações ilícitas são alguns exemplos de sua utilidade;
- Where: Em domínios com forte cultura Data Driven ou orientada a Data Products, ou ainda em domínios sensíveis com necessidade de resposta muito alta. Exemplos: Marketplaces, Smart health, Carros autônomos, Segurança Pública, etc;
- How: Quando falamos em Big Data, falamos de Processamento Paralelo e Distibruído de Dados. Sua implementação mais comum é ter um ambiente clusterizado, utilizando ferramentas de computação paralela (Hadoop) usando tecnologia para tratamento desses Dados(Spark). Sua utilização depende muito do domínio inserido, pois pode haver a necessidade de agendamento de fluxos de extração e atualização dos Dados, ou ainda o tratamento em real-time ou de streaming;
- How Much: Existe um custo variável a depender de sua arquitetura. Normalmente sua utilização em Cloud tende a ser mais vantajosa financeiramente do que manter um ambiente clusterizado on premisse. Também se faz necessário um ambiente com processos bem definidos para não haver quebra de 1 dos 5V's mencionado anteriormente. Existem alguns profissionais que são essenciais para sucesso de projetos Big Data: DBA, Engenheiro de Dados, Arquiteto de Dados, Analista de daods.