Ciência de Dados Aplicada Uma Breve Introdução, por Rodrigo Almeida - lojadedados/cienciadedadosaplicada GitHub Wiki
"O excesso de abundância de informação pode fazer do cidadão um ser muito mais ignorante. Eu explico. Acho que as possibilidades tecnológicas para desenvolver a massificação da informação têm sido muito rápidas. No entanto, o cidadão não dispõe dos elementos e da formação adequados para saber escolher e seleccionar, o que leva a que ande perdido nessa selva. Precisamente, nesse desnível é onde se dá a instrumentalização em prejuízo do indivíduo e, portanto, a desinformação."[José Saramago, in 'La Jornada (2004)']
Resumo
A apresentação "ciência de dados aplicada"" traz minha visão sobre o tema bastante atual: Como lidar com o grande volume de informações? Como tomar decisões relevantes e assertivas? Como apresentar a informação para os diversos públicos? Convido você para discutirmos o nosso papel no novo mundo 4.0: Vamos dar olhos para a sociedade consumida pela cegueira da informatização.
Resumo Extendido
A ciência de dados está relacionada à prática de derivar informações importantes a partir de um conjunto de dados, e vem emergindo como papel de destaque para lidar com os desafios relacionados ao processamento de grandes volumes de dados (estruturados, semi-estruturados e não estruturados), numa confluência que para muitos confunde-se com o tema do “Big Data”.
Mas existe uma justificativa para o surgimento do papel: A lei de moore já "previa" que o volume de dados armazenados cresceria na mesma proporção da capacidade dos processadores. A economia se beneficiou disso; há uma generalizada informatização das empresas e muito do conhecimento está estruturado, armazenado e sustentado por um ou mais sistemas de informação (sob a forma de vários terabytes de dados). No âmbito social a Internet das Coisas representada pela grande quantidade de dispositivos conectados à rede e a grande capacidade de armazenamento de dados nos possibilita uma forma de interação sem precedentes. Apps de socialização como facebook, whatsapp, twitter ou instagram chegam aos 10 dígitos em número de usuários e geram um volume exponencial de dados, valores que em muito extrapolam nossa capacidade individual de compreensão.
É nesse ponto que o cientista de dados surge. Esse profissional possibilita uma visão informativa, eficiente, orientada a contexto e inovadora sobre os dados. Segundo Anjul Bhambhri, vice presidente de produtos de dados da IBM, um cientista dados é alguém questionador, capaz de visualizar os dados e identificar tendências. Enquanto o analista de dados tradicional costuma trabalhar com algumas poucas bases de dados, o cientista de dados procura aprender com várias fontes de informação, estruturadas, semi-estruturadas e não estruturadas, que muitas vezes extrapolam a unidade organizacional onde ele está inserido. O conhecimento de ferramentas próprias para esse tipo de situação, a fundamentação estatística e a capacidade de apresentar resultados para as diversas audiências são competências que costumam acompanhar esse profissional.
Por fim, convido a todos a participar da apresentação sobre o tema "ciência de dados aplicada - uma breve introdução", que apresenta minha visão sobre o nosso papel nesse novo mundo: Seremos nós os motores da revolução 4.0.
Agenda
- Contextualização
- Aplicações
- O Roadmap da formação do Cientista de Dados
- O Futuro da Ciência de Dados
Currículo
Rodrigo Almeida é Mestre em Ciência da Computação pela UFCG. Analista de TI da Dataprev desde 2007, vem atuando na área de gestão de projetos desde 2012. Atualmente se considera "Cientista de Dados em Formação".
Contato
- [email protected]
- 83 991511228