Big Data 5Vs

Os 5Vs do Big Data

Você já parou para pensar na quantidade de dados que geramos e armazenamos todos os dias? Redes sociais como Twitter, Facebook, Instagram, Youtube e LinkedIN são exemplos de plataformas que geram grandes quantidades de dados em uma nuvem caótica de informações.

A inteligência artificial já existe há bastante tempo, há pelo menos 60 anos. Então porque só agora, nos últimos anos, ela tem se tornado altamente relevante, aumentando sua visibilidade, potência e uso?

Você já parou para pensar nisso?

A resposta a essa pergunta está na quantidade astronômica dos dados que geramos atualmente e no fenômeno chamado Big Data, que é o aumento de dados não estruturados disponíveis. No artigo de hoje falaremos sobre quais são os 5 Vs do Big Data.

 
5Vs do Big Data

 

1. Volume

O primeiro V é o mais aparente, o volume. A quantidade de dados que nós humanos já produzimos ultrapassou recentemente 1 Zettabyte. Ou seja, 1 sextilhão de bytes.

Porém, com a popularização da internet das coisas e a sua consequência inevitável que é o aumento de dados, a previsão é que nós, seres humanos, sensores e outros objetos de IOT produziremos aproximadamente 40 zettabytes até 2020. Um crescimento de aproximadamente 20x na quantidade de dados produzidos hoje.

O que é gerado a partir desse grande volume é o que chamamos de variedade, o nosso segundo V.

 

2. Variedade

90% dos dados gerados não estão estruturados como em um banco de dados comum. Falamos em variedade porque estamos tratando tanto de dados textuais estruturados, como não estruturados, como fotos, vídeo, sons, documentos, e-mails e muitos mais.

Só o Facebook sozinho gera mais de 100 terabytes de dados diariamente. E todos esses dados são não estruturados.

Em meio a esse caos informacional muitas das vezes precisamos responder a eventos quase em tempo real. Ou seja, estamos falando de criação, manutenção e tratamento de dados massivos. Por isso, nossos sistemas de Big Data devem levar em consideração o nosso terceiro V, a velocidade.

 

3. Velocidade

Sistemas de Big Data devem lidar com o ritmo de como os dados são produzidos. O Fluxo de dados é massivo e contínuo. Todos esses dados em tempo real podem ajudar aos pesquisadores e aos profissionais que trabalham em empresas a tirar proveito das conclusões e insights gerados pelos dados para tomar decisões valiosas.

Esse resultado pode ser realmente importante para aqueles que estão analisando em tempo real. São vantagens estratégicas competitivas. Mas isso somente se você conseguir lidar com velocidade.

Agora imagine lidar com tantos dados onde a forma de entrada não é padronizada. É esse caso que nos leva ao quarto V, a veracidade.

 

4. Veracidade

A veracidade em Big Data se refere aos problemas que os dados gerados poderão conter. Basicamente, a análise de Big Data depende muito da veracidade dos dados. É crucial para compressão de dados em Big Data a natureza confusa e barulhenta dos dados. Isso porque muitos dados estão incompletos, corroídos ou com anomalias.

Um cientista de dados deve ser capaz de gerar conhecimento a partir dos dados. Ou seja, utilizando machine learning, é possível gerar informações a partir das partes de dados que se tem. E isso nos leva ao último V, que é o valor.

 

5. Valor

Hoje em dia, os dados armazenados de uma empresa ou de qualquer instituição são um de seus maiores bens. Imagine uma grande instituição simplesmente perder todos os dados do dia para a noite. Isso se assemelha a um desastre na estrutura física da empresa.

Por isso, os dados são valiosos para qualquer organização. Além disso, são geradores de conhecimento, que é um capital para qualquer empresa. Além disso, os dados trazem benefícios competitivos de mercado, gerando valor monetário.

Big Data é uma expressão que está cada vez mais presente no vocabulário dos ambientes da tecnologia da informação. No entanto, esses sistemas ainda são complexos e desconhecidos por gestores da área de TI e de negócios.

A verdade é que Big Data reflete a realidade dos dados do mundo em que vivemos. Para aproveitá-los muito bem é preciso saber como trabalhar com Big Data

Curtiu esse post? Então deixa um comentário e compartilha nas redes sociais!

About the Author: Pedro César Tebaldi Gomes

Atua há 8 anos no mercado B2B de tecnologia da informação como gerente de marketing, tendo escrito mais de 200 artigos nesse período. Estuda ciência de dados, machine learning e estatística para atingir melhores resultados de negócios.

4 Comments

  1. Muito boa as explicações eu tenho um seminário na faculdade amanhã sobre Big Data e tava muito confuso o quinto V (valor) e já sou vergonhoso pra seminários e tava com medo de não consegui explica mas agora depois de ler o seu post fico mais claro. Muito obrigado incrível gostei da maneira que explicou ficou muito claro pra mim que sou novo no assunto.

Deixe uma resposta

Os 5Vs do Big Data

tempo de leitura: 4 min