Governança de Dados versus Vacas

 

Uma breve introdução à IoC/IoT

 

Os EUA, com o impacto da doença da vaca louca, buscaram a identificação e o rastreamento de 10% de seu rebanho bovino em 2004[1], porém, a aplicação em escala (do conceito ainda não chamado de IoC) foi publicada no começo de 2010[2]. Um relatório da CISCO em 2011[3] aponta um artigo do The Economist sobre as vacas conectadas à Internet gerando dados diversos que se traduzem em informações comportamentais e de saúde[4], como: o quanto cada vaca produz de leite e qual o teor de gordura, o tempo de cada ordenha, quais estão dentro do período de produtividade máxima e quais estão saindo, alertas de desvios de comportamento, variações de sinais vitais e temperatura, quantas vezes o animal vai se alimentar ou beber água, seu período de descanso, fertilidade, prenhez, parto, etc.

Em 2013, este conceito, também conhecido por “Smart Cows” e “Smart Farms[5] passa a ser chamado de internet das vacas[6, 7] e, hoje, com a evolução tecnológica permitindo o monitoramento em tempo real de múltiplos sensores, mega soluções de IoC já estão disponíveis[8, 9], bem como existem empreendedores brasileiros que criam alternativas de baixo custo, caso da EvoMilk[10], que busca parceiros para ir adiante com sua solução de IoC.

Assim, depois desta pequena introdução ao IoC, você se pergunta:

“– E o que as vacas têm a ver com a Internet?”

É simples… para cada vaca, que é apenas uma única “coisa” conectada na Internet (Internet of Things), espera-se a geração anual, em média, de 200 megabytes de dados[3, 4]. Portanto, a pergunta que deve ser feita é:

“– Como fica a Governança dos Dados gerados pelas Vacas (IoC), pelas Cabras (“IoG”), pelos Búfalos (“IoB”) e por todas e quaisquer outras mais de ~31 BILHÕES de coisas (IoT) conectadas à Internet[11] até 2020?”

 

www.governancas.com.br - IoC - Internet of Cows

IoC – Internet of Cows, Augmented Business | The Economist

 

A Internet das Coisas Inteligentes

 

O que é a IoT?

 

A Internet of Things é um paradigma tecnológico relativamente novo que faz uso intenso da Internet onde as “coisas” (objetos físicos, como sensores, atuadores, concentradores, eletrodomésticos, fechaduras, roupas, tênis, relógios, etc) inteligentes estão constantemente conectadas (na rede e/ou até mesmo uma com as outras) e enviando os dados coletados/produzidos para tratamentos diversos e posteriores análises para obtenção de informações. Estes elementos inteligentes podem atuar sozinhos ou em conjunto com outros para se obter uma determinada informação desejada, compondo, assim, um grande sistema gerador de dados.

 

www.governancas.com.br - IoT - Internet of Things

IoT – Internet of Things

 

Com a aplicação desta nova arquitetura, naturalmente heterogênea devido às múltiplas diversidade de coisas, a área de TI precisa conhecer, analisar e trabalhar bastante para vencer grandes e novos desafios, tendo como alguns dos principais:

  • manter a segurança da informação em rede heterogênea (elementos e comunicação);
  • integrar elementos de baixa compatibilidade (fabricantes diversos);
  • recuperar dados através protocolos de comunicação novos e distintos;
  • tratar dados e metadados em formatos não padronizados;
  • manter o ciclo de dados (desde sua aquisição até o expurgo);
  • garantir a segurança, privacidade e disponibilidade dos dados;
  • cumprir todas as diretrizes da Governança de Dados.

 

Parêntesis 1: sem a evolução do protocolo de comunicação da Internet para o atual IPv6[18], não seria possível uma tranquila existência da IoC, pois a versão anterior deste protocolo estava limitada em cerca de 4 bilhões (4.294.967.296) de endereçamentos possíveis, porém, na nova versão, o limite de endereçamentos foi expandido para 340 undecilhões (340.282.366.920.938.463.463.374.607.431.768.211.456).

 

Os dispositivos da IoT podem variar de simples sensores respondendo ou enviando informações, dispositivos compostos de alguns sensores com ou sem processamento/memória (colares das vacas, relógio de monitoramento cardíaco, pedômetro, localizadores de idosos/crianças, etc.), dispositivos com grande quantidade de sensores (motor de avião), unidades autônomas com centenas de sensores (automóvel). Estes dispositivos podem responder diretamente às redes aos quais estão conectados (ativos), só responder quando for conectado (passivo) ou, ainda, passar dados a elementos concentradores de maior capacidade de gestão e processamento das demandas, antes do envio dos dados à Nuvem.

Com a constante evolução das indústrias, uma profusão de coisas inteligentes conectadas à Internet foram e estão sendo construídas, porém, algumas destas estão gerando dados em volumes imensos, devido à grande quantidade de sensores utilizados e/ou à alta frequência de envio de seus dados, cunhando-se um novo conceito: o Big Data.

 

 

A revolução dos Grandes Dados

 

O conceito de Big Data

 

Com o advento das muitas “smart coisas” conectadas à Internet, várias soluções estão gerando cada vez mais dados para se obter as preciosas informações, alguns exemplos:

  • Um carro moderno processa 25 gigabytes de dados por hora[17] para otimizar sua própria operação/manutenção.
  • Em apenas uma longa viagem de um Boeing com quatro motores, o sistema poderá gerar 640 terabytes de dados[16].
  • Estima-se que o colisor de partículas (Large Hadron Collider – LHC) irá gerar 30 petabytes de dados por ano[15].

 

Parêntesis 2: Em apenas um petabyte cabem, aproximadamente, 223.000 DVDs (4,7 gigabytes cada)[22] ou 500.000.000.000 de páginas de texto impresso padrão[23].

 

Para que as Instituições manipulem esses imensos volumes de dados é necessário um bom planejamento antecipado e muita organização, fazendo uso consciente de seus ativos de TI (infraestrutura) e, ainda, fazer com que os investimentos em análises de valor agregado ao negócio gerem um saldo positivo – após descontar todo os custos dispensados para garantir a segurança da informação destes novos elementos, os custos da comunicação para recepção destes dados, os custos do tratamento processual dos volumosos dados brutos, os custos da retenção temporária destes dados (armazenamento), os custos do tratamento de riscos em todas as etapas e, até mesmo, os custos da própria análise.

Este cenário não se tornará uma realidade para todas as Instituições, porém, de qualquer forma, tudo o que for utilizado para governar os grandes dados, também servirá para os demais volumes de dados, pois as necessidades organizacionais como a política, a metodologia, os processos e frameworks devem ser sempre aplicados, independentemente do tamanho da Instituição, pois, quanto mais maturidade no tratamento concedido aos dados, mais qualidade os dados possuirão.

Um projeto de Big Data pode sair caro, porém também pode ser recompensador – quem define o limite do investimento é a estratégia da Instituição, como a necessidade de aumento de sua eficiência operacional (mais qualidade) ou a necessidade de aumento de sua competitividade (análises preditivas).

 

www.governancas.com.br - IoT - Big Data

IoT – Big Data

 

 

Chegando às Nuvens através do Nevoeiro

 

Entendendo um pouco sobre Fog

 

Agora pense nessa imensa quantidade de dados que os sensores irão enviar através da Nuvem para serem processadas e no tempo dispensado para este envio, processamento e a obtenção do resultado. Se existisse um meio termo entre a Nuvem (Cloud) e a Terra (coisas/sensores da IoT), haveria de imediato uma grande economia de tempo para a transferência deste grande volume de dados. Pense no carro conectado à Internet[2] e o tempo gasto com a transferência de seus dados para a Nuvem, viabilizando que engenheiros analisem, de forma conjunta, dados de veículos similares e gerem informações como veículos com desgastes fora da curva padrão ou com consumo excessivo de combustível e enviando email automático de recall diretamente aos seus proprietários ou ainda informar ao motorista em quais momentos ele está consumindo mais combustível, educando o motorista à uma condução mais econômica. Esta aproximação entre Cloud e IoT está sendo resolvida com o novo conceito de Nevoeiro[14] (Fog Computing ou Fog Networking ou Fogging), onde uma camada mais próxima da Terra (onde se encontram as coisas inteligentes) estará disponível para reduzir o tráfego de rede, acelerar o processamento dos dados e, até mesmo, permitir que as coisas comuniquem entre si e tomem decisões locais – isto tudo sendo realizado pelos próprios elementos de rede, causando grande impacto em ambientes com menos largura de banda, como aplicações que fazem uso de rede 3G. Voltando à ideia do carro conectado, poderiam ser utilizadas antenas em semáforos para captar os dados para o Fog que, por sua vez, pode realizar um tratamento ou um pré-processamento destes dados, para finalmente enviá-los, de forma consolidada, à Nuvem.

Além dos já diversos dados estruturados de sistemas (em uso e legados) e dos não estruturados (metadados), devido à imensa diversidade de coisas conectadas (sensores, concentradores, dispositivos, etc), estas fontes de dados aumentam significativamente a complexidade em diversos pontos, como na segurança (redes de comunicação, protocolos, sistemas operacionais), na classificação, manipulação, tratamento, armazenamento e a devida disponibilidade segura dos dados, bem como na recuperação de dados para atender às consultas legais, exigindo que as Instituições possuam uma política formal de Governança de Dados evoluída, compreensiva, sólida e com o imprescindível alinhamento às necessidades de negócio, visando a melhoria das tomadas de decisões.

 

www.governancas.com.br - IoT - Fog Computing, Cloud, Big Data

IoT, Fog Computing, Cloud Computing e Big Data

 

 

Mantendo a produção de todas as Coisas sob controle

 

Definição básica de Governança de Dados

 

A Governança de Dados refere-se ao conjunto de ações planejadas, padronizadas e aplicadas ao gerenciamento de dados de uma empresa, desde a definição de sua estratégia, política, processos e frameworks que apoiam a gestão dos dados (disponibilidade, privacidade, qualidade, padronização, etc.), passando pela aquisição, tratamento, classificação e armazenamento dos dados, até o seu expurgo de forma segura e controlada.

A Governança de Dados é definida pelo DAMA[12] como uma disciplina composta por nove áreas de conhecimento integradas de gerenciamento de dados (que abordam as visões estratégicas, táticas e operacionais de dados da empresa) e trata do planejamento, monitoramento e controle sobre o gerenciamento dos ativos de dados.

 

www.governancas.com.br - Data Governance

DAMA Functional Framework

 

De forma sucinta, seguem as responsabilidades de cada área de conhecimento:

  1. Arquitetura de Dados trata da estratégia dos dados empresariais como um todo;
  2. Desenvolvimento de Dados trata da análise, modelagem e implementação das estruturas de dados;
  3. Operacional de Banco de Dados trata do ciclo de vida do dado desde sua aquisição até seu expurgo seguro, em banco de dados;
  4. Segurança de Dados trata da padronização, classificação, acesso apropriado e auditoria dos dados;
  5. Dados Mestres e de Referência trata da gestão dos dados compartilhados para reduzir a redundância e garantir mais qualidade dos dados através da definição de padrões;
  6. Data Warehousing e Business Intelligence trata da gestão dos dados que objetivam a geração de análises para apoio às tomadas de decisão;
  7. Conteúdo e Documentos trata do ciclo de vida de dados externos aos bancos de dados (não estruturados);
  8. Metadados trata da definição de arquitetura, integração, controle e uso dos metadados (dados que contém dados);
  9. Qualidade de Dados trata da especificação, análise, medição e melhoria da qualidade dos dados;

 

[Spoiler]: Na próxima versão deste framework será incluída a décima área de conhecimento:

  1. Integração dos Dados e Interoperabilidade que tratará da aquisição, manipulação, replicação e entrega dos dados.

 

Note que todas as etapas para se manter um dado/metadado na instituição estão mapeadas neste framework, desde o seu planejamento arquitetural para realizar a aquisição, até o seu descarte, passando pelo tratamento, padronização, documentação, disponibilização, segurança, qualidade, integração e análises. Para se aplicar devidamente a Governança de Dados, é necessário um bom planejamento cobrindo todas as áreas de conhecimento, com a devida responsabilização sobre as atividades elencadas, sendo executadas dentro de um ciclo DMAIC[25] – visando garantir a evolução da maturidade na Governança de Dados.

Possuir uma política formal de Governança de Dados é primordial para se manter os dados sob controle. Ela dita as diretrizes de condução/comportamento sobre os dados, define o tratamento de riscos esperado, apoia a Instituição na conformidade regulamentar e legal (compliance), reduz o risco de processos judiciais com a perda de dados sensíveis ou a coleta/uso de dados privados sem a devida autorização do seu proprietário (que podem resultar na depreciação de sua imagem e na perda de clientes e investidores), aponta as metodologias e processos a serem empregados, dentre muitas outras coisas – reforçando, para que a Governança de Dados produza resultados positivos, é necessário que a área de TI esteja plenamente alinhada com o Negócio, ambas focando na estratégia da Instituição[19, 20, 21].

É muito importante que os dados estejam organizados de forma conhecida e metódica, pois visam o apoio nas decisões ou o favorecimento às novas estratégias da Instituição. Os dados são a base para se obter as informações, que, através de análise, geram conhecimento, que, por sua vez, geram inteligência e vantagem competitiva. Afinal, é disto que falamos o tempo todo: tratarmos nossos dados com cuidado para sermos mais competitivos e rentáveis.

A TI, considerada atividade meio para a maioria das Instituições, aumenta ainda mais a sua abrangência e alcance neste cenário onde a IoT se estende aos distantes pontos finais junto aos consumidores, criando oportunidades e cadeias de valores antes inimagináveis.

Com as possíveis 31 bilhões de coisas conectadas produzindo dados de forma massiva, se as áreas de TI não tiverem uma Governança de Dados estabelecida, surgirá uma nova definição para a sigla IoC: “Internet of Chaos” – e esta será a grande diferença entre obter informações relevantes ou simplesmente possuir bandos de dados!

 

Perceba que a Governança de Dados é apenas uma das muitas governanças a serem tratadas… a propósito, como anda a Governança de Dados em sua Instituição?

 

 

Baixe essa publicação aqui!

 

 

Referências

1 – http://www.nytimes.com/2004/02/26/business/small-business-sensing-opportunity-in-mad-cow-worries.html?pagewanted=2&src=pm&_r=0

2 – http://mashable.com/2010/04/27/cows-on-twitter/#CHZQLDaV.5qm

3 – http://www.cisco.com/c/dam/en_us/about/ac79/docs/innov/IoT_IBSG_0411FINAL.pdf

4 – http://www.economist.com/node/17388392

5 – https://publications.csiro.au/rpr/download?pid=csiro:EP137659&dsid=DS2

6 – https://broadbandworldforum.wordpress.com/2013/06/25/smart-networks-smart-cities-smart-cows/

7 – http://www.smh.com.au/it-pro/government-it/cows-on-the-internet-as-broadband-brings-new-ways-to-the-bush-20130621-2oo7s.html

8 – https://news.microsoft.com/features/connected-cows-help-farms-keep-up-with-the-herd/#CjwOFrUv36bA6i76.97

9 – http://www.fujitsu.com/jp/group/kyushu/en/solutions/industry/agriculture/gyuho/

10 – http://evomilk.com.br

11 – http://news.ihsmarkit.com/press-release/technology/tech-companies-creating-strategic-platforms-support-internet-things-ihs-say

12 – https://www.dama.org/content/body-knowledge

13 – https://www.cisco.com/c/dam/en_us/solutions/trends/iot/docs/computing-overview.pdf

14 – http://www.cloudmarket.com.br/blog/cloud-computing/de-nuvem-a-nevoeiro-descubra-o-que-e-fog-computing/

15 – https://home.cern/about/computing

16 – http://www.ni.com/newsletter/51649/en/

17 – http://www.mckinsey.com/industries/automotive-and-assembly/our-insights/whats-driving-the-connected-car

18 – http://www.cisco.com/c/en/us/td/docs/voice_ip_comm/cucm/srnd/ipv6/ipv6srnd/basics.pdf

19 – http://data-informed.com/demystifying-data-governance-what-it-is-and-what-its-not/

20 – http://cio.com.br/gestao/2016/07/14/sete-importantes-consideracoes-sobre-governanca-de-dados/

21 – http://www.cio.com/article/3116812/business-intelligence/understanding-data-governance.html

22 – http://www.computerweekly.com/feature/What-does-a-petabyte-look-like

23 – http://www.zmescience.com/science/how-big-data-can-get/

24 – https://www.governancas.com.br/o-livro/

Deixe uma Resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Você pode usar tags e atributos HTML:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>