Arquitetura de dados - Data architecture

Na tecnologia da informação , a arquitetura de dados é composta por modelos, políticas, regras ou padrões que governam quais dados são coletados e como eles são armazenados, organizados, integrados e colocados em uso em sistemas de dados e nas organizações. Os dados geralmente são um dos vários domínios de arquitetura que formam os pilares de uma arquitetura corporativa ou arquitetura de solução .

Visão geral

Uma arquitetura de dados visa definir padrões de dados para todos os seus sistemas de dados como uma visão ou um modelo das eventuais interações entre esses sistemas de dados. A integração de dados , por exemplo, deve depender dos padrões de arquitetura de dados, uma vez que a integração de dados requer interações de dados entre dois ou mais sistemas de dados. Uma arquitetura de dados, em parte, descreve as estruturas de dados usadas por uma empresa e seu software de aplicativos de computador . As arquiteturas de dados tratam de dados em armazenamento, dados em uso e dados em movimento; descrições de armazenamentos de dados, grupos de dados e itens de dados; e mapeamentos desses artefatos de dados para qualidades de dados, aplicativos, locais, etc.

Essencial para perceber o estado de destino, a Arquitetura de Dados descreve como os dados são processados, armazenados e utilizados em um sistema de informações . Fornece critérios para operações de processamento de dados de forma a possibilitar o desenho de fluxos de dados e também o controle do fluxo de dados no sistema.

O arquiteto de dados é normalmente responsável por definir o estado de destino, alinhar durante o desenvolvimento e, em seguida, acompanhar para garantir que os aprimoramentos sejam feitos no espírito do projeto original.

Durante a definição do estado de destino, a Arquitetura de Dados divide um assunto até o nível atômico e, em seguida, o constrói de volta à forma desejada. O arquiteto de dados divide o assunto passando por 3 processos arquitetônicos tradicionais:

  • Conceitual - representa todas as entidades comerciais .
  • Lógico - representa a lógica de como as entidades estão relacionadas.
  • Físico - a realização dos mecanismos de dados para um tipo específico de funcionalidade.

A coluna "dados" do Zachman Framework para arquitetura empresarial -

Camada Visualizar Dados (o quê) Stakeholder
1 Escopo / Contextual Lista de coisas e padrões arquitetônicos importantes para o negócio Planejador
2 Modelo de Negócios / Conceitual Modelo semântico ou modelo de dados conceituais / corporativos Proprietário
3 Modelo de sistema / lógico Modelo de dados corporativos / lógicos Designer
4 Modelo de Tecnologia / Físico Modelo de Dados Físicos Construtor
5 Representações Detalhadas Bancos de dados reais Subempreiteiro

Nesse segundo sentido mais amplo, a arquitetura de dados inclui uma análise completa dos relacionamentos entre as funções de uma organização, tecnologias disponíveis e tipos de dados .

A arquitetura de dados deve ser definida na fase de planejamento do projeto de um novo sistema de processamento e armazenamento de dados. Convém que os principais tipos e fontes de dados necessários para dar suporte a uma empresa sejam identificados de maneira completa, consistente e compreensível. O principal requisito neste estágio é definir todas as entidades de dados relevantes, não especificar itens de hardware de computador . Uma entidade de dados é qualquer coisa real ou abstrata sobre a qual uma organização ou indivíduo deseja armazenar dados.

Arquitetura de dados físicos

A arquitetura de dados físicos de um sistema de informação faz parte de um plano de tecnologia . Como o próprio nome indica, o plano de tecnologia concentra-se nos elementos tangíveis reais a serem usados ​​na implementação do design da arquitetura de dados . A arquitetura de dados físicos abrange a arquitetura de banco de dados. A arquitetura do banco de dados é um esquema da tecnologia de banco de dados real que oferecerá suporte à arquitetura de dados projetada.

Elementos da arquitetura de dados

Certos elementos devem ser definidos durante a fase de design do esquema de arquitetura de dados. Por exemplo, deve ser descrita a estrutura administrativa que será estabelecida para gerenciar os recursos de dados. Além disso, devem ser definidas as metodologias que serão empregadas para armazenar os dados. Além disso, deve ser gerada uma descrição da tecnologia de banco de dados a ser empregada, bem como uma descrição dos processos que irão manipular os dados. Também é importante para projetar as interfaces aos dados por outros sistemas, bem como um projeto para o infra-estrutura que irá suportar operações de dados comum (ou seja, procedimentos de emergência, a importação de dados , backups de dados , externos transferências de dados ).

Sem a orientação de um projeto de arquitetura de dados devidamente implementado, operações de dados comuns podem ser implementadas de maneiras diferentes, tornando difícil entender e controlar o fluxo de dados dentro de tais sistemas. Esse tipo de fragmentação é altamente indesejável devido ao custo potencial aumentado e às desconexões de dados envolvidas. Esse tipo de dificuldade pode ser encontrado em empresas de rápido crescimento e também em empresas que atendem a diferentes linhas de negócios (por exemplo , produtos de seguros ).

Executada corretamente, a fase de arquitetura de dados do planejamento do sistema de informação força uma organização a especificar e descrever precisamente os fluxos de informação internos e externos. Esses são padrões que a organização pode não ter tido tempo para conceituar anteriormente. Portanto, é possível, neste estágio, identificar deficiências de informações dispendiosas, desconexões entre departamentos e desconexões entre sistemas organizacionais que podem não ter sido evidentes antes da análise da arquitetura de dados.

Restrições e influências

Várias restrições e influências afetarão o design da arquitetura de dados. Isso inclui requisitos corporativos, motivadores de tecnologia, economia, políticas de negócios e necessidades de processamento de dados.

Requisitos da empresa
Isso geralmente inclui elementos como expansão econômica e eficaz do sistema, níveis de desempenho aceitáveis ​​(especialmente a velocidade de acesso do sistema), confiabilidade da transação e gerenciamento transparente de dados . Além disso, a conversão de dados brutos, como registros de transações e arquivos de imagem, em formas de informação mais úteis, por meio de recursos como data warehouses, também é um requisito organizacional comum , uma vez que permite a tomada de decisões gerenciais e outros processos organizacionais. Uma das técnicas de arquitetura é a divisão entre o gerenciamento de dados de transação e dados de referência (mestre) . Outro é dividir os sistemas de captura de dados dos sistemas de recuperação de dados (como feito em um data warehouse).
Drivers de tecnologia
Geralmente, eles são sugeridos pelos designs de arquitetura de dados e de banco de dados concluídos. Além disso, alguns impulsionadores de tecnologia derivarão de estruturas e padrões de integração organizacional existentes, economia organizacional e recursos locais existentes (por exemplo, licenciamento de software adquirido anteriormente ). Em muitos casos, a integração de vários sistemas legados requer o uso de tecnologias de virtualização de dados .
Economia
Esses também são fatores importantes que devem ser considerados durante a fase de arquitetura de dados. É possível que algumas soluções, embora ótimas em princípio, não sejam candidatas em potencial devido ao seu custo. Fatores externos como ciclo de negócios , taxas de juros, condições de mercado e considerações legais podem ter um efeito sobre as decisões relevantes para a arquitetura de dados.
Políticas de negócios
As políticas de negócios que também orientam o design da arquitetura de dados incluem políticas organizacionais internas, regras de órgãos reguladores , padrões profissionais e leis governamentais aplicáveis que podem variar de acordo com a agência aplicável . Essas políticas e regras ajudarão a descrever a maneira pela qual a empresa deseja processar seus dados.
Necessidades de processamento de dados
Estes incluem transações precisas e reproduzíveis realizadas em grandes volumes, armazenamento de dados para o suporte de sistemas de informação de gestão (e mineração de dados potencial ), relatórios periódicos repetitivos , relatórios ad hoc e suporte de várias iniciativas organizacionais conforme necessário (ou seja, orçamentos anuais, novo produto desenvolvimento).

Veja também

Referências

Leitura adicional

  • Bass, L .; John, B .; & Kates, J. (2001). Atingindo a usabilidade por meio da arquitetura de software , Carnegie Mellon University.
  • Lewis, G .; Comella-Dorda, S .; Place, P .; Plakosh, D .; & Seacord, R., (2001). Guia de Arquitetura de Dados do Sistema de Informação Empresarial Carnegie Mellon University.
  • Adleman, S .; Moss, L .; Abai, M. (2005). Estratégia de dados Addison-Wesley Professional.

links externos