IBM Parallel Sysplex - IBM Parallel Sysplex

Na computação, um Parallel Sysplex é um cluster de mainframes IBM atuando juntos como uma única imagem do sistema com z / OS . Usado para recuperação de desastres, o Parallel Sysplex combina compartilhamento de dados e computação paralela para permitir que um cluster de até 32 sistemas compartilhe uma carga de trabalho para alto desempenho e alta disponibilidade .

Sysplex

Em 1990, os computadores mainframe IBM introduziram o conceito de um Complexo de Sistemas , comumente chamado de Sysplex , com MVS / ESA SPV4.1. Isso permite que componentes autorizados em até oito partições lógicas (LPARs) se comuniquem e cooperem uns com os outros usando o protocolo XCF .

Os componentes de um Sysplex incluem:

  • Uma fonte de tempo comum para sincronizar os relógios de todos os sistemas membros. Isso pode envolver um temporizador Sysplex (Modelo 9037) ou o Protocolo de Tempo do Servidor (STP)
  • Global Resource Serialization (GRS), que permite que vários sistemas acessem os mesmos recursos simultaneamente, serializando quando necessário para garantir acesso exclusivo
  • Cross System Coupling Facility ( XCF ), que permite que os sistemas se comuniquem ponto a ponto
  • Conjuntos de dados de casal (CDS)

Os usuários de um Sysplex (base) incluem:

  • Serviços de console - permitindo mesclar vários consoles MCS de diferentes membros do Sysplex, fornecendo uma única imagem do sistema para Operações
  • Automatic Restart Manager (ARM) - Política para direcionar o reinício automático de trabalhos com falha ou tarefas iniciadas no mesmo sistema se estiver disponível ou em outro LPAR no Sysplex
  • Sysplex Failure Manager (SFM) - Política que especifica ações automatizadas a serem tomadas quando certas falhas ocorrem, como perda de um membro de um Sysplex ou ao reconfigurar sistemas
  • Workload Manager (WLM) - gerenciamento de desempenho baseado em política de cargas de trabalho heterogêneas em uma ou mais imagens z / OS ou mesmo no AIX
  • Global Resource Serialization (GRS) - Comunicação - permite o uso de links XCF em vez de canais dedicados para GRS e RNLs dinâmicos
  • Tivoli OPC - Suporte Hot Standby para o controlador
  • RACF (produto de software de segurança de mainframe da IBM) - comandos RVARY e SETROPTS em todo o Sysplex
  • Compartilhamento de arquivo PDSE
  • Multisistema VLFNOTE, SDUMP, SLIP, DAE
  • Resource Measurement Facility (RMF) - Relatórios de todo o Sysplex
  • CICS - usa XCF para fornecer melhor desempenho e tempo de resposta do que usar VTAM para roteamento de transações e envio de funções.
  • zFS - Usando comunicação XCF para acessar dados em vários LPARs

Parallel Sysplex

Representação esquemática de um Sysplex Paralelo

O Parallel Sysplex foi introduzido com a adição do Coupling Facility (CF) com links de acoplamento para comunicação de alta velocidade, com suporte ao sistema operacional MVS / ESA V5.1, juntamente com os modelos de mainframe em abril de 1994.

O Coupling Facility (CF) pode residir em um servidor autônomo dedicado configurado com processadores que podem executar o código de controle do Coupling Facility (CFCC), como processadores integrais nos próprios mainframes configurados como ICFs (Internal Coupling Facilities), ou menos comum, como LPARs normais. O CF contém estruturas de bloqueio, lista e cache para ajudar na serialização, passagem de mensagens e consistência de buffer entre vários LPARs.

O objetivo principal de um Parallel Sysplex é fornecer recursos de compartilhamento de dados, permitindo vários bancos de dados para leituras e gravações diretas em dados compartilhados. Isso pode fornecer benefícios de

  • Ajude a remover pontos únicos de falha no servidor, LPAR ou subsistemas
  • Disponibilidade do aplicativo
  • Imagem Única do Sistema
  • Balanceamento de Sessão Dinâmica
  • Roteamento de transação dinâmica
  • Capacidade escalável

Os bancos de dados em execução no servidor System z que podem tirar proveito disso incluem:

Outros componentes podem usar o Coupling Facility para ajudar no gerenciamento do sistema, desempenho ou requisitos de hardware reduzidos. Chamado de “Compartilhamento de recursos”, os usos incluem:

  • Catálogo - catálogos compartilhados para melhorar o desempenho, reduzindo I / O para um conjunto de dados de catálogo no disco
  • CICS - Usando o CF para fornecer recursos de compartilhamento e recuperação para contadores nomeados, tabelas de dados ou dados temporários
  • DFSMShsm - Balanceamento de carga de trabalho para a carga de trabalho de migração de dados
  • GRS Star - desempenho reduzido de CPU e tempo de resposta para alocação de conjunto de dados.

A troca de fita usa a estrutura GRS para fornecer compartilhamento de unidades de fita entre imagens z / OS.

  • Gerenciamento dinâmico de CHPID (DCM) e gerenciamento de prioridade de I / O
  • Ponto de verificação JES2 - fornece acesso aprimorado a um ponto de verificação multissistema
  • Operlog / Logrec - Registros multissistema mesclados para gerenciamento de sistema
  • RACF - conjunto de dados compartilhados para simplificar o gerenciamento de segurança no Parallel Sysplex
  • WebSphere MQ - Filas de mensagens compartilhadas para disponibilidade e flexibilidade
  • WLM - fornece suporte para Intelligent Resource Director (IRD) para estender o z / OS Workload Manager para ajudar a gerenciar recursos de CPU e I / O em vários LPARs dentro do Parallel Sysplex. As funções incluem gerenciamento de CPU LPAR, IRD.

Gerenciamento de enclave multi-sistema para melhor desempenho

  • XCF Star - Requisitos de hardware reduzidos e gerenciamento simplificado de caminhos de comunicação XCF

Os principais componentes de um Sysplex Paralelo incluem:

  • Hardware Coupling Facility (CF ou ICF), permitindo que vários processadores compartilhem, armazenem em cache, atualizem e equilibrem o acesso aos dados;
  • Sysplex Timers ou Server Time Protocol para sincronizar os relógios de todos os sistemas membros;
  • Cabeamento redundante de alta velocidade e alta qualidade;
  • Software ( serviços do sistema operacional e, geralmente, middleware como o DB2 ).

O Coupling Facility pode ser um sistema externo dedicado (um pequeno mainframe, como um System z9 BC, especialmente configurado com apenas processadores de recurso de acoplamento) ou processadores integrais nos próprios mainframes configurados como ICFs (Internal Coupling Facilities). Recomenda-se que pelo menos um CF externo seja usado em um sysplex paralelo. É recomendado que um Sysplex Paralelo tenha pelo menos dois CFs e / ou ICFs para redundância, especialmente em um ambiente de compartilhamento de dados de produção. O Server Time Protocol (STP) substituiu os Sysplex Timers a partir de 2005 para os modelos de mainframe System z z990 e mais recentes. Um Sysplex Timer é uma parte fisicamente separada do hardware do mainframe, enquanto o STP é um recurso integral dentro do microcódigo do mainframe. Com STP e ICFs, é possível construir uma instalação completa do Parallel Sysplex com dois mainframes conectados. Além disso, um único mainframe pode conter o equivalente interno de um Parallel Sysplex físico completo, útil para testes de aplicativos e propósitos de desenvolvimento.

O IBM Systems Journal dedicou uma edição completa a todos os componentes de tecnologia.

Protocolo de Tempo do Servidor

Manter o tempo preciso é importante em sistemas de computador. Por exemplo, em um sistema de processamento de transações, o processo de recuperação reconstrói os dados da transação a partir dos arquivos de log. Se os registros de data e hora forem usados ​​para registro de dados de transação e os registros de data e hora de duas transações relacionadas forem transpostos da sequência real, a reconstrução do banco de dados de transações pode não corresponder ao estado anterior ao processo de recuperação. O Server Time Protocol (STP) pode ser usado para fornecer uma única fonte de tempo entre vários servidores. Com base nos conceitos do Network Time Protocol, um dos servidores System z é designado pelo HMC como a fonte de tempo primária (Stratum 1). Em seguida, ele envia sinais de temporização para os servidores Stratum 2 por meio do uso de links de acoplamento. Os servidores Stratum 2, por sua vez, enviam sinais de temporização para os servidores Stratum 3. Para fornecer disponibilidade, um dos servidores pode ser designado como fonte de tempo de backup e um terceiro servidor pode ser designado como Árbitro para ajudar o Servidor de Tempo de Backup a determinar se ele deve assumir a função de Primário durante condições de exceção.

O STP está disponível em servidores System z desde 2005.

Mais informações sobre o STP estão disponíveis em “Server Time Protocol Planning Guide”.

Sysplex Paralelo Geograficamente Disperso

Geographically Dispersed Parallel Sysplex ( GDPS ) é uma extensão do Parallel Sysplex de mainframes localizados, potencialmente, em diferentes cidades. O GDPS inclui configurações para um único site ou configurações de vários sites:

  • GDPS HyperSwap Manager: baseado na tecnologia de cópia remota ponto a ponto (PPRC) síncrona para uso em um único data center. Os dados são copiados do dispositivo de armazenamento primário para um dispositivo de armazenamento secundário. No caso de uma falha no dispositivo de armazenamento primário, o sistema transforma automaticamente o dispositivo de armazenamento secundário em primário, geralmente sem interromper os aplicativos em execução.
  • GDPS Metro: baseado na tecnologia de espelhamento síncrono de dados (PPRC) que pode ser usada em mainframes separados por 200 quilômetros. Em um modelo de dois sistemas, ambos os sites podem ser administrados como se fossem um único sistema. No caso de falha de um sistema ou dispositivo de armazenamento, a recuperação pode ocorrer automaticamente, com perda limitada ou nenhuma perda de dados.
  • GDPS Global - XRC: é baseado na tecnologia Assíncrona Extended Remote Copy (XRC) sem restrições de distância. O XRC copia dados em dispositivos de armazenamento entre dois locais de forma que apenas alguns segundos de dados possam ser perdidos no caso de uma falha. Se ocorrer uma falha, um usuário deve iniciar o processo de recuperação. Uma vez iniciado, o processo é automático na recuperação de dispositivos de armazenamento secundários e reconfiguração de sistemas.
  • GDPS Global - GM: baseia-se na tecnologia assíncrona do IBM Global Mirror sem restrições de distância. Ele foi projetado para recuperação de uma falha total em um local. Ele ativará dispositivos de armazenamento secundários e sistemas de backup.
  • GDPS Metro Global - GM: Esta é uma configuração para sistemas com mais de dois sistemas / sites, para fins de recuperação de desastres. É baseado no GDPS Metro em conjunto com o GDPS Global - GM.
  • GDPS Metro Global - XRC: Esta é uma configuração para sistemas com mais de dois sistemas / sites para fins de recuperação de desastres. É baseado no GDPS Metro junto com o GDPS Global - XRC.
  • Disponibilidade Contínua GDPS: Esta é uma solução de recuperação de desastres / disponibilidade contínua, baseada em dois ou mais sites, separados por distâncias ilimitadas, executando os mesmos aplicativos e tendo os mesmos dados para fornecer balanceamento de carga de trabalho entre sites. O IBM Multi-site Workload Lifeline, por meio de seu monitoramento e roteamento de carga de trabalho, desempenha um papel integral na solução GDPS Continuous Availability.

Veja também

Referências

links externos