Interoperabilidade semântica - Semantic interoperability

A interoperabilidade semântica é a capacidade dos sistemas de computador de trocar dados com significado compartilhado e inequívoco. A interoperabilidade semântica é um requisito para habilitar lógica computável por máquina , inferência, descoberta de conhecimento e federação de dados entre sistemas de informação .

A interoperabilidade semântica está, portanto, preocupada não apenas com o empacotamento de dados ( sintaxe ), mas com a transmissão simultânea do significado com os dados ( semântica ). Isso é feito adicionando dados sobre os dados ( metadados ), vinculando cada elemento de dados a um vocabulário compartilhado e controlado . O significado dos dados é transmitido com os próprios dados, em um " pacote de informações " autodescritivo e independente de qualquer sistema de informação. É esse vocabulário compartilhado e seus links associados a uma ontologia que fornece a base e a capacidade de interpretação, inferência e lógica da máquina.

A interoperabilidade sintática (veja abaixo ) é um pré-requisito para a interoperabilidade semântica. A interoperabilidade sintática refere-se aos mecanismos de empacotamento e transmissão de dados. Na área da saúde, o HL7 está em uso há mais de trinta anos (que antecede a internet e a tecnologia da web) e usa a barra vertical (|) como delimitador de dados. O padrão atual da Internet para marcação de documentos é XML , que usa "<>" como delimitador de dados. Os delimitadores de dados não transmitem nenhum significado aos dados, a não ser para estruturá-los. Sem um dicionário de dados para traduzir o conteúdo dos delimitadores, os dados permanecem sem sentido. Embora haja muitas tentativas de criar dicionários de dados e modelos de informação para associar a esses mecanismos de empacotamento de dados, nenhum foi prático de implementar. Isso apenas perpetuou a "babelização" contínua de dados e a incapacidade de trocar dados com significado.

Desde a introdução do conceito de Web Semântica por Tim Berners-Lee em 1999, tem havido um crescente interesse e aplicação dos padrões W3C (World Wide Web Consortium) para fornecer intercâmbio semântico de dados em escala da web, federação e recursos de inferência.

Semântica em função da interoperabilidade sintática

A interoperabilidade sintática, fornecida, por exemplo, pelos padrões XML ou SQL , é um pré-requisito para a semântica. Envolve um formato de dados comum e um protocolo comum para estruturar quaisquer dados de modo que a maneira de processar as informações seja interpretável a partir da estrutura. Ele também permite a detecção de erros sintáticos, permitindo que os sistemas de recebimento solicitem o reenvio de qualquer mensagem que pareça truncada ou incompleta. Nenhuma comunicação semântica é possível se a sintaxe for distorcida ou incapaz de representar os dados. No entanto, as informações representadas em uma sintaxe podem, em alguns casos, ser traduzidas com precisão em uma sintaxe diferente. Onde a tradução precisa das sintaxes é possível, os sistemas que usam sintaxes diferentes também podem interoperar com precisão. Em alguns casos, a capacidade de traduzir com precisão as informações entre sistemas usando diferentes sintaxes pode ser limitada a uma direção, quando os formalismos usados ​​têm diferentes níveis de expressividade (capacidade de expressar informações).

Uma única ontologia contendo representações de cada termo usado em cada aplicação é geralmente considerada impossível, devido à rápida criação de novos termos ou atribuições de novos significados para termos antigos. No entanto, embora seja impossível antecipar todos os conceitos que um usuário pode desejar representar em um computador, existe a possibilidade de encontrar algum conjunto finito de representações de conceitos "primitivos" que podem ser combinados para criar qualquer um dos conceitos mais específicos que os usuários pode precisar para qualquer determinado conjunto de aplicativos ou ontologias. Ter uma ontologia de base (também chamada de ontologia superior ) que contém todos aqueles elementos primitivos forneceria uma base sólida para a interoperabilidade semântica geral e permitiria aos usuários definir quaisquer novos termos de que precisam usando o inventário básico de elementos de ontologia, e ainda ter aqueles novos termos definidos adequadamente interpretados por qualquer outro sistema de computador que possa interpretar a ontologia de base básica. Se o número de tais representações de conceitos primitivos é de fato finito, ou se expandirá indefinidamente, é uma questão sob investigação ativa. Se for finita, uma ontologia de base estável adequada para suportar a interoperabilidade semântica precisa e geral pode evoluir depois que alguma ontologia de base inicial foi testada e usada por uma ampla variedade de usuários. No momento, nenhuma ontologia de base foi adotada por uma ampla comunidade, portanto, essa ontologia de base estável ainda está no futuro.

Palavras e significados

Um mal-entendido persistente que ocorre na discussão da semântica é "a confusão de palavras e significados". O significado das palavras muda, às vezes rapidamente. Mas uma linguagem formal como a usada em uma ontologia pode codificar os significados (semântica) de conceitos de uma forma que não muda. A fim de determinar qual é o significado de uma determinada palavra (ou termo em um banco de dados , por exemplo), é necessário rotular cada representação de conceito fixo em uma ontologia com a (s) palavra (s) ou termo (s) que podem se referir a esse conceito. Quando várias palavras se referem ao mesmo conceito (fixo) na linguagem, isso é chamado de sinonímia ; quando uma palavra é usada para se referir a mais de um conceito, isso é chamado de ambigüidade .

Ambigüidade e sinonímia estão entre os fatores que tornam muito difícil a compreensão da linguagem pelo computador. O uso de palavras para se referir a conceitos (os significados das palavras usadas) é muito sensível ao contexto e ao propósito de qualquer uso de muitos termos legíveis por humanos. O uso de ontologias no suporte à interoperabilidade semântica é fornecer um conjunto fixo de conceitos cujos significados e relações são estáveis ​​e podem ser aceitos pelos usuários. A tarefa de determinar quais termos em quais contextos (cada banco de dados é um contexto diferente) é então separada da tarefa de criar a ontologia e deve ser assumida pelo designer de um banco de dados ou pelo designer de um formulário para entrada de dados , ou o desenvolvedor de um programa para compreensão de linguagem. Quando o significado de uma palavra usada em algum contexto interoperável é alterado, então, para preservar a interoperabilidade, é necessário alterar o ponteiro para o (s) elemento (s) de ontologia que especifica o significado dessa palavra.

Requisitos de representação de conhecimento e linguagens

Uma linguagem de representação do conhecimento pode ser suficientemente expressiva para descrever nuances de significado em campos bem compreendidos. Existem pelo menos cinco níveis de complexidade destes.

Para dados semiestruturados gerais, pode-se usar uma linguagem de propósito geral, como XML.

Linguagens com todo o poder da lógica de predicado de primeira ordem podem ser necessárias para muitas tarefas.

As linguagens humanas são altamente expressivas, mas são consideradas muito ambíguas para permitir a interpretação precisa desejada, dado o nível atual da tecnologia da linguagem humana.

Acordo prévio não é necessário

A interoperabilidade semântica pode ser distinguida de outras formas de interoperabilidade considerando se a informação transferida tem, em sua forma comunicada, todo o significado necessário para o sistema receptor a interpretar corretamente, mesmo quando os algoritmos usados ​​pelo sistema receptor são desconhecidos do sistema de envio. Considere enviar um número:

Se esse número se destina a ser a soma de dinheiro devido por uma empresa a outra, implica alguma ação ou omissão por parte de quem o envia e de quem o recebe.

Pode ser interpretado corretamente se for enviado em resposta a uma solicitação específica e recebido na hora e na forma esperada. Essa interpretação correta não depende apenas do número em si, que poderia representar quase qualquer um dos milhões de tipos de medição quantitativa, mas depende estritamente das circunstâncias da transmissão. Ou seja, a interpretação depende de ambos os sistemas, esperando que os algoritmos no outro sistema usem o número exatamente no mesmo sentido, e depende ainda de todo o envelope de transmissões que precedeu a transmissão real do número vazio.

Por outro lado, se o sistema transmissor não sabe como a informação será usada por outros sistemas, é necessário ter um acordo compartilhado sobre como a informação com algum significado específico (dentre muitos significados possíveis) aparecerá em uma comunicação. Para uma tarefa específica, uma solução é padronizar um formulário, como uma solicitação de pagamento; essa solicitação deveria codificar, de forma padronizada, todas as informações necessárias para avaliá-la, tais como: o agente devedor do dinheiro, o agente devedor do dinheiro, a natureza da ação que deu origem à dívida, os agentes, os bens , serviços e outros participantes dessa ação; o tempo da ação; o valor devido e a moeda em que a dívida é contabilizada; o tempo permitido para o pagamento; a forma de pagamento exigida; e outras informações. Quando dois ou mais sistemas concordam sobre como interpretar as informações em tal solicitação, eles podem alcançar interoperabilidade semântica para aquele tipo específico de transação . Para a interoperabilidade semântica em geral, é necessário fornecer maneiras padronizadas de descrever os significados de muito mais coisas do que apenas transações comerciais, e o número de conceitos cuja representação precisa ser acordada é de, no mínimo, vários milhares.

Pesquisa ontológica

Como alcançar a interoperabilidade semântica para mais do que alguns cenários restritos é atualmente uma questão de pesquisa e discussão. Para o problema de interoperabilidade semântica geral, alguma forma de ontologia de base (' ontologia superior ') é necessária que seja suficientemente abrangente para fornecer a definição de conceitos para ontologias mais especializadas em vários domínios. Na última década, mais de dez ontologias básicas foram desenvolvidas, mas nenhuma ainda foi adotada por uma ampla base de usuários.

A necessidade de uma única ontologia abrangente e abrangente para apoiar a interoperabilidade semântica pode ser evitada projetando-se a ontologia de base comum como um conjunto de conceitos básicos ("primitivos") que podem ser combinados para criar as descrições lógicas dos significados dos termos usados ​​em ontologias de domínio local ou bancos de dados locais. Essa tática é baseada no princípio de que:

Se:

(1) os significados e o uso dos elementos da ontologia primitiva na ontologia de base são acordados, e 
(2) os elementos da ontologia nas ontologias de domínio são construídos como combinações lógicas dos elementos na ontologia de base,

Então:

Os significados pretendidos dos elementos da ontologia de domínio podem ser calculados automaticamente usando um raciocinador FOL (lógica de primeira ordem), por qualquer sistema que aceite os significados dos elementos na ontologia de base, e tenha a ontologia de base e as especificações lógicas do elementos na ontologia de domínio.

Portanto:

Qualquer sistema que deseja interoperar com precisão com outro sistema precisa transmitir apenas os dados a serem comunicados, além de quaisquer descrições lógicas dos termos usados ​​nesses dados que foram criados localmente e ainda não estão na ontologia de base comum.

Essa tática, em seguida, limita a necessidade de um acordo prévio sobre significados apenas aos elementos da ontologia do comum Fundação Ontologia (FO). Com base em várias considerações, isso pode exigir menos de 10.000 elementos (tipos e relações). No entanto, para facilidade de compreensão e uso, mais elementos de ontologia com detalhes e especificações adicionais podem ajudar a encontrar a localização exata no FO onde conceitos de domínio específicos podem ser encontrados ou adicionados.

Na prática, junto com o FO focado em representações dos conceitos primitivos, um conjunto de ontologias de extensão de domínio para o FO com elementos especificados usando os elementos de FO provavelmente também será usado. Essas extensões pré-existentes diminuirão o custo de criação de ontologias de domínio, fornecendo aos elementos existentes o significado pretendido, e reduzirão a chance de erro usando elementos que já foram testados. Ontologias de extensão de domínio podem ser logicamente inconsistentes entre si, e isso precisa ser determinado se diferentes extensões de domínio forem usadas em qualquer comunicação.

Também está sendo investigado se o uso de uma ontologia de base única pode ser evitado por técnicas sofisticadas de mapeamento entre ontologias desenvolvidas de forma independente.

Importância

O significado prático da interoperabilidade semântica foi medido por vários estudos que estimam o custo (em eficiência perdida) devido à falta de interoperabilidade semântica. Um estudo, enfocando a perda de eficiência na comunicação de informações de saúde, estimou que US $ 77,8 bilhões por ano poderiam ser economizados com a implementação de um padrão de interoperabilidade eficaz nessa área. Outros estudos, da indústria da construção e da cadeia de suprimentos da fabricação de automóveis, estimam custos de mais de US $ 10 bilhões por ano devido à falta de interoperabilidade semântica nessas indústrias. No total, esses números podem ser extrapolados para indicar que bem mais de US $ 100 bilhões por ano são perdidos devido à falta de um padrão de interoperabilidade semântica amplamente usado apenas nos Estados Unidos.

Ainda não houve um estudo sobre cada campo de política que pode oferecer grandes economias de custo aplicando padrões de interoperabilidade semântica. Mas para ver quais campos de política são capazes de lucrar com a interoperabilidade semântica, consulte ' Interoperabilidade ' em geral. Esses campos de política são governo eletrônico , saúde, segurança e muitos mais. A UE também criou o Centro de Interoperabilidade Semântica Europa em junho de 2007.

Interoperabilidade Semântica para Internet das Coisas

A transformação digital traz enormes benefícios ao permitir que as organizações sejam mais eficientes, mais flexíveis e mais ágeis na resposta às mudanças nos negócios e nas condições operacionais. Isso envolve a necessidade de integrar dados e serviços heterogêneos em todas as organizações. A interoperabilidade semântica aborda a necessidade de compreensão compartilhada do significado e do contexto.

Para apoiar isso, um grupo de especialistas entre organizações envolvendo ISO / IEC JTC1, ETSI, oneM2M e W3C está colaborando com a AIOTI na aceleração da adoção de tecnologias semânticas na IoT. O grupo publicou recentemente dois white papers conjuntos sobre interoperabilidade semântica, respectivamente denominados “Soluções de IoT Semântica - Uma Perspectiva do Desenvolvedor” e “Rumo a padrões de interoperabilidade semântica baseados em ontologias“. Isso segue o sucesso do artigo anterior sobre "Interoperabilidade Semântica para a Web das Coisas".


Fonte:

“Soluções Semânticas de IoT - Uma Perspectiva do Desenvolvedor”

“Rumo a padrões de interoperabilidade semântica baseados em ontologias“.

Isso segue o sucesso do artigo anterior sobre "Interoperabilidade Semântica para a Web das Coisas".

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability- Targeting-developers-and-standardization-engineering /

Veja também

Referências

links externos