EIDR - EIDR

Entertainment ID Registry Association
EIDR Logo 1.png
Formação 2010
Tipo 501 (c) (6) sociedade sem fins lucrativos
Quartel general Redwood City, CA
Diretor executivo
Kip Welch
Local na rede Internet www .eidr .org

O Entertainment Identifier Registry , ou EIDR , é um sistema identificador global exclusivo para uma ampla gama de objetos audiovisuais, incluindo filmes , televisão e programas de rádio . O sistema de identificação resolve um identificador para um registro de metadados que está associado a títulos de nível superior, edições, DVDs , codificações, clipes e mash-ups . O EIDR também fornece identificadores para provedores de serviços de vídeo, como redes de transmissão e a cabo.

Em junho de 2020, EIDR continha mais de 2 milhões de registros, incluindo quase 400 mil filmes e quase um milhão de episódios de mais de 40.000 séries de TV.

EIDR é uma implementação de um identificador de objeto digital (DOI).

História

Os sistemas de identificação de ativos de mídia existem há décadas. A motivação comum para sua criação é permitir o gerenciamento de ativos de mídia por meio da atribuição de um id único a um conjunto de metadados que representam características salientes de cada ativo. Com o tempo, esses sistemas tendem a proliferar, com cada um surgindo para lidar com um conjunto específico de questões. Como resultado, há uma variação considerável entre os sistemas em termos de quais ativos são categorizados, quais metadados estão associados a cada ativo e a própria definição de um ativo. Para citar alguns exemplos, deve uma " versão do diretor " de um filme ser diferente do lançamento teatral original? Como as variações regionais (por exemplo, tradução do título ou diálogo em línguas estrangeiras) devem ser consideradas? Complicações adicionais incluem os procedimentos (e credenciais necessárias) para adicionar novos ativos, editar ativos existentes e criar ativos derivados.

O EIDR foi criado para resolver esses problemas, bem como outros encontrados em fluxos de trabalho de ativos de vídeo , tanto em um contexto business-to-business quanto nas atividades de pós-produção intramuros de produtores de conteúdo. EIDR tem as seguintes características:

  • Um registro central disponível para todos os participantes
  • Capacidade de registrar facilmente novos ativos
  • Um ID de ativo que é imutável (e em particular com respeito a mudanças na propriedade do ativo ou localização dos metadados ou do próprio ativo)
  • Detecção / prevenção de duplicatas do mesmo ativo sendo criadas
  • Capacidade de criar um conjunto de recursos de vídeo derivados de uma obra abstrata (por exemplo, lançamento teatral original, versão do diretor, variantes de linguagem)
  • Capacidade de agrupar recursos de vídeo por relações mais gerais (por exemplo, episódios de uma temporada de uma série de TV)
  • Um conjunto básico de metadados para diferenciar ativos, mesmo quando intimamente relacionados
  • Escalável, imutável, persistente

O EIDR visa complementar, não substituir, os sistemas de identificação de ativos existentes. Ao contrário, um recurso importante é permitir que um registro EIDR inclua referências ao ID desse recurso em outros sistemas. Esse recurso é particularmente útil para arquivos de filmes e televisão, tornando mais fácil para eles cruzar referências de seus acervos com outras fontes para o trabalho e metadados sobre ele. Por definição, o EIDR não replica recursos de outros sistemas de ID de ativos, por exemplo, sistemas comerciais que buscam agregar valor por meio de metadados aprimorados (por exemplo, resumos de trama, detalhes de produção). Também não é objetivo rastrear informações de propriedade e direitos, que podem, no entanto, ser implementadas como aplicativos que usam o ID de EIDR.

Modelo de conteúdo

EIDR é construído em uma coleção de registros (que são subdivididos em campos) que são armazenados em um registro central. Esses registros são referenciados externamente por DOIs, que são atribuídos quando um registro é criado, e cada identificador é imutável depois disso. O sistema de resolução de identificadores subjacente aos DOIs é o Handle System e, portanto, cada ID de conteúdo EIDR nativo é um identificador formatado, em especificidade crescente, para lidar com os padrões DOI e EIDR.

Formato de Content ID

A forma canônica de um ID de conteúdo EIDR é uma instância de um identificador e tem o formato:

10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C

Onde

  • 10.5240 é o prefixo DOI para um ativo EIDR. O "10" indica que o identificador é um DOI; outros prefixos são atribuídos a outros tipos de ativos (por exemplo, publicações acadêmicas ). Os dígitos entre "." e "/" forma o subprefixo, que indica qual agência de registro dentro da International DOI Foundation (IDF) tem direitos para gerenciar essas alças. "5240" é atribuído à Associação EIDR.
  • XXXX-XXXX-XXXX-XXXX-XXXX-C é o sufixo DOI. Cada "X" denota um dígito hexadecimal (AF), e "C" é um dígito de verificação ISO 7064 Mod 37,36 .

Também existe uma forma binária compacta de 96 bits que se destina a ser incorporada em pequenas cargas, como marcas d'água . Este formulário é gerado a partir do formato canônico da seguinte forma:

  • Subprefixo de 16 bits: gerado interpretando o subprefixo como um valor binário, por exemplo, B'0001010001111000 '
  • Sufixo de 80 bits: a parte sem checksum do sufixo, representada como 10 bytes

O formulário Uniform Resource Name para um ID EIDR é especificado no RFC   7302 .

Para uso na web, um ID de conteúdo EIDR pode ser representado como um URI em um destes formatos:

  • https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C : este é um ID EIDR representado como uma referência de proxy DOI (será redirecionado do DOI para o registro EIDR)
  • info: doi: 10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C [obsoleto] : este é um ID EIDR representado como um URI "info" compatível com RFC 4452 (lembrando que todos os IDs EIDR também são IDs DOI, mas não o conversar).

Tipos de registro

Existem quatro tipos de registros de conteúdo, cada um associado a um prefixo reservado:

  • Content ID (10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C): está associado a um ativo de entretenimento, como um filme ou série de TV. Os registros de conteúdo são hierárquicos, permitindo que os relacionamentos sejam expressos como uma série, cujos filhos seriam temporadas, cujos filhos, por sua vez, seriam episódios individuais. Muitos outros relacionamentos são suportados, conforme descrito abaixo. Os registros de conteúdo constituem a maior parte dos dados no registro EIDR.
  • ID da parte (10.5237 / XXXX-XXXX): identifica entidades como registrantes, produtores de conteúdo e distribuidores.
  • ID de serviço de vídeo (10.5239 / XXXX-XXXX): identifica um serviço de vídeo, coloquialmente conhecido como "canal" ou "rede": uma sequência linear (geralmente) de conteúdo programado para ser transmitido em horários específicos (por exemplo, o ID de serviço para o Cartoon Network é 10.5239 / 8BE5-E3F6). Os serviços de vídeo são hierárquicos: por exemplo, um pai pode ter vários filhos para contabilizar variações regionais ou de idioma).
  • ID do usuário (10.5238 / [0-9a-zA-Z _. # ()] {2-32}): Identifica um usuário usando uma sequência de 2 a 32 caracteres alfanuméricos e especiais selecionados (ilustrados aqui com a sintaxe Perl ). Um usuário é basicamente um conceito administrativo subordinado às partes (das quais herdam direitos de acesso). Ao contrário de outros EIDR DOIs, a ID do usuário só pode ser usada dentro de EIDR (por exemplo, APIs de programação).

Os subprefixos 5237, 5238, 5239 e 5240 são todos atribuídos à Associação EIDR.

Registros de conteúdo

Os registros de conteúdo são objetos categorizados por seus tipos e relacionamentos. Cada um tem três tipos diferentes (ortogonais) de tipo:

  • Tipo de objeto : há um total de 10 deles. O primeiro é o Tipo básico, que possui os campos mínimos necessários para descrever um registro de conteúdo. Os outros 9 são derivados do tipo básico e contêm campos extras para descrever objetos mais complexos.
  • Tipo estrutural : estes distinguem representações de uma obra e são listados em ordem crescente de especificidade:
    • Abstração : Usada para objetos sem realidade, como um contêiner de série ou o conceito mais básico da obra original. Corresponde ao International Standard Musical Work Code (ISWC) para obras musicais, ao International Standard Text Code (ISTC) para obras textuais ou ao International Standard Audiovisual Number (ISAN) para obras audiovisuais.
    • Performance : usado para itens que são versões específicas de uma obra, como o lançamento original no cinema ou a versão do diretor de um filme ou uma versão censurada localmente de um programa de TV. Isso corresponde aproximadamente ao Código Internacional de Gravação Padrão (ISRC) para obras musicais e a alguns usos da Versão ISAN (V-ISAN) para obras audiovisuais.
    • Digital : uma representação digital específica de uma obra, como a codificação MPEG-2 de um filme. Isso corresponde a alguns usos do V-ISAN.
  • Tipo de referência : o tipo do ativo de conteúdo, independente de uma manifestação específica (por exemplo, um filme exibido na TV ainda é um filme):
    • Série : Uma abstração que contém itens individuais ordenados ou não ordenados.
    • Temporada : um segundo nível de agrupamento abaixo de uma Série, geralmente cobrindo um intervalo de tempo
    • TV : conteúdo que apareceu pela primeira vez via transmissão.
    • Filme : conteúdo longo que apareceu pela primeira vez em um cinema ou teatro.
    • Curto : vagamente definido para cobrir um trabalho de 40 minutos ou menos, como videoclipes , noticiários de cinema ou curtas de desenho animado de DTV ou teatrais.
    • Web : conteúdo que apareceu pela primeira vez na web. Isso é diferente do conteúdo de outro lugar que foi disponibilizado na web.
    • Material interativo : conteúdo que não é estritamente audiovisual. Abrange menus de DVD, sobreposições de TV interativa, reprodutores personalizados, etc.
    • Compilação : conteúdo composto por vários outros ativos que não podem ser descritos com mais precisão, como um box set de uma franquia de filme.
    • Suplementar : este tipo é para conteúdo secundário cujo objetivo principal é oferecer suporte, aumentar ou promover outro conteúdo. Os exemplos incluem trailers, outtakes e documentários de promoção ("making of" de peças).

Metadados básicos

Os seguintes campos (retirados de um conjunto maior) compreendem os dados do objeto de base de um registro de conteúdo:

  • Tipo Estrutural : por exemplo, Abstração
  • Modo : por exemplo, AudioVisual (para um filme ou programa de TV); "Áudio" para um programa de rádio; "Visual" para um trabalho silencioso.
  • Tipo de referência : por exemplo, filme
  • Título : o título principal. Títulos e títulos alternativos são ainda diferenciados por:
    • Lang : a língua do título expresso como 639-1 ISO código
    • Classe : lançamento ou regional
  • Título alternativo 1..N : um ou mais títulos alternativos (geralmente variantes regionais ou de idioma)
  • Idioma original : o idioma da versão original expresso como código ISO 639-1
  • Org associada 1..N : IDs da parte do produtor, estúdio, etc.
  • Data de lançamento : data em que o título foi originalmente lançado
  • País de origem : código ISO 3166-1 alfa 2 , com extensões para países extintos
  • Comprimento aproximado : expresso como esquema XML xs: tipo de dados de duração
  • ID alternativa 1..N : uma ou mais IDs equivalentes expressas em um sistema de ID de ativo diferente (consulte a discussão abaixo).
  • Créditos : são fornecidos apenas créditos esqueléticos, geralmente restritos ao diretor e a até quatro dos atores principais. Conforme observado, não é objetivo do EIDR competir com sistemas proprietários com metadados ricos (por exemplo, resumos de trama). O objetivo principal é ajudar a eliminar a ambiguidade do título e ajudar nos esforços de validação e eliminação de duplicação.
  • Responsável pelo registro : a parte que criou este registro de conteúdo (por exemplo, "10.5237 / superparty")
  • Data de criação : data em que este registro de conteúdo foi criado
  • Status : normalmente "válido" (há casos especiais para registros excluídos)
  • Data da última modificação : última vez que este registro de conteúdo foi alterado

Registros de conteúdo excluídos

Um ID EIDR deve ser sempre resolvível, portanto, em circunstâncias normais, o Registro de conteúdo correspondente será permanente. Existem dois mecanismos disponíveis para lidar com erros ou outras circunstâncias incomuns. O preferido é o aliasing, em que um ID EIDR é redirecionado de forma transparente para outro registro de conteúdo. O aliasing é comumente empregado para lidar com um ativo sendo registrado duas vezes.

O outro mecanismo é o uso de registros de marca para exclusão. Isso é empregado quando o Registro de Conteúdo está corrompido ou um ativo inválido foi registrado acidentalmente. Nesse caso, o ID terá um alias para um registro especial de marca para exclusão. A marca para exclusão pode ser reconhecida por aplicativos porque seu campo de ID de EIDR será definido com o valor distinto " 10.5240 / 0000-0000-0000-0000-0000-X ". Observe que "X" significa a 24ª letra do alfabeto latino ( ASCII 0x58 ou Unicode U + 0058).

ID alternativa

Ter um rico conjunto de IDs alternativos para conteúdo é um dos principais objetivos do EIDR. Isso permite que os IDs de EIDR sejam usados ​​em todos os fluxos de trabalho de conteúdo; se um ID alternativo for necessário, ele pode ser encontrado nos metadados para o ID EIDR. EIDR suporta a inclusão de referências de ID proprietárias e de outros padrões (por exemplo, ISAN). IDs alternativos adicionais podem ser adicionados quando necessário (por exemplo, por partes que desejam oferecer suporte a novos fluxos de trabalho). Abaixo está um exemplo de IDs alternativos para o recurso EIDR 10.5240 / EA73-79D7-1B2B-B378-3A73-M (o filme Blade Runner ). Se um ID alternativo puder ser resolvido por meio de algoritmos, por exemplo, colocando-o apropriadamente em um URL de modelo, o EIDR disponibiliza esse link.

IDs alternativos para 10.5240 / EA73-79D7-1B2B-B378-3A73-M
ID alternativa 0000-0000-14A9-0000-K-0000-0000-E
Tipo: ISAN
ID alternativa # 2 89
Tipo: IVA
ID alternativa # 3 B000SW4DLM
Tipo: Domínio proprietário : amazon.com
ID alternativa # 4 12886
Tipo: Domínio proprietário : flixster.com
ID alternativa # 5 15042
Tipo: Domínio proprietário : thecinemasource.com
ID alternativa # 6 tt0083658
Tipo: IMDB Relação: IsSameAs
ID alternativa # 7 E0087486000
Tipo: Domínio proprietário : spe.sony.com/MPM
ID alternativa # 8 3929
Tipo: Domínio proprietário : spe.sony.com/ProductID
ID alternativa # 9 2002029
Tipo: Domínio Proprietário : warnerbros.com/MPM
ID alternativa # 10 389785
Tipo: domínio proprietário veronicamagazine.nl
ID alternativa # 11 B001EC2J1G
Tipo: Domínio proprietário : amazon.com
ID alternativa # 12 150002645
Tipo: Domínio proprietário : bfi.org.uk

IDs alternativos são divididos em não proprietários e proprietários. Os primeiros possuem tipos distintos e predefinidos (por exemplo, aqueles emitidos pelo ISAN, IMDb e IVA), enquanto os IDs proprietários são todos do tipo "Proprietário" e são posteriormente distinguidos por um domínio DNS associado. Em julho de 2017, havia mais de 2 milhões de IDs alternativos disponíveis diretamente por meio do EIDR.

Relações entre objetos

Os objetos de conteúdo podem estar relacionados entre si de acordo com a tabela a seguir. Essas relações são expressas como campos adicionais no registro de conteúdo e, portanto, são relativas a esse objeto. Observe que o objeto sujeito é o filho e o alvo é o pai (por exemplo, o assunto é <relation-type> Do pai). Restrições adicionais são indicadas na tabela.

Relacionamentos de herança : o objeto no qual existe o relacionamento pode herdar campos de metadados básicos do objeto ao qual o relacionamento se refere. Apenas um relacionamento de herança pode existir em um objeto. Esses relacionamentos produzem uma estrutura de árvore enraizada no ID EIDR de uma abstração.
isSeasonOf Um grupo de episódios da série lançados ao longo de um período contíguo de tempo (por exemplo, ano de transmissão), por exemplo, 10.5240 / AB95-8734-5D98-A282-2DF0-C ("Temporada 9") é uma temporada de 10.5240 / C272-DA64-E2B5-0A78 -2AC3-Z ("Os Arquivos X")
isEpisodeOf por exemplo, 10.5240 / E008-224D-0397-0560-6300-8 ("Sunshine Days") é um episódio de 10.5240 / AB95-8734-5D98-A282-2DF0-C ("Temporada 9").
isEditOf Uma instância de um título com características únicas que o diferenciam de qualquer outra versão. Por exemplo, 10.5240 / 7290-C8AD-12BA-4F93-3B07-7 ("Blade Runner: The Director's Cut") é uma edição de 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isManifestationOf Uma manifestação é uma instância mais específica de uma obra que pode ser vendida, transmitida, transferida ou reproduzida. O pai de uma manifestação deve ser uma edição. Por exemplo, 10.5240 / 9CE1-DE39-5F3E-073D-4307-7 é o CFF padrão ultravioleta (definição padrão, áudio e legendas em inglês) para "Blade Runner: The Director's Cut". É uma manifestação do trabalho abstrato 10.5240 / EA73-79D7-1B2B-B378-3A73-M .
isClipOf Um (e apenas um) fragmento contíguo de um ativo.
Relacionamentos de dependência : os objetos aos quais o relacionamento se refere têm uma forte relação com a natureza básica do objeto no qual o relacionamento existe. Isso significa que os objetos referidos na relação devem ser levados em consideração na verificação de duplicatas quando um objeto é criado ou modificado. Esses relacionamentos produzem gráficos direcionados dentro e entre as árvores.
isCompositeOf Uma única obra composta por partes de vários outros registros.
isCompilationOf Uma coleção de várias obras inteiras que não podem ser descritas com mais precisão.
Relacionamentos leves : não há herança; os objetos aos quais se referem não influenciam a natureza subjacente do objeto sobre o qual existe o relacionamento. Esses relacionamentos são usados ​​principalmente ao se mover dentro da árvore de objetos e conectar árvores de objetos entre si, produzindo um gráfico direcionado através dos elementos dessas árvores.
isPackagingOf Para criar uma coleção de ativos que são lançados juntos, por exemplo, 10.5240 / F219-975E-5990-4570-BA75-2 ("Hannah Montana e Miley ...") é uma embalagem de 10.5240 / 9ABE-2BF1-ACE7-EBA2-8E57 -N .
isPromotionOf Objetos promocionais, como um trailer.
isSupplementTo Material auxiliar que pode ser encontrado em um DVD, como um outtake ou recurso de bastidores.
isAlternateContentFor Conteúdo que está sincronizado com o ativo principal, como áudio ou um ângulo de câmera alternativo.

Uso em padrões e aplicações

EIDR foi incorporado em muitos padrões. Alguns dos mais significativos estão listados aqui:

  • SMPTE / AMWA : A prática recomendada de SMPTE RP 2079 padroniza o uso de EIDR em contêineres de mídia MXF , no centro de fluxos de trabalho de conteúdo profissional, incluindo especificações AMWA AS-03 e AS-11. A prática recomendada de SMTPE 2021-5 permite que um identificador EIDR seja transportado onde quer que o BXF seja usado para troca de dados entre sistemas de transmissão.
  • European Broadcasting Union (EBU) : EBUCore é um conjunto básico comum de metadados descritivos e técnicos que descrevem recursos de mídia (áudio, vídeo, imagens estáticas, legendagem, etc.). Os funcionários da EBU e EIDR produziram um mapeamento de EBUCore para registros de base para objetos raiz de EIDR: .. EIDR e EBU estão trabalhando juntos no grupo de trabalho SMPTE Core para definir metadados descritivos para especificações e fluxos de trabalho baseados em SMPTE. EIDR é um dos padrões suportados pelo EBU Core.
  • DVB : EIDR é referenciado no rascunho das especificações de DVB para telas complementares (tm-sm-css-0017r14).
  • MPEG : EIDR foi proposto como um identificador de conteúdo no formato de aplicativo de preservação de multimídia que está sendo definido para uso de arquivamento.
  • CableLabs (EUA) : EIDR faz parte do padrão CableLabs Metadata para a distribuição de ativos de vídeo sob demanda. EIDR é um identificador de programa que pode estar presente em um descritor de segmentação SCTE-35 2013, um padrão usado na distribuição de IP por cabo. EIDR também é usado em produtos de inserção de anúncios dinâmicos (DAI) usando a arquitetura padrão SCTE 130.
  • EIDR e IDs alternativos : a fim de promover a interoperabilidade do EIDR com uma ampla variedade de sistemas, o EIDR inclui um campo "AlternateID" para fazer referência cruzada aos sistemas de IDs existentes. IDs alternativos podem incluir, por exemplo, CRID ( RFC 4078 ), ISAN, ISRC, UPC ou URI , bem como sistemas de ID comerciais, como Ad-ID , Baseline, IMDb, etc. Atualmente cerca de metade dos registros EIDR carregam um ID de pelo menos um outro sistema.
  • Mapeamento de outros metadados e identificadores padrão para EIDR : outros metadados e sistemas de identificadores podem ser mapeados diretamente em EIDR:
    • EN 15907 e EN 15744 : Estas normas estão sob os auspícios do Comitê Europeu de Normalização CEN / TC 372 e filmstandards.org. Melhores práticas e mapeamentos estão disponíveis para os objetos raiz EN 15907 e EN 15744. EIDR também está trabalhando com arquivos de filmes para estender a interoperabilidade com esses padrões a um nível mais granular de detalhes, incluindo um projeto com o British Film Institute (BFI) para registrar seus registros baseados em EN 15907 com EIDR.
    • Número Audiovisual Internacional Padrão (ISAN) : o ISAN é amplamente utilizado em sistemas de gerenciamento e cobrança de direitos. Um mapeamento completo de um registro ISAN para um registro EIDR está disponível. A UK Audio-Visual Registration Agency, uma joint venture entre o EIDR e a ISAN-UK, fornece serviços de registro conjunto para ambos os identificadores. Os precursores deste serviço foram usados ​​para obter IDs EIDR e ISANs para conteúdo de transmissão da ITV (uma rede de TV comercial no Reino Unido).

Os identificadores EIDR encontraram seu caminho em um número crescente de aplicativos comerciais. Os itens a seguir são ilustrativos de algumas das vantagens de usar EIDR:

  • Integração Warner Brothers-Xbox : EIDR foi usado para melhorar a implementação de um sistema Electronic Sell Through (EST) para a entrega de títulos Warner Theatrical para clientes do Microsoft Xbox Live . A operação de uma vitrine eletrônica exige que vários grupos da Warner Brothers coordenem suas atividades com a equipe do Xbox. O lado externo da cadeia de distribuição incluiu a publicação de "Avails" (títulos disponíveis para venda) e o rastreamento do atendimento de pedidos; o lado de entrada incluía fazer pedidos. Outras funções, como relatórios, abrangeram ambos os lados da cadeia de distribuição. O sistema original exigia intervenção manual e supervisão, especialmente nas fronteiras entre as organizações. Um exemplo da necessidade de processamento manual seria verificar se a versão correta de um ativo (que pode variar dependendo das legendas ou conteúdo) foi entregue. No novo sistema, a Warner Brothers criou um novo ID EIDR para cada variante de conteúdo, e estes foram usados ​​em todos os estágios de processamento subsequentes. Isso eliminou a ambigüidade e facilitou a automação dos estágios de entrada e saída. Outra vantagem era a capacidade de criar relatórios dinâmicos.
  • Integração Swisscom EPG : Swisscom opera um serviço de TV paga na Suíça. Em 2014, concluiu o lançamento de um Guia de Programação Eletrônica (EPG) para seus clientes com base no EIDR. Este é um sistema de ponta a ponta em que os IDs de EIDR são usados ​​para representar os ativos exibidos no EPG. Um elemento chave do sistema era que os IDs de EIDR também eram usados ​​nos metadados do guia fornecidos à Swisscom por media-press.tv. Isso incluiu a configuração de um sistema para atribuir IDs de EIDR a recursos que ainda não estavam no registro. Uma vantagem principal de usar EIDR é não ter que traduzir entre sistemas de identificadores diferentes.

Operações e Administrativas

O EIDR é administrado pela Associação EIDR, sem fins lucrativos, fundada em outubro de 2010 pela MovieLabs , CableLabs , Comcast e Rovi . A adesão tem crescido constantemente desde então: no final de 2014, tinha 79 membros divididos entre os níveis de Promotores da Indústria e Colaboradores da Indústria. A categoria de crescimento mais rápido são as empresas não americanas, que agora respondem por cerca de 20% dos membros. A Associação EIDR opera dois registros EIDR: Produção e Sandbox. O primeiro é o site oficial e o último é reservado para teste e desenvolvimento. Ambos os sistemas estão disponíveis publicamente online, mas o conteúdo da sandbox não é garantido como correto, completo ou mesmo que se refira a ativos existentes. Apenas membros da associação EIDR podem modificar o registro.

Cadastro

O registro de novos ativos pode ser feito individualmente ou em massa (até 100.000 ativos por vez). Em ambos os casos, o fluxo de trabalho compreende uma combinação de processos automatizados (para executar tarefas bem definidas, mas tediosas) e manuais (onde o julgamento humano é necessário). Também é iterativo, pois o processo inicial de correspondência pode identificar uma variedade de lacunas e erros que precisam ser resolvidos.

O registro de novos ativos é um processo complexo que requer alguma preparação, especialmente no caso de envio em massa. Os processos automatizados verificarão a sintaxe, garantirão que os metadados básicos sejam fornecidos e que quaisquer dependências (por exemplo, registros de série criados antes dos episódios constituintes) sejam respeitadas. As etapas manuais incluem certificar-se de que as partes corretas estão associadas ao ativo. Uma das etapas mais importantes é garantir que um novo ativo ainda não exista no registro: isso é abordado na próxima seção.

Para registrar um novo ativo, um usuário deve estar associado a uma parte que tenha recebido a função "Registrante" do operador EIDR. Um registrante pode ser um agente principal, como um estúdio ou uma casa de codificação, mas também pode ser uma Parte fazendo o registro em massa de itens do catálogo anterior ou uma Parte agindo em nome de outra pessoa. Também é necessário que o registrante seja um membro do EIDR. Em geral, propriedade de conteúdo, autoridade de metadados e capacidade de registro são conceitos separados e não relacionados.

Deduplicação

Isso se refere à sinalização de ativos que estão sendo enviados ao registro como se enquadrando em uma das três categorias a seguir:

  • O ativo candidato é único (em relação aos ativos de registro existentes).
  • O recurso candidato é uma duplicata de um registro existente.
  • O recurso candidato tem alta probabilidade de ser uma duplicata.

Essa avaliação é baseada na aplicação de um (grande) conjunto de regras ao ativo candidato, o que resulta em uma pontuação numérica. O agrupamento ocorre como resultado da comparação da pontuação com dois limites:

  • Limite baixo : qualquer ativo com uma pontuação abaixo deste valor não é considerado uma duplicata. Este é o único caso em que uma adição ou modificação de registro proposta terá êxito.
  • Limite alto : qualquer ativo com uma pontuação acima desse valor é considerado (quase certamente) uma duplicata. A adição / modificação de registro proposta não prosseguirá e um status de erro será retornado. Os registrantes geralmente usam o ID pré-existente para o item que tentaram registrar e podem adicionar informações ausentes e IDs alternativos ao registro existente.

Os ativos situados entre o limite baixo e alto são considerados como tendo uma alta possibilidade de serem duplicados: a adição / modificação de registro proposta não ocorrerá até que seja revisada manualmente pela equipe de operações de EIDR.

Arquitetura

Os componentes do sistema EIDR são mostrados abaixo.

Arquitetura de registro EIDR

Os principais blocos funcionais são os seguintes:

  • Core Registry : Este módulo é uma customização e configuração do CNRI Digital Object Repository. Ele executa várias funções, incluindo registro, geração de identificadores exclusivos, indexação, gerenciamento de armazenamento de objeto e controle de acesso.
  • Repositório : armazena e fornece acesso aos objetos registrados; para EIDR, esses objetos são coleções de metadados, não os próprios recursos de mídia. Os metadados incluem informações de objeto padrão, relacionamentos e configurações de controle de acesso.
  • REST AP I: Uma interface REST que fornece acesso ao conjunto completo de recursos de registro não administrativos. Os serviços podem fazer chamadas individuais ou em lote, que podem ser despachadas de forma síncrona ou assíncrona. Uma sintaxe de consulta geral permite a recuperação (e, em alguns casos, a modificação) de registros de registro que atendem a um conjunto de critérios especificados pelo chamador.
    • EIDR SDK : fornecido aos desenvolvedores para facilitar a criação de aplicativos de terceiros (geralmente em suporte a um fluxo de trabalho B2B ou intramural). Ele compreende um Java SDK, um .NET SDK e programas de amostra construídos sobre os dois SDKs. O uso do SDK é recomendado em vez de chamadas diretas para a API REST.
    • Ferramentas de linha de comando : são aplicativos Java e .NET simples, construídos no SDK, cada um dos quais fornece uma única função, como resolver, consultar, corresponder e registrar.
    • IU da Web : uma interface de usuário baseada na Web principalmente para pesquisa, pesquisa e navegação na hierarquia de objetos. Ele também suporta registros simples.
  • Proxy DOI : usando o prefixo do identificador, isso encaminha as solicitações de resolução EIDR DOI para o registro EIDR.
  • Sistema de manipulação : fornece serviços de pesquisa e resolução distribuídos

Relação com DOI e sistema de manuseio

Um EIDR ID é um exemplo especializado de um Digital Object Identifier (DOI), que por sua vez é construído em cima do Handle System desenvolvido pela Corporation for National Research Initiatives (CNRI). Os aspectos específicos de EIDR das camadas inferiores são descritos em mais detalhes abaixo.

Identificador de objeto digital (aspectos EIDR)

Um Digital Object Identifier, padronizado como ISO 26324, busca identificar de forma única uma ampla gama de artefatos digitais, incluindo livros, gravações, dados de pesquisa e outros conteúdos digitais. O objetivo não é apenas que os IDs sejam únicos, mas persistentes e imutáveis. Ao contrário dos URLs, os identificadores DOI permanecem os mesmos, mesmo se os objetos forem movidos para outro local ou se tornarem propriedade de outra organização. Aqui estão algumas das características do DOI:

  • A International DOI Foundation (IDF) aplica as regras previamente acordadas nas Agências de Registro constituintes (por exemplo, EIDR) para garantir a continuidade. Em particular, se um RA cessar a operação, os nomes que ele hospeda serão assumidos por outro RA.
  • O IDF define regras às quais todos os nomes DOI devem aderir (quais tipos de objeto podem ser nomeados por um RA específico)
  • O sistema DOI fornece um modelo de dados, baseado em um dicionário de dados, para permitir um meio estruturado de expressar metadados (e relacionamentos entre objetos).
  • O sistema DOI tem seu próprio conjunto altamente redundante e distribuído de servidores proxy e de identificador.
  • Todos os prefixos DOI têm o formato "10.NNNN", em que 10 é um indicador de diretório e "NNNN" é um código de registrante no intervalo 1-65535 (por exemplo, o uso de registros de conteúdo EIDR é 10,5240)

O modelo de dados DOI fornece meios para associar metadados a cada objeto, bem como políticas que regem seu uso. Nas palavras do Manual DOI, os metadados podem incluir "nomes, identificadores, descrições, tipos, classificações, locais, horários, medições, relacionamentos e qualquer outro tipo de informação relacionada a [um objeto]." Os metadados fluem entre as seguintes entidades:

  • Provedor de recursos : geralmente o proprietário do ativo de mídia, que é responsável por inserir metadados no sistema.
  • Agência de Registro : as entidades que servem como repositório dos ativos (e metadados associados). Conforme observado, o DOI apóia uma federação de ARs independentes, cada um responsável por um conjunto de ativos. EIDR é um desses RA. Outros incluem CrossRef para artigos acadêmicos, DataCite para dados de pesquisa e OPOCE para publicações oficiais da União Europeia.
  • Usuário de serviço : as entidades que fazem consultas para recuperar metadados de RA associados a ativos. A estrutura de resolução DOI é responsável por enviar uma consulta ao RA apropriado (o Usuário do Serviço não precisa saber disso).

Para promover a interoperabilidade entre RAs, o DOI tem o conceito de Kernel de metadados. Este é um conjunto básico de metadados que todos os objetos armazenados na estrutura DOI devem ter. O conjunto completo pode ser encontrado no manual do DOI. A interoperabilidade é um grande tópico que vai além do escopo do EIDR, mas o subconjunto a seguir é particularmente relevante para recursos EIDR:

  • referente : um objeto mantido no sistema DOI.
  • referentName : o nome do referente (por exemplo, o título de um filme)
  • primaryReferentType : Para EIDR, isso inclui a criação (por exemplo, ativos de entretenimento) e festa (por exemplo, o criador dos mesmos).
  • estruturalType : são categorias mutuamente exclusivas que identificam a forma de um ativo. Dois itens particularmente relevantes para os ativos EIDR são uma abstração (um objeto como um filme que pode existir em várias formas) e uma performance (uma instância específica de um objeto como a versão do diretor).
  • Agente principal : para as criações, a entidade principal responsável por sua existência.
  • registrationAuthorityCode : denota a agência que emitiu o DOI. Este seria o EIDR RA para ativos EIDR.

Os metadados EIDR estão disponíveis no formato de metadados do kernel DOI padrão, bem como em formatos específicos de EIDR. O DOI para o esquema de metadados DOI é doi: 10.1000 / 276 .

Sistema de manuseio (aspectos EIDR)

O DOI, por sua vez, é implementado no topo do Handle System, um serviço de resolução de nomes distribuído e altamente escalonável. Um identificador é definido como:

<Handle> :: = <Handle Naming Authority> "/" <Handle Local Name>

A Autoridade de Nomenclatura é globalmente exclusiva e define um espaço administrativo e a sintaxe do Nome Local do Identificador. Para EIDR na definição acima, o "10.5240" é a Autoridade de Nomenclatura EIDR e é responsável por resolver o sufixo (incluindo que ele está em conformidade com a sintaxe esperada para um ativo EIDR). A gama de Autoridades de Nomenclatura permitidas é mais geral do que a empregada pelo DOI (ou EIDR).

A natureza distribuída do Handle System permite que cada namespace local seja hospedado em vários sites de serviço distribuídos geograficamente. Este é um modelo federado em que cada espaço de nomes local tem controle completo sobre o posicionamento e operação de seus sites de serviço. Além disso, cada site de serviço pode conter vários servidores de resolução: as solicitações direcionadas a um site de serviço específico serão despachadas igualmente entre seus servidores constituintes.

O modelo de dados do Handle System é simples, mas flexível. Um número arbitrário de valores pode ser associado a cada identificador. Com o tempo, esses valores podem ser criados, modificados e destruídos. Cada um desses dados tem os seguintes atributos:

  • índice : um inteiro sem sinal que identifica um valor de dados dos outros que podem existir para este identificador.
  • tipo : uma string UTF-8 que identifica o tipo. O sistema de tipos é extensível e os tipos comuns são mantidos como identificadores na autoridade de nomenclatura "0.TYPE". Não há restrições para a criação de novos tipos, embora o uso de identificadores resolvíveis como nomes de tipo seja a prática recomendada. Os tipos comuns incluem URL para um único de indireção, "10320 / loc" para um conjunto de alternativas de resolução baseadas em contexto e vários tipos administrativos para gerenciamento do Handle System, todos baseados na resolução do identificador.
  • dados : o próprio valor, representado como uma sequência de octetos que são interpretados no contexto do tipo associado
  • permissão : direitos de acesso a este valor específico. Observe que diferentes valores de dados de um identificador podem ter diferentes permissões
  • TTL : um inteiro que especifica por quanto tempo um valor pode ser armazenado em cache
  • timestamp : um número inteiro (expresso como milissegundos da época Unix) que registra a última vez que o valor foi atualizado
  • referência : uma lista de referências a outros valores de manipulação. Geralmente são usados ​​para adicionar credenciais (por exemplo, uma assinatura digital).

O acesso ao Handle System é feito por meio de um protocolo com fio definido na RFC 3652 ; Os aplicativos EIDR não precisam se preocupar com isso por causa das camadas de protocolos.

Veja também

Leitura adicional

  1. R. Kroon, R. Drewry, A. Leigh, S. McConnachie. "Identificação de conteúdo para arquivos audiovisuais". Revista da Associação Internacional de Arquivos Sonoros e Audiovisuais, verão de 2015 (nº 45).
  2. R. Kroon. "Trazendo Ordem para Identificadores Digitais". Media and Entertainment Journal Winter 2014-2015: 148-150.
  3. R. Drewry, D. Dulchinos. "Transformando o entretenimento por meio da tecnologia". Media and Entertainment Journal Winter 2013-2014: 81–88.
  4. D. Agranoff, W. Michel, T. Wakai. "Integração e gerenciamento simplificado de metadados de conteúdo usando Entertainment ID Registry (EIDR)". SCTE Cable-Tec Expo 2012.

links externos

Referências

  1. ^ ISO / IEC 7064: 2003 : Tecnologia da informação - Técnicas de segurança - Verificar sistemas de caracteres. 2002
  2. ^ Esquema W3C XML - Parte 2: Tipos de dados segunda edição
  3. ^ SMPTE RP 2079 . Nome DOI e representação do identificador EIDR.
  4. ^ Advanced Media Workflow Association AS-03 MXF Program Delivery Specification .
  5. ^ Advanced Media Workflow Association AS-11 MFX para especificação de contribuição .
  6. ^ SMPTE RP 2021-5: 2013 . Usando Ad-ID e EIDR como identificadores alternativos em SMPTE BXF e ATSC PMCP.
  7. ^ EBU TECH 3293 . EBU CORE METADATA SET Versão 1.5.
  8. ^ Documento DVB A167-2 . Transmissão de vídeo digital (DVB); Telas e fluxos complementares; Parte 2: Identificação de conteúdo e sincronização de mídia, julho de 2014. p. 52
  9. ^ ISO / IEC CD 23000-15 . Tecnologia da informação - Formato de aplicativo multimídia (MPEG-A) - Parte 15: Formato de aplicativo de preservação multimídia.
  10. ^ MD-SP-AMIv3.0-I02-121210 Arquivado 2015-04-02 na máquina Wayback . Especificação CableLabs Asset Management Interface 3.0.
  11. ^ ANSI / SCTE 35 2013 . Mensagem de sinalização de inserção de programa digital para cabo.
  12. ^ SCTE 130-10 2013 . Inserção de programa digital - interfaces de sistemas de publicidade, parte 10.
  13. ^ TC 372 Workshop Compendium . Como EN 15744 e EN 15907 surgiram.
  14. ^ Comunicado de imprensa . Swisscom conclui a primeira implantação europeia do Entertainment ID Registry com media-press.tv.
  15. ^ ISO 26324: 2012 : Informação e documentação - Sistema de identificador digital de objetos, 2012.