WebCite - WebCite

WebCite
WebCite.svg
Disponível em inglês
Proprietário Universidade de Toronto
Criado por Gunther Eysenbach
URL www .webcitation .org
Comercial Não
Lançado 1997 ; 24 anos atrás (1997)
Status atual Online, somente leitura

O WebCite é um site de arquivo sob demanda , projetado para preservar digitalmente material científico e educacionalmente importante na web, fazendo instantâneos dos conteúdos da Internet como eles existiam no momento em que um blogueiro ou um estudioso o citou ou citou. O serviço de preservação permite a verificação de reivindicações apoiadas pelas fontes citadas, mesmo quando as páginas da web originais estão sendo revisadas, removidas ou desaparecem por outros motivos, um efeito conhecido como podridão de link .

Em algum momento entre 9 e 17 de julho de 2019, o WebCite parou de aceitar novas solicitações de arquivamento. Desde fevereiro de 2021, ele não aceita novas solicitações de arquivamento, mas continua atendendo aos arquivos existentes. Em 19 de agosto de 2021, havia um anúncio de manutenção e nenhum conteúdo arquivado estava acessível; O WebCite voltou a ficar online entre então e 8 de outubro de 2021.

Características do serviço

Todos os tipos de conteúdo da web, incluindo páginas da web em HTML , arquivos PDF , folhas de estilo , JavaScript e imagens digitais podem ser preservados. Ele também arquiva metadados sobre os recursos coletados, como tempo de acesso, tipo MIME e comprimento do conteúdo.

WebCite é um consórcio sem fins lucrativos apoiado por editores e editores e pode ser usado por pessoas físicas gratuitamente. Foi um dos primeiros serviços a oferecer arquivamento sob demanda de páginas, um recurso posteriormente adotado por muitos outros serviços de arquivamento, como archive.today e Wayback Machine . Ele não rastreia páginas da web.

História

Idealizado em 1997 por Gunther Eysenbach , o WebCite foi descrito publicamente no ano seguinte, quando um artigo sobre controle de qualidade da Internet declarou que tal serviço também poderia medir o impacto de citação de páginas da web. No ano seguinte, foi instalado um serviço piloto no endereço webcite.net. Embora pareça que a necessidade de WebCite diminuiu quando o Google 's curto prazo cópias de páginas da web começou a ser oferecido pelo Google Cache eo Internet Archive expandiram seu rastreamento (que começou em 1996), WebCite era o único permitindo "on demand "arquivamento por usuários. O WebCite também ofereceu interfaces para periódicos acadêmicos e editores para automatizar o arquivamento dos links citados. Em 2008, mais de 200 periódicos começaram a usar rotineiramente o WebCite.

A WebCite costumava ser, mas não é mais, membro do International Internet Preservation Consortium . Em uma mensagem de 2012 no Twitter, Eysenbach comentou que "o WebCite não tem financiamento e o IIPC cobra € 4000 por ano em taxas anuais de adesão."

A WebCite "alimenta seu conteúdo" para outros projetos de preservação digital , incluindo o Internet Archive . Lawrence Lessig , um acadêmico americano que escreve extensivamente sobre direitos autorais e tecnologia, usou o WebCite em seu amicus brief no caso da Suprema Corte dos Estados Unidos da MGM Studios, Inc. v. Grokster, Ltd.

Angariação de fundos

A WebCite realizou uma campanha de arrecadação de fundos usando o FundRazr a partir de janeiro de 2013 com uma meta de US $ 22.500, uma quantia que seus operadores declararam ser necessária para manter e modernizar o serviço após o final de 2013. Isso inclui realocar o serviço para hospedagem em nuvem Amazon EC2 e legal Apoio, suporte. Em 2013, ainda não estava decidido se o WebCite continuaria sem fins lucrativos ou como uma entidade com fins lucrativos.

Uso

O WebCite permite arquivamento prospectivo sob demanda. Não é baseado em rastreador; as páginas só são arquivadas se o autor ou editor que cita o solicitar. Nenhuma cópia em cache aparecerá em uma pesquisa do WebCite, a menos que o autor ou outra pessoa tenha especificamente armazenado em cache de antemão.

Para iniciar o armazenamento em cache e o arquivamento de uma página, um autor pode usar a opção de menu "arquivar" do WebCite ou usar um bookmarklet do WebCite que permitirá que os internautas armazenem páginas em cache apenas clicando em um botão em sua pasta de favoritos.

Pode-se recuperar ou citar páginas arquivadas por meio de um formato transparente, como

http://webcitation.org/query?url=URL&date=DATE

onde URLé o URL que foi arquivado e DATEindica a data de armazenamento em cache. Por exemplo,

http://webcitation.org/query?url=http%3A%2F%2Fen.wikipedia.org%2Fwiki%2FMain_Page&date=2008-03-04

ou a forma abreviada alternativa http://webcitation.org/5W56XTY5h recupera uma cópia arquivada do URL http://en.wikipedia.org/wiki/Main_Pagemais próximo da data de 4 de março de 2008. A ID (5W56XTY5h) é o horário UNIX na base 62 .

O WebCite não funciona para páginas que contêm uma tag sem cache . A WebCite respeita a solicitação do autor de não ter sua página da web armazenada em cache.

Pode-se arquivar uma página simplesmente navegando em seu navegador até um link formatado como este:

http://webcitation.org/archive?url=urltoarchive&email=youremail

Comparado com a Wayback Machine

https://web.archive.org/urltoarchive

substituindo urltoarchivepelo URL completo da página a ser arquivada e youremailpelo seu endereço de e-mail. É assim que o bookmarklet WebCite funciona.

Uma vez arquivado no WebCite, os usuários podem tentar criar uma cópia de backup independente de segundo nível do URL inicial, salvando uma segunda vez o novo URL de domínio do WebCite em web.archive.org e em archive.is . Os usuários podem fazer isso de forma mais conveniente usando um complemento do navegador para arquivamento.

Modelo de negócios

O termo "WebCite" é uma marca registrada. O WebCite não cobra de usuários individuais, editores de periódicos e editores qualquer taxa para usar seus serviços. O WebCite obtém receita de editores que desejam "ter suas publicações analisadas e referenciadas da web arquivadas" e aceita doações. O apoio inicial veio da Universidade de Toronto .

Problemas de direitos autorais

A WebCite mantém a posição legal de que suas atividades de arquivamento são permitidas pelas doutrinas de direitos autorais de uso justo e licença implícita . Para apoiar o argumento do uso justo, o WebCite observa que suas cópias arquivadas são transformadoras , socialmente valiosas para a pesquisa acadêmica e não prejudiciais ao valor de mercado de qualquer trabalho protegido por direitos autorais. O WebCite argumenta que armazenar e arquivar páginas da web não é considerado uma violação de direitos autorais quando o arquivador oferece ao proprietário dos direitos autorais uma oportunidade de "cancelar" o sistema de arquivamento, criando assim uma licença implícita. Para esse fim, o WebCite não arquivará em violação aos metadados "do-not-cache" e "no-archive" do site , bem como aos padrões de exclusão de robôs , cuja ausência cria uma " licença implícita " para serviços de arquivamento da web para preservar o conteúdo.

Em um caso semelhante envolvendo as atividades de cache da web do Google , em 19 de janeiro de 2006, o Tribunal Distrital dos Estados Unidos do Distrito de Nevada concordou com esse argumento no caso Field v. Google (CV-S-04-0413-RCJ -LRL), mantendo esse uso justo e uma "licença implícita" significava que o cache de páginas da Web do Google não constituía violação de direitos autorais. A "licença implícita" referia-se aos padrões gerais da Internet.

Pedidos DMCA

De acordo com sua política, após receber solicitações de DMCA legítimas dos detentores dos direitos autorais, o WebCite remove as páginas salvas do acesso público, pois as páginas arquivadas ainda estão protegidas por serem citações. As páginas são removidas para um "arquivo escuro" e em casos de controvérsias legais ou solicitações de evidências há acesso pay-per-view de "$ 200 (até 5 instantâneos) mais US $ 100 para cada 10 instantâneos adicionais" para o conteúdo protegido por direitos autorais.

Veja também

Referências

links externos