Análise de conteúdo - Content analysis

A análise de conteúdo é o estudo de documentos e artefatos de comunicação, que podem ser textos de vários formatos, imagens, áudio ou vídeo. Os cientistas sociais usam a análise de conteúdo para examinar os padrões de comunicação de uma maneira replicável e sistemática. Uma das principais vantagens de usar a análise de conteúdo para analisar fenômenos sociais é sua natureza não invasiva, em contraste com a simulação de experiências sociais ou a coleta de respostas de pesquisas.

As práticas e filosofias da análise de conteúdo variam entre as disciplinas acadêmicas. Todos eles envolvem a leitura ou observação sistemática de textos ou artefatos aos quais são atribuídos rótulos (às vezes chamados de códigos) para indicar a presença de partes de conteúdo interessantes e significativas . Ao rotular sistematicamente o conteúdo de um conjunto de textos , os pesquisadores podem analisar padrões de conteúdo quantitativamente usando métodos estatísticos ou usar métodos qualitativos para analisar os significados do conteúdo nos textos .

Os computadores são cada vez mais usados ​​na análise de conteúdo para automatizar a rotulagem (ou codificação) de documentos. Técnicas computacionais simples podem fornecer dados descritivos, como frequências de palavras e comprimentos de documentos. Classificadores de aprendizado de máquina podem aumentar muito o número de textos que podem ser rotulados, mas a utilidade científica de fazer isso é uma questão de debate. Além disso, vários programas de computador para análise de texto auxiliado por computador (CATA) estão disponíveis para analisar o texto quanto a características linguísticas, semânticas e psicológicas pré-determinadas.

Metas

A análise de conteúdo é melhor entendida como uma ampla família de técnicas. Pesquisadores eficazes escolhem as técnicas que melhor os ajudam a responder às suas questões substantivas. Dito isso, de acordo com Klaus Krippendorff , seis questões devem ser abordadas em toda análise de conteúdo:

  1. Quais dados são analisados?
  2. Como os dados são definidos?
  3. De qual população os dados são extraídos?
  4. Qual é o contexto relevante?
  5. Quais são os limites da análise?
  6. O que deve ser medido?

A forma mais simples e objetiva de análise de conteúdo considera características inequívocas do texto, como a frequência das palavras , a área da página ocupada por uma coluna de jornal ou a duração de um programa de rádio ou televisão . A análise de frequências de palavras simples é limitada porque o significado de uma palavra depende do texto circundante. As rotinas de palavras- chave no contexto (KWIC) tratam disso colocando as palavras em seu contexto textual. Isso ajuda a resolver ambigüidades, como aquelas introduzidas por sinônimos e homônimos .

Um outro passo na análise é a distinção entre abordagens baseadas em dicionário (quantitativas) e abordagens qualitativas. As abordagens baseadas em dicionário estabelecem uma lista de categorias derivada da lista de frequência de palavras e controlam a distribuição de palavras e suas respectivas categorias nos textos. Enquanto os métodos de análise quantitativa de conteúdo transformam as observações das categorias encontradas em dados estatísticos quantitativos, a análise qualitativa de conteúdo concentra-se mais na intencionalidade e em suas implicações. Existem fortes paralelos entre a análise de conteúdo qualitativa e a análise temática .

Análise de conteúdo qualitativa e quantitativa

A análise de conteúdo quantitativa destaca contagens de frequência e análise objetiva dessas frequências codificadas. Além disso, a análise de conteúdo quantitativa começa com uma hipótese estruturada com codificação decidida antes do início da análise. Essas categorias de codificação são estritamente relevantes para a hipótese do pesquisador. A análise quantitativa também tem uma abordagem dedutiva.

Siegfried Kracauer fornece uma crítica da análise quantitativa, afirmando que ela simplifica demais as comunicações complexas para ser mais confiável. Por outro lado, a análise qualitativa lida com os meandros das interpretações latentes, enquanto a quantitativa concentra-se nos significados manifestos. Ele também reconhece uma "sobreposição" da análise de conteúdo qualitativa e quantitativa. Os padrões são examinados mais de perto na análise qualitativa e, com base nos significados latentes que o pesquisador pode encontrar, o curso da pesquisa pode ser alterado. É indutivo e começa com questões de pesquisa abertas, em oposição a uma hipótese.

Ferramentas computacionais

Com o surgimento de instalações de computação comuns como PCs, os métodos de análise baseados em computador estão crescendo em popularidade. Respostas a perguntas abertas, artigos de jornal, manifestos de partidos políticos, registros médicos ou observações sistemáticas em experimentos podem estar sujeitos à análise sistemática de dados textuais.

Por ter conteúdos de comunicação disponíveis na forma de textos legíveis por máquina, a entrada é analisada quanto às frequências e codificada em categorias para a construção de inferências.

A análise assistida por computador pode ajudar com grandes conjuntos de dados eletrônicos, reduzindo o tempo e eliminando a necessidade de vários codificadores humanos para estabelecer a confiabilidade entre os codificadores. No entanto, os codificadores humanos ainda podem ser empregados para a análise de conteúdo, pois geralmente são mais capazes de identificar significados matizados e latentes no texto. Um estudo descobriu que os codificadores humanos eram capazes de avaliar uma gama mais ampla e fazer inferências com base em significados latentes.

Confiabilidade

Robert Weber observa: "Para fazer inferências válidas a partir do texto, é importante que o procedimento de classificação seja confiável no sentido de ser consistente: Pessoas diferentes devem codificar o mesmo texto da mesma maneira". A validade, confiabilidade inter-codificador e confiabilidade intra-codificador estão sujeitas a intensos esforços de pesquisa metodológica durante longos anos. Neuendorf sugere que, quando codificadores humanos são usados ​​na análise de conteúdo, pelo menos dois codificadores independentes devem ser usados. A confiabilidade da codificação humana é freqüentemente medida usando uma medida estatística de confiabilidade entre os codificadores ou "a quantidade de concordância ou correspondência entre dois ou mais codificadores". Lacy e Riffe identificam a medição da confiabilidade entre codificadores como uma força da análise de conteúdo quantitativa, argumentando que, se os analistas de conteúdo não medem a confiabilidade entre codificadores, seus dados não são mais confiáveis ​​do que as impressões subjetivas de um único leitor.

Tipos de texto

Existem cinco tipos de textos na análise de conteúdo:

  1. texto escrito , como livros e artigos
  2. texto oral, como discurso e performance teatral
  3. texto icônico , como desenhos, pinturas e ícones
  4. texto audiovisual, como programas de TV, filmes e vídeos
  5. hipertextos , que são textos encontrados na Internet

História

A análise de conteúdo é uma pesquisa que usa a categorização e classificação do discurso, texto escrito, entrevistas, imagens ou outras formas de comunicação. No início, com os primeiros jornais do final do século XIX, a análise era feita manualmente, medindo-se o número de colunas de um assunto. A abordagem também pode ser rastreada até um estudante universitário estudando os padrões da literatura de Shakespeare em 1893.

Ao longo dos anos, a análise de conteúdo foi aplicada a uma variedade de escopos. A hermenêutica e a filologia há muito usam a análise de conteúdo para interpretar textos sagrados e profanos e, em muitos casos, para atribuir autoria e autenticidade aos textos .

Nos últimos tempos, particularmente com o advento da comunicação de massa , a análise de conteúdo tem conhecido um uso crescente para analisar e compreender profundamente o conteúdo e a lógica da mídia . O cientista político Harold Lasswell formulou as questões centrais da análise de conteúdo em sua versão dominante do início do século 20: "Quem diz o quê, para quem, por que, em que medida e com que efeito?". A forte ênfase para uma abordagem quantitativa iniciada por Lasswell foi finalmente realizada por outro "pai" da análise de conteúdo, Bernard Berelson , que propôs uma definição de análise de conteúdo que, desse ponto de vista, é emblemática: "uma técnica de pesquisa para a descrição objetiva, sistemática e quantitativa do conteúdo manifesto da comunicação ”.

A análise quantitativa de conteúdo tem desfrutado de uma popularidade renovada nos últimos anos, graças aos avanços tecnológicos e à aplicação frutífera da comunicação de massa e da pesquisa de comunicação pessoal. A análise de conteúdo de big data textuais produzidos por novas mídias , especialmente mídias sociais e dispositivos móveis, tornou-se popular. Essas abordagens adotam uma visão simplificada da linguagem que ignora a complexidade da semiose, o processo pelo qual o significado é formado a partir da linguagem. Os analistas de conteúdo quantitativos têm sido criticados por limitar o escopo da análise de conteúdo à contagem simples e por aplicar as metodologias de medição das ciências naturais sem refletir criticamente sobre sua adequação às ciências sociais. Por outro lado, os analistas de conteúdo qualitativos foram criticados por serem insuficientemente sistemáticos e impressionistas demais. Krippendorff argumenta que as abordagens quantitativa e qualitativa da análise de conteúdo tendem a se sobrepor, e que não pode haver nenhuma conclusão generalizável sobre qual abordagem é superior.

A análise de conteúdo também pode ser descrita como rastros de estudo , que são documentos de tempos passados, e artefatos, que são documentos não linguísticos. Os textos são considerados produzidos por processos de comunicação no sentido amplo dessa frase - muitas vezes ganhando significado por meio de abdução .

Conteúdo latente e manifesto

O conteúdo do manifesto é facilmente compreensível em seu valor nominal. Seu significado é direto. O conteúdo latente não é tão aberto e requer interpretação para descobrir o significado ou implicação.

Usos

Holsti agrupa quinze usos da análise de conteúdo em três categorias básicas :

  • fazer inferências sobre os antecedentes de uma comunicação
  • descrever e fazer inferências sobre as características de uma comunicação
  • fazer inferências sobre os efeitos de uma comunicação.

Ele também coloca esses usos no contexto do paradigma de comunicação básico .

A tabela a seguir mostra quinze usos da análise de conteúdo em termos de seu propósito geral, elemento do paradigma de comunicação ao qual se aplica e a pergunta geral que pretende responder.

Usos da análise de conteúdo por objetivo, elemento de comunicação e pergunta
Propósito Elemento Pergunta Usar
Faça inferências sobre os antecedentes das comunicações Fonte Quem?
Processo de codificação Porque?
  • Segurança de inteligência política e militar
  • Analise características de indivíduos
  • Inferir aspectos culturais e mudanças
  • Fornecer evidências legais e avaliativas
Descreva e faça inferências sobre as características das comunicações Canal Como?
  • Analise técnicas de persuasão
  • Analisar estilo
Mensagem O que?
  • Descreva tendências no conteúdo de comunicação
  • Relacione as características conhecidas das fontes às mensagens que elas produzem
  • Compare o conteúdo de comunicação com os padrões
Destinatário A quem?
  • Relacione características conhecidas dos públicos às mensagens produzidas para eles
  • Descreva os padrões de comunicação
Faça inferências sobre as consequências das comunicações Processo de decodificação Com que efeito?
Observação. Objetivo, elemento de comunicação e pergunta de Holsti. Usa principalmente de Berelson adaptado por Holsti.

Em contraponto, há limites para o escopo de aplicação dos procedimentos que caracterizam a análise de conteúdo. Em particular, se o acesso ao objetivo da análise pode ser obtido por meios diretos sem interferência de material, então as técnicas de medição direta geram melhores dados. Assim, enquanto a análise de conteúdo tenta descrever de forma quantificável as comunicações cujas características são principalmente categóricas - geralmente limitadas a uma escala nominal ou ordinal - por meio de unidades conceituais selecionadas (a unitização ) que são atribuídos valores (a categorização ) para enumeração enquanto monitora a confiabilidade entre codificadores , se, em vez disso, a quantidade alvo manifestamente já é diretamente mensurável - tipicamente em uma escala de intervalo ou razão - especialmente uma quantidade física contínua, então tais alvos geralmente não são listados entre aqueles que precisam das seleções e formulações "subjetivas" da análise de conteúdo. Por exemplo (a partir de pesquisa mista e aplicação clínica), como imagens médicas comunicar recursos de diagnóstico para os médicos, neuroimagem 's AVC (infarto) escala volume de chamadas ASPECTOS é unitized como 10 regiões qualitativamente delineados (desigual) do cérebro na artéria cerebral média território, que que categoriza como sendo, pelo menos em parte, em relação não em todos infartados, a fim de enumerar o último, com séries publicadas, muitas vezes a avaliação entre observadores confiabilidade por kappa de Cohen . As operações precedentes em itálico impõem a forma não creditada de análise de conteúdo a uma estimativa da extensão do infarto, que em vez disso é facilmente medida e com mais precisão medida como um volume diretamente nas imagens. ("Precisão ... é a forma mais alta de confiabilidade.") A avaliação clínica concomitante, no entanto, pelo National Institutes of Health Stroke Scale (NIHSS) ou a escala Rankin modificada (mRS), retém a forma necessária de análise de conteúdo. Reconhecendo os limites potenciais da análise de conteúdo através do conteúdo da linguagem e das imagens, Klaus Krippendorff afirma que "a compreensão [...] pode ... não estar de acordo com o processo de classificação e / ou contagem pelo qual a maioria das análises de conteúdo prossegue , "sugerindo que a análise de conteúdo pode distorcer materialmente uma mensagem.

O desenvolvimento do esquema de codificação inicial

O processo do esquema de codificação inicial ou abordagem da codificação depende da abordagem de análise de conteúdo específica selecionada. Por meio de uma análise de conteúdo direcionada, os estudiosos elaboram um esquema de codificação preliminar a partir de teorias ou suposições pré-existentes. Enquanto com a abordagem convencional de análise de conteúdo, o esquema de codificação inicial se desenvolveu a partir dos dados.

O processo convencional de codificação

Com qualquer uma das abordagens acima, é recomendável que os pesquisadores realizem uma imersão nos dados para obter uma visão geral. Além disso, identificar uma unidade de codificação consistente e clara é vital, e as escolhas dos pesquisadores variam de uma única palavra a vários parágrafos, de textos a símbolos icônicos. Por último, construir as relações entre os códigos classificando-os em categorias ou temas específicos.

Veja também

Referências

Leitura adicional

  • Graneheim, Ulla Hällgren; Lundman, Berit (2004). “Análise qualitativa de conteúdo na pesquisa em enfermagem: conceitos, procedimentos e medidas para alcançar a confiabilidade”. Enfermeira Educação Hoje . 24 (2): 105-112. doi : 10.1016 / j.nedt.2003.10.001 . PMID  14769454 .
  • Budge, Ian (ed.) (2001). Preferências da política de mapeamento. Estimativas para partidos, eleitores e governos 1945-1998 . Oxford, Reino Unido: Oxford University Press. ISBN  978-0199244003 .
  • Krippendorff, Klaus e Bock, Mary Angela (orgs) (2008). O leitor de análise de conteúdo. Thousand Oaks, CA: Sage. ISBN  978-1412949668 .
  • Neuendorf, Kimberly A. (2017). O Guia de Análise de Conteúdo, 2ª ed. Thousand Oaks, CA: Sage. ISBN  978-1412979474 .
  • Roberts, Carl W. (ed.) (1997). Análise de texto para as ciências sociais: métodos para extrair inferências de textos e transcrições. Mahwah, NJ: Lawrence Erlbaum. ISBN  978-0805817348 .
  • Wimmer, Roger D. e Dominick, Joseph R. (2005). Mass Media Research: An Introduction, 8ª ed. Belmont, CA: Wadsworth. ISBN  978-0534647186 .