Escala de Likert - Likert scale

Uma escala do tipo Likert ( / l ɪ k . Ər t / LIK -ərt ou / l . K ər t / LY -kərt ) é um psicométrica escala normalmente envolvido na pesquisa que emprega questionários . É a abordagem mais amplamente usada para dimensionar as respostas em pesquisas de opinião, de modo que o termo (ou mais completamente a escala do tipo Likert ) é freqüentemente usado de forma intercambiável com a escala de classificação , embora existam outros tipos de escalas de classificação.

A escala recebeu o nome de seu inventor, o psicólogo Rensis Likert . Likert distinguiu entre uma escala própria, que emerge de respostas coletivas a um conjunto de itens (geralmente oito ou mais), e o formato no qual as respostas são pontuadas ao longo de um intervalo. Tecnicamente falando, uma escala Likert se refere apenas ao primeiro. A diferença entre esses dois conceitos tem a ver com a distinção que Likert fez entre o fenômeno subjacente que está sendo investigado e os meios de captura da variação que aponta para o fenômeno subjacente.

Ao responder a um item do tipo Likert, os respondentes especificam seu nível de concordância ou discordância em uma escala simétrica de concordo-discordo para uma série de afirmações. Assim, o intervalo capta a intensidade de seus sentimentos por um determinado item. Como tal, as escalas Likert encontraram aplicação em psicologia e ciências sociais, estatísticas, negócios e marketing.

Uma escala pode ser criada como a soma simples ou média das respostas do questionário sobre o conjunto de itens individuais (perguntas). Ao fazer isso, a escala Likert assume que as distâncias entre cada escolha (opção de resposta) são iguais. Muitos pesquisadores empregam um conjunto de tais itens que são altamente correlacionados (que mostram alta consistência interna ), mas também que juntos irão capturar todo o domínio em estudo (que requer correlações menos que perfeitas). Outros seguem um padrão pelo qual "Todos os itens são considerados réplicas uns dos outros ou, em outras palavras, os itens são considerados instrumentos paralelos". Em contraste, a teoria moderna do teste trata a dificuldade de cada item (os ICCs ) como informações a serem incorporadas aos itens de escala.

Composição

Um exemplo de questionário sobre o design de um site, com respostas em escala Likert

Uma escala Likert é a soma das respostas em vários itens Likert . Como muitas escalas Likert emparelham cada item Likert constituinte com sua própria instância de uma escala visual analógica (por exemplo, uma linha horizontal, na qual o sujeito indica uma resposta circulando ou marcando marcas), um item individual é às vezes erroneamente referido como sendo ou tendo uma escala, com esse erro criando uma confusão generalizada na literatura e na linguagem da área.

Um item Likert é simplesmente uma afirmação que o respondente deve avaliar, atribuindo-lhe um valor quantitativo em qualquer tipo de dimensão subjetiva ou objetiva, sendo o nível de concordância / discordância a dimensão mais comumente usada. Itens Likert bem projetados exibem "simetria" e "equilíbrio". Simetria significa que eles contêm números iguais de posições positivas e negativas cujas respectivas distâncias são bilateralmente simétricas em relação ao valor "neutro" / zero (seja esse valor apresentado como candidato ou não). Equilíbrio significa que a distância entre cada valor candidato é a mesma, permitindo que comparações quantitativas, como a média, sejam válidas em itens contendo mais de dois valores candidatos.

O formato de um item Likert de cinco níveis típico, por exemplo, poderia ser:

  1. Discordo fortemente
  2. Discordo
  3. Não concordo nem discordo
  4. Aceita
  5. Concordo plenamente

A escala Likert é um método de escala bipolar , medindo a resposta positiva ou negativa a uma declaração. Às vezes, uma escala de pontos pares é usada, onde a opção intermediária de "nem concordo nem discordo" não está disponível. Isso às vezes é chamado de método de "escolha forçada", uma vez que a opção neutra é removida. A opção neutra pode ser vista como uma opção fácil de tomar quando um entrevistado não tem certeza e, portanto, se é uma opção verdadeiramente neutra é questionável. Um estudo de 1987 encontrou diferenças insignificantes entre o uso de "indeciso" e "neutro" como a opção do meio em uma escala Likert de cinco pontos.

Escalas Likert podem estar sujeitas a distorções por várias causas. Os entrevistados podem:

  • Evite usar categorias de resposta extremas ( viés de tendência central ), especialmente por um desejo de evitar ser percebido como tendo pontos de vista extremistas (um exemplo de viés de desejabilidade social ). Esse efeito pode aparecer no início de um teste devido a uma expectativa de que questões sobre as quais o sujeito tem opiniões mais fortes possam surgir, de modo que nas questões anteriores se "deixe espaço" para respostas mais fortes posteriormente no teste. Essa expectativa cria um viés que é especialmente pernicioso, pois seus efeitos não são uniformes ao longo do teste e não podem ser corrigidos por meio da normalização geral;
  • Concordar com as afirmações apresentadas ( viés de aquiescência ), com esse efeito especialmente forte entre as pessoas, como crianças, pessoas com deficiência de desenvolvimento e idosos ou enfermos, que estão sujeitos a uma cultura de institucionalização que incentiva e incentiva a vontade de agradar;
  • Discordar das sentenças apresentadas por um desejo defensivo de evitar fazer afirmações errôneas e / ou evitar consequências negativas que os respondentes podem temer que resultem do uso de suas respostas contra eles, especialmente se mal interpretadas e / ou fora do contexto;
  • Forneça respostas que eles acreditam que serão avaliadas como indicadores de força ou falta de fraqueza / disfunção ("fingindo ser bom"),
  • Forneça respostas que eles acreditam que serão avaliadas como indicativas de fraqueza ou presença de deficiência / patologia ("fingindo ser ruim"),
  • Tente retratar a si próprios ou sua organização em uma luz que eles acreditam que o examinador ou a sociedade consideram mais favorável do que suas crenças verdadeiras ( viés de desejabilidade social , a versão intersubjetiva de "fingir bem" objetivo discutido acima);
  • Tente retratar a si próprios ou à sua organização de uma maneira que eles acreditam que o examinador ou a sociedade consideram menos favorável / mais desfavorável do que suas crenças verdadeiras ( desafio à norma , a versão intersubjetiva do objetivo "fingir mal" discutida acima).

Projetar uma escala com chaveamento balanceado (um número igual de afirmações positivas e negativas e, especialmente, um número igual de afirmações positivas e negativas em relação a cada posição ou questão em questão) pode evitar o problema de viés de aquiescência, uma vez que a aquiescência em itens chaveados positivamente equilibre a aquiescência em itens com chave negativa, mas os vieses defensivos, de tendência central e de desejabilidade social são um pouco mais problemáticos.

Pontuação e análise

Após o preenchimento do questionário, cada item pode ser analisado separadamente ou, em alguns casos, as respostas dos itens podem ser somadas para criar uma pontuação para um grupo de itens. Conseqüentemente, as escalas Likert são freqüentemente chamadas de escalas somativas.

Se os itens Likert individuais podem ser considerados como dados de nível de intervalo, ou se eles devem ser tratados como dados categóricos ordenados é assunto de considerável discordância na literatura, com fortes convicções sobre quais são os métodos mais aplicáveis. Essa discordância pode ser rastreada, em muitos aspectos, na medida em que os itens de Likert são interpretados como sendo dados ordinais .

Existem duas considerações principais nesta discussão. Primeiro, as escalas Likert são arbitrárias. O valor atribuído a um item Likert não tem base numérica objetiva, seja em termos de teoria de medida ou escala (a partir da qual uma métrica de distância pode ser determinada). O valor atribuído a cada item Likert é simplesmente determinado pelo pesquisador que projeta a pesquisa, que toma a decisão com base em um nível de detalhe desejado. No entanto, por convenção, os itens Likert tendem a receber valores inteiros positivos progressivos. As escalas Likert normalmente variam de 2 a 10 - com 3, 5 ou 7 sendo as mais comuns. Além disso, essa estrutura progressiva da escala é tal que cada item Likert sucessivo é tratado como indicando uma resposta "melhor" do que o valor anterior. (Isso pode ser diferente nos casos em que a ordem reversa da escala Likert é necessária).

O segundo ponto, e possivelmente o mais importante, é se a "distância" entre cada categoria de item sucessiva é equivalente, o que é inferido tradicionalmente. Por exemplo, no item Likert de cinco pontos acima, a inferência é que a 'distância' entre as categorias 1 e 2 é a mesma que entre as categorias 3 e 4. Em termos de boas práticas de pesquisa, uma apresentação equidistante pelo pesquisador é importante ; caso contrário, pode ocorrer um viés na análise. Por exemplo, um item Likert de quatro pontos com as categorias "Fraco", "Médio", "Bom" e "Muito bom" provavelmente não terá todas as categorias equidistantes, pois há apenas uma categoria que pode receber uma classificação abaixo da média. Isso poderia indiscutivelmente enviesar qualquer resultado em favor de um resultado positivo. Por outro lado, mesmo que um pesquisador apresente o que ele acredita serem categorias equidistantes, isso não pode ser interpretado como tal pelo respondente.

Uma boa escala Likert, como acima, apresentará uma simetria de categorias sobre um ponto médio com qualificadores linguísticos claramente definidos. Em tal escalonamento simétrico, atributos equidistantes serão tipicamente mais claramente observados ou, pelo menos, inferidos. Quando uma escala Likert é simétrica e equidistante, ela se comporta mais como uma medição de nível de intervalo. Portanto, embora uma escala Likert seja de fato ordinal , se bem apresentada pode, no entanto, aproximar-se de uma medida de nível de intervalo. Isso pode ser benéfico, pois, se fosse tratado apenas como uma escala ordinal, algumas informações valiosas poderiam ser perdidas se a 'distância' entre os itens Likert não estivesse disponível para consideração. A ideia importante aqui é que o tipo apropriado de análise depende de como a escala Likert foi apresentada.

As noções de tendência central costumam ser aplicáveis ​​no nível do item - ou seja, as respostas costumam mostrar uma distribuição quase normal. A validade de tais medidas depende da natureza do intervalo subjacente da escala. Se a natureza do intervalo for assumida para uma comparação de dois grupos, o teste t de amostras emparelhadas não é inapropriado. Se os testes não paramétricos forem realizados, a modificação de Pratt (1959) para o teste dos postos sinalizados de Wilcoxon é recomendada em vez do teste dos postos sinalizados de Wilcoxon padrão .

As respostas a várias perguntas Likert podem ser somadas desde que todas as perguntas usem a mesma escala Likert e que a escala seja uma aproximação defensável a uma escala de intervalo, caso em que o teorema do limite central permite o tratamento dos dados como dados de intervalo medindo uma variável latente. Se as respostas somadas atenderem a essas suposições, testes estatísticos paramétricos, como a análise de variância, podem ser aplicados. Os pontos de corte típicos para pensar que essa aproximação será aceitável são um mínimo de quatro e, de preferência, oito itens na soma.

Para modelar respostas Likert binárias diretamente, elas podem ser representadas em uma forma binomial pela soma das respostas de concordo e discordo separadamente. O qui-quadrado , o teste Q de Cochran ou o teste de McNemar são procedimentos estatísticos comuns usados ​​após essa transformação. Testes não paramétricos, como teste qui-quadrado , teste de Mann-Whitney , teste de postos sinalizados de Wilcoxon ou teste de Kruskal-Wallis . são frequentemente usados ​​na análise de dados da escala Likert.

Alternativamente, as respostas da escala Likert podem ser analisadas com um modelo probit ordenado , preservando a ordenação das respostas sem a suposição de uma escala de intervalo. O uso de um modelo probit ordenado pode evitar erros que surgem ao tratar as classificações ordenadas como medições de nível de intervalo.

A avaliação baseada em consenso (CBA) pode ser usada para criar um padrão objetivo para escalas Likert em domínios onde não existe um padrão objetivo ou geralmente aceito. A avaliação baseada em consenso (CBA) pode ser usada para refinar ou mesmo validar os padrões geralmente aceitos.

Apresentação visual de dados do tipo Likert

Uma parte importante da análise e apresentação de dados é a visualização (ou plotagem) dos dados. O assunto de plotagem de dados de classificação Likert (e outros) é discutido extensivamente em dois artigos de Robbins e Heiberger. No primeiro, eles recomendam o uso do que chamam de gráficos de barras empilhadas divergentes e os comparam com outros estilos de plotagem. O segundo artigo descreve o uso da função Likert no pacote HH para R e dá muitos exemplos de seu uso.

Nível de medição

Freqüentemente, acredita-se que as cinco categorias de resposta representam um nível de intervalo de medição . Mas isso só pode ser o caso se os intervalos entre os pontos da escala corresponderem às observações empíricas em um sentido métrico. Reips e Funke (2008) mostram que esse critério é muito mais bem atendido por uma escala visual analógica . Na verdade, também podem surgir fenômenos que até questionam o nível da escala ordinal em escalas Likert. Por exemplo, em um conjunto de itens A ,  B ,  C classificados com uma escala Likert podem aparecer relações circulares como A  >  B , B  >  C e C  >  A. Isso viola o axioma da transitividade da escala ordinal.

Pesquisas de Labovitz e Traylor fornecem evidências de que, mesmo com distorções bastante grandes das distâncias percebidas entre os pontos da escala, os itens do tipo Likert têm um desempenho próximo a escalas que são percebidas como intervalos iguais. Portanto, esses itens e outras escalas de aparência igual em questionários são robustos a violações da suposição de distância igual que muitos pesquisadores acreditam ser necessários para procedimentos e testes estatísticos paramétricos.

Modelo rasch

Os dados da escala Likert podem, em princípio, ser usados ​​como base para a obtenção de estimativas de nível de intervalo em um continuum pela aplicação do modelo Rasch politômico , quando podem ser obtidos dados que se enquadram neste modelo. Além disso, o modelo Rasch politômico permite testar a hipótese de que as afirmações refletem níveis crescentes de uma atitude ou traço, conforme pretendido. Por exemplo, a aplicação do modelo freqüentemente indica que a categoria neutra não representa um nível de atitude ou traço entre as categorias de discordo e concordo.

Novamente, nem todo conjunto de itens em escala de Likert pode ser usado para medição Rasch. Os dados devem ser verificados minuciosamente para cumprir os axiomas formais estritos do modelo. No entanto, as pontuações brutas são estatísticas suficientes para as medidas Rasch, uma escolha deliberada de Georg Rasch , portanto, se você estiver preparado para aceitar as pontuações brutas como válidas, também poderá aceitar as medidas Rasch como válidas.

Pronúncia

Rensis Likert , o desenvolvedor da escala, pronuncia o seu nome / l ɪ k . ər t / LIK -ərt '. Alguns alegaram que o nome de Likert "está entre os mais mal pronunciado [no] campo", porque muitas pessoas pronunciam o nome da escala como / l . k ər t / LY -kərt .

Veja também

Referências

links externos