Ordem alfabética - Alphabetical order

A ordem alfabética é um sistema pelo qual as cadeias de caracteres são colocadas em ordem com base na posição dos caracteres na ordem convencional de um alfabeto . É um dos métodos de comparação . Em matemática, uma ordem lexicográfica é a generalização da ordem alfabética para outros tipos de dados, como sequências de dígitos ou números.

Quando aplicada a strings ou sequências que podem conter dígitos, números ou tipos de elementos mais elaborados, além de caracteres alfabéticos, a ordem alfabética é geralmente chamada de ordem lexicográfica .

Para determinar qual das duas cadeias de caracteres vem primeiro ao organizar em ordem alfabética, suas primeiras letras são comparadas. Se forem diferentes, então a string cuja primeira letra vem antes do alfabeto vem antes da outra string. Se as primeiras letras forem iguais, as segundas letras serão comparadas e assim por diante. Se for alcançada uma posição onde uma string não tem mais letras para comparar enquanto a outra tem, então a primeira string (mais curta) é considerada a primeira em ordem alfabética.

Letras maiúsculas (maiúsculas) são geralmente consideradas idênticas às letras minúsculas correspondentes para fins de ordenação alfabética, embora convenções possam ser adotadas para lidar com situações em que duas strings diferem apenas em maiúsculas. Também existem várias convenções para o tratamento de strings contendo espaços , letras modificadas (como aquelas com sinais diacríticos ) e caracteres que não são letras, como sinais de pontuação .

O resultado de colocar um conjunto de palavras ou strings em ordem alfabética é que todas as strings que começam com a mesma letra são agrupadas; dentro desse agrupamento, todas as palavras que começam com a mesma sequência de duas letras são agrupadas; e assim por diante. O sistema, portanto, tende a maximizar o número de letras iniciais comuns entre palavras adjacentes.

História

A ordem alfabética foi usada pela primeira vez no primeiro milênio AEC pelos escribas semitas do noroeste usando o sistema Abjad . No entanto, uma série de outros métodos de classificação e ordenação do material, incluindo geográfico, cronológico , hierárquico e por categoria , foram preferidos à ordem alfabética por séculos.

A Bíblia é datada dos séculos 6 a 7 AEC. No livro de Jeremias , o profeta utiliza uma cifra de substituição Atbash , com base na ordem alfabética. Da mesma forma, os autores bíblicos usaram acrósticos baseados no alfabeto hebraico (ordenado) .

O primeiro uso eficaz da ordem alfabética como dispositivo de catalogação entre os estudiosos pode ter sido na Alexandria antiga, na Grande Biblioteca de Alexandria , fundada por volta de 300 aC. Acredita-se que o poeta e estudioso Callimachus , que lá trabalhou, tenha criado o primeiro catálogo de biblioteca do mundo , conhecido como Pinakes , com pergaminhos armazenados em ordem alfabética da primeira letra dos nomes dos autores.

No século 1 aC, o escritor romano Varro compilou listas alfabéticas de autores e títulos. No século 2 dC, Sexto Pompeu Festo escreveu um epítome enciclopédico das obras de Verrius Flaccus , De verborum significatu , com entradas em ordem alfabética. No século III dC, Harpocration escreveu um léxico homérico alfabetizado por todas as letras. No século 10, o autor do Suda usou a ordem alfabética com variações fonéticas.

A ordem alfabética como auxílio à consulta começou a entrar na corrente principal da vida intelectual da Europa Ocidental na segunda metade do século 12, quando ferramentas alfabéticas foram desenvolvidas para ajudar os pregadores a analisar o vocabulário bíblico . Isso levou à compilação de concordâncias alfabéticas da Bíblia pelos frades dominicanos em Paris no século 13, sob o governo de Hugo de Saint Cher . Obras de referência mais antigas, como as Interpretações de nomes hebraicos de São Jerônimo , foram colocadas em ordem alfabética para facilitar a consulta. O uso da ordem alfabética foi inicialmente resistido por estudiosos, que esperavam que seus alunos dominassem sua área de estudo de acordo com suas próprias estruturas racionais; seu sucesso foi impulsionado por ferramentas como o índice de Robert Kilwardby para as obras de Santo Agostinho , que ajudou os leitores a acessar o texto original completo em vez de depender das compilações de trechos que se tornaram proeminentes na escolástica do século 12 . A adoção da ordem alfabética fez parte da transição do primado da memória para o das obras escritas. A ideia de ordenar as informações pela ordem do alfabeto também encontrou resistência dos compiladores de enciclopédias nos séculos 12 e 13, todos religiosos devotos. Eles preferiram organizar seu material teologicamente - na ordem da criação de Deus, começando com Deus (que significa Deus).

Em 1604, Robert Cawdrey teve que explicar na Tabela Alphabeticall , o primeiro dicionário monolíngue de inglês , "Agora, se a palavra que tu estás desejoso de encontrar, começa com (a), então olhe no início desta Tabela, mas se com (v) olhe para o fim ". Embora ainda em 1803 Samuel Taylor Coleridge condenasse as enciclopédias com "um arranjo determinado pelo acidente das letras iniciais", muitas listas são hoje baseadas neste princípio.

O arranjo em ordem alfabética pode ser visto como uma força para democratizar o acesso à informação, uma vez que não requer amplo conhecimento prévio para encontrar o que era necessário.

Pedidos na escrita latina

Pedido básico e exemplos

A ordem padrão do moderno alfabeto latino básico ISO é:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Um exemplo de ordem alfabética direta a seguir:

  • Como; Áster; Astrolábio; Astronomia; Astrofísica; No; Ataman; Ataque; Baa

Outro exemplo:

  • Barnacle; Ser; Estive; Beneficiar; Dobrado

As palavras acima são ordenadas alfabeticamente. As vem antes de Aster porque eles começam com as mesmas duas letras e As não tem mais letras depois disso, enquanto Aster tem. As próximas três palavras vêm depois de Aster porque sua quarta letra (a primeira que difere) é r , que vem depois de e (a quarta letra de Aster ) no alfabeto. Essas palavras são ordenadas com base em suas sextas letras ( l , n e p respectivamente). Em seguida, vem At , que difere das palavras anteriores na segunda letra ( t vem depois de s ). Ataman vem atrás de At pela mesma razão que Aster veio atrás de As . O ataque segue Ataman com base na comparação de suas terceiras letras, e Baa vem depois de todas as outras porque tem uma primeira letra diferente.

Tratamento de strings com várias palavras

Quando algumas das strings que estão sendo ordenadas consistem em mais de uma palavra, ou seja, elas contêm espaços ou outros separadores como hifens , então duas abordagens básicas podem ser adotadas. Na primeira abordagem, todas as strings são ordenadas inicialmente de acordo com sua primeira palavra, como na sequência:

  • Carvalho; Oak Hill; Oak Ridge; Oakley Park; Oakley River
    onde todas as cordas que começam com a palavra separada Oak precedem todas aquelas que começam Oakley , porque Oak precede Oakley em ordem alfabética.

Na segunda abordagem, as strings são colocadas em ordem alfabética como se não tivessem espaços, dando a sequência:

  • Carvalho; Oak Hill; Oakley Park; Oakley River; Oak Ridge
    onde Oak Ridge agora vem depois das cordas Oakley , como faria se fosse escrito "Oakridge".

A segunda abordagem é geralmente usada em dicionários e, portanto, é freqüentemente chamada de pedido de dicionário pelos editores . A primeira abordagem tem sido freqüentemente usada em índices de livros , embora cada editor tradicionalmente defina seus próprios padrões para qual abordagem usar; não havia um padrão ISO para índices de livros ( ISO 999 ) antes de 1975.

Casos especiais

Cartas modificadas

Em francês, as letras modificadas (como aquelas com sinais diacríticos ) são tratadas da mesma forma que a letra base para fins de ordem alfabética. Por exemplo, o papel fica entre a rocha e a rosa , como se fosse um papel escrito . No entanto, os idiomas que usam essas letras sistematicamente geralmente têm suas próprias regras de ordenação. Consulte as convenções específicas do idioma abaixo.

Ordenando pelo sobrenome

Na maioria das culturas onde os sobrenomes são escritos após os prenomes , ainda é desejável classificar as listas de nomes (como nas listas telefônicas) pelo sobrenome primeiro. Nesse caso, os nomes precisam ser reordenados para serem classificados corretamente. Por exemplo, Juan Hernandes e Brian O'Leary devem ser classificados como "Hernandes, Juan" e "O'Leary, Brian", mesmo que não tenham sido escritos dessa forma. Capturar essa regra em um algoritmo de agrupamento de computador é difícil e tentativas simples necessariamente falharão. Por exemplo, a menos que o algoritmo tenha à sua disposição uma extensa lista de sobrenomes, não há como decidir se "Gillian Lucille van der Waal" é "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der", ou mesmo "Lucille van der Waal, Gillian".

A ordenação pelo sobrenome é frequentemente encontrada em contextos acadêmicos. Em um único artigo de vários autores, ordenar os autores em ordem alfabética pelo sobrenome, em vez de outros métodos, como antiguidade reversa ou grau subjetivo de contribuição ao artigo, é visto como uma forma de "reconhecer contribuições semelhantes" ou "evitar [ing] desarmonia em grupos de colaboração ". Descobriu-se que a prática em certos campos de ordenar citações em bibliografias pelos sobrenomes de seus autores cria um preconceito em favor de autores com sobrenomes que aparecem mais cedo no alfabeto, enquanto esse efeito não aparece em campos nos quais as bibliografias são ordenadas cronologicamente.

As e outras palavras comuns

Se uma frase começar com uma palavra muito comum (como "o", "a" ou "uma", chamados de artigos na gramática), essa palavra às vezes é ignorada ou movida para o final da frase, mas nem sempre é o caso. Por exemplo, o livro " The Shining " pode ser tratado como "Shining" ou "Shining, The" e, portanto, antes do título do livro " Summer of Sam ", embora também possa ser tratado simplesmente como "The Shining" e depois de " Summer of Sam ". Da mesma forma, " A Wrinkle in Time " pode ser tratado como "Wrinkle in Time", "Wrinkle in Time, A" ou "A Wrinkle in Time". Todos os três métodos de alfabetização são bastante fáceis de criar por algoritmo, mas muitos programas dependem, em vez disso, de ordenação lexicográfica simples .

Prefixos Mac

Os prefixos M ' e Mc em sobrenomes irlandeses e escoceses são abreviações para Mac e, às vezes, são colocados em ordem alfabética como se a grafia fosse Mac completo. Assim, McKinley pode ser listado antes de Mackintosh (como seria se tivesse sido escrito como "MacKinley"). Desde o advento das listas classificadas por computador, esse tipo de alfabetização é encontrado com menos frequência, embora ainda seja usado nas listas telefônicas britânicas.

Prefixo St

O prefixo St ou St. é uma abreviatura de "Saint" e é tradicionalmente alfabetizado como se a grafia fosse Saint por extenso. Assim, em um dicionário geográfico, St John's poderia ser listado antes de Salem (como se o fosse se tivesse sido escrito como "Saint John's"). Desde o advento das listas ordenadas por computador, esse tipo de alfabetização é encontrado com menos frequência, embora ainda seja usado algumas vezes.

Ligaduras

Ligaduras (duas ou mais letras mescladas em um símbolo) que não são consideradas letras distintas, como Æ e Œ em inglês, são normalmente agrupadas como se as letras fossem separadas - "æther" e "aether" seriam ordenados da mesma forma em relação a todas as outras palavras. Isso é verdade mesmo quando a ligadura não é puramente estilística, como em empréstimos e nomes de marcas.

Regras especiais podem precisar ser adotadas para classificar strings que variam apenas pelo fato de duas letras serem unidas por uma ligadura.

Tratamento de numerais

Quando algumas das strings contêm numerais (ou outros caracteres que não são letras), várias abordagens são possíveis. Às vezes, esses caracteres são tratados como se viessem antes ou depois de todas as letras do alfabeto. Outro método é os números serem classificados em ordem alfabética como seriam escritos: por exemplo, 1776 seria classificado como se estivesse escrito "dezessete setenta e seis" e 24 heures du Mans como se escrito "vingt-quatre ..." (francês para "vinte e quatro"). Quando numerais ou outros símbolos são usados ​​como formas gráficas especiais de letras, como 1337 para leet ou o filme Seven (que foi estilizado como Se7en ), eles podem ser classificados como se fossem essas letras. A ordem de classificação natural ordena as strings em ordem alfabética, exceto que os números com vários dígitos são tratados como um único caractere e ordenados pelo valor do número codificado pelos dígitos.

Convenções específicas de idioma

As línguas que usam um alfabeto latino estendido geralmente têm suas próprias convenções para o tratamento das letras extras. Além disso, em alguns idiomas, certos dígrafos são tratados como letras únicas para fins de agrupamento. Por exemplo, o alfabeto de 29 letras do espanhol trata ñ como uma letra básica após n , e anteriormente tratava os dígrafos ch e ll como letras básicas após c e l , respectivamente. Ch e ll ainda são considerados letras, mas agora estão em ordem alfabética como combinações de duas letras. (A nova regra de alfabetização foi emitida pela Real Academia Espanhola em 1994.) Por outro lado, o dígrafo rr segue rqu como esperado, e o fazia mesmo antes da regra de alfabetização de 1994.

Em alguns casos, como em Kiowa , o alfabeto foi completamente reordenado.

As regras de alfabetização aplicadas em vários idiomas estão listadas abaixo.

  • No Azerbaijão , existem oito letras adicionais no alfabeto latino padrão. Cinco delas são vogais: i, ı, ö, ü, ə e três são consoantes: ç, ş, ğ. O alfabeto é igual ao alfabeto turco , com os mesmos sons escritos com as mesmas letras, exceto por três letras adicionais: q, xe ə para sons que não existem em turco. Embora todas as "letras turcas" sejam agrupadas em sua ordem alfabética "normal", como no turco, as três letras extras são agrupadas arbitrariamente após letras cujos sons se aproximam dos deles. Portanto, q é agrupado logo após k, x (pronunciado como um ch alemão ) é agrupado logo após he ə (pronunciado aproximadamente como uma abreviação em inglês a ) é agrupado logo após e.
  • Em bretão , não há "c", "q", "x", mas há os dígrafos "ch" e "c'h", que são agrupados entre "b" e "d". Por exemplo: «buzhugenn, chug, c'hoar, daeraouenn» (minhoca, suco, irmã, lágrima).
  • Em bósnio , croata e sérvio e outras línguas eslavas do sul relacionadas, os cinco caracteres acentuados e os três caracteres conjugados são classificados após os originais: ..., C, Č, Ć, D, DŽ, Đ, E, ..., L , LJ, M, N, NJ, O, ..., S, Š, T, ..., Z, Ž.
  • Em tcheco e eslovaco , as vogais acentuadas têm peso de comparação secundário - em comparação com outras letras, elas são tratadas como suas formas não acentuadas (A-Á, E-É-Ě, I-Í, O-Ó-Ô, U-Ú-Ů , Y-Ý), mas então eles são classificados após as letras não acentuadas (por exemplo, a ordem lexicográfica correta é baa, baá, báa, bab, báb, bac, bác, bač, báč). Consoantes acentuadas (aquelas com caron ) têm peso de comparação primário e são colocadas imediatamente após suas contrapartes não acentuadas, com exceção de Ď, Ň e Ť, que também têm peso secundário. CH é considerada como sendo uma carta separada e passa entre H e I . Em eslovaco, DZ e também são consideradas letras separadas e estão posicionadas entre Ď e E (A-Á-Ä-BC-Č-D-Ď-DZ-DŽ-E-É ...).
  • Nos alfabetos dinamarquês e norueguês , as mesmas vogais extras do sueco (veja abaixo) também estão presentes, mas em uma ordem diferente e com glifos diferentes (..., X, Y, Z, Æ , Ø , Å ). Além disso, "Aa" é agrupado como equivalente a "Å". O alfabeto dinamarquês tradicionalmente vê "W" como uma variante de "V", mas hoje "W" é considerado uma letra separada.
  • Em holandês, a combinação IJ (representando IJ ) era anteriormente agrupada como Y (ou às vezes como uma letra separada: Y <IJ <Z), mas atualmente é agrupada principalmente como 2 letras (II <IJ <IK). As exceções são listas telefônicas; IJ é sempre agrupado como Y aqui porque em muitos nomes de família holandeses, Y é usado onde a ortografia moderna exigiria IJ. Observe que uma palavra que começa com ij que é escrita com I maiúsculo também é escrita com J maiúsculo, por exemplo, a cidade IJmuiden , o rio IJssel e o país IJsland ( Islândia ).
  • Em esperanto , consoantes com circunflexa acentos ( ĉ , g , Ĥ , J , S ), bem como ŭ (u com breve ), são contadas como letras separadas e coligidos separadamente (c, c, d, e, f, g, ĝ, h, ĥ, i, j, ĵ ... s, ŝ, t, u, ŭ, v, z).
  • Em estoniano , õ , ä , ö e ü são considerados letras separadas e agrupados após w . As letras š , z e ž aparecem apenas em empréstimos e nomes próprios estrangeiros e seguem as letras s no alfabeto estoniano , que de outra forma não difere do alfabeto latino básico.
  • O alfabeto faroense também tem algumas das letras extras dinamarquesas, norueguesas e suecas, a saber Æ e Ø . Além disso, o alfabeto Feroês utiliza o eth Icelandic, que segue a D . Cinco das seis vogais A , I , O , U e Y podem receber acentos e são depois consideradas letras separadas. As consoantes C , Q , X , W e Z não são encontradas. Portanto, as primeiras cinco letras são A , Á , B , D e Ð , e as últimas cinco são V , Y , Ý , Æ , Ø
  • No filipino (tagalo) e em outras línguas filipinas, a letra Ng é tratada como uma letra separada. É pronunciado como em sing, ping-pong, etc. Por si só, é pronunciado nang , mas na ortografia filipina geral , é escrito como se fossem duas letras separadas (n e g). Além disso, as letras derivadas (como Ñ ) seguem imediatamente a letra base. Filipino também é escrito com sinais diacríticos, mas seu uso é muito raro (exceto o til ). (A ortografia filipina também inclui a ortografia.)
  • O alfabeto finlandês e as regras de comparação são iguais aos do sueco.
  • Para o francês , o último acento em uma determinada palavra determina a ordem. Por exemplo, em francês, as quatro palavras a seguir seriam classificadas desta forma: cote <côte <coté <côté.
  • Em alemão, as letras com trema ( Ä , Ö , Ü ) são tratadas geralmente como suas versões sem trema; ß é sempre classificado como ss. Isso cria a ordem alfabética Arbeit, Arg, Ärgerlich, Argument, Arm, Assistant, Aßlar, Assoziation. Para listas telefônicas e listas de nomes semelhantes, os tremas devem ser agrupados como as combinações de letras "ae", "oe", "ue" porque vários sobrenomes alemães aparecem com trema e na forma sem trema com "e "(Müller / Mueller). Isso cria a ordem alfabética Udet, Übelacker, Uell, Ülle, Ueve, Üxküll, Uffenbach.
  • As vogais húngaras têm acentos, tremas e acentos duplos, enquanto as consoantes são escritas com caracteres simples, duplos (dígrafos) ou triplos (trígrafos). No agrupamento, as vogais acentuadas são equivalentes às suas contrapartes não acentuadas e os caracteres duplos e triplos seguem seus originais simples. A ordem alfabética húngara é: A = Á , B, C, Cs , D, Dz , Dzs , E = É , F, G, Gy , H, I = Í , J, K, L, Ly , M, N, Ny , O = Ó , Ö = Ő , P, Q, R, S, Sz , T, Ty , U = Ú , Ü = Ű , V, W, X, Y, Z, Zs . (Antes de 1984, dz e dzs não eram considerados letras únicas para agrupamento, mas duas letras cada, d + z e d + zs.) Isso significa que, por exemplo, nádcukor deve preceder nádcsomó (embora s normalmente preceda u ), uma vez que c precede cs no agrupamento. A diferença no comprimento da vogal só deve ser levada em consideração se as duas palavras forem idênticas (por exemplo , egér, éger ). Espaços e hifens dentro de frases são ignorados no agrupamento. Ch também ocorre como dígrafo em certas palavras, mas não é considerado um grafema por si só em termos de comparação.
    Uma característica particular do agrupamento húngaro é que as formas contraídas de di- e trígrafos duplos (como ggy de gy + gy ou ddzs de dzs + dzs ) devem ser agrupados como se fossem escritos por extenso (independentemente do fato da contração e os elementos dos di- ou trígrafos). Por exemplo, kaszinó deve preceder kassza (embora o quarto caractere z normalmente venha depois de s no alfabeto), porque o quarto "caractere" ( grafema ) da palavra kassza é considerado um segundo sz (decompondo ssz em sz + sz ) , que segue i (em kaszinó ).
  • Em islandês , Þ é adicionado e D é seguido por Ð . Cada vogal (A, E, I, O, U, Y) é seguida por seu correspondente com agudo : Á, É, Í, Ó, Ú, Ý. Não há Z, então o alfabeto termina: ... X, Y, Ý, Þ , Æ , Ö.
    • Ambas as letras também foram usadas por escribas anglo-saxões que também usaram a letra rúnica Wynn para representar / w /.
    • Þ (chamado de espinho; þ minúsculo) também é uma letra rúnica.
    • Ð (denominado eth; ð minúsculo) é a letra D com um traço adicionado.
  • O kiowa é ordenado com base em princípios fonéticos, como as escritas brahmicas , e não na ordem latina histórica. As vogais vêm primeiro, depois param as consoantes ordenadas da frente para a parte de trás da boca, e do tempo de início da voz negativo para o positivo , depois as africadas, fricativas, líquidas e nasais:
A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
  • Em lituano , as letras especificamente lituanas seguem seus originais latinos. Outra mudança é que Y vem logo antes de J : ... G, H, I, Į, Y, J, K ...
  • Em polonês , letras especificamente polonesas derivadas do alfabeto latino são agrupadas após seus originais: A, Ą, B, C, C, D, E, Ę, ..., L, Ł, M, N, Ń, O, Ó , P, ..., S, Ś, T, ..., Z, Ź, Ż. Os dígrafos para fins de agrupamento são tratados como se fossem duas letras separadas.
  • Em português , a ordem de agrupamento é igual à em inglês: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Os dígitos e as letras com diacríticos não estão incluídos no alfabeto.
  • Em romeno , os caracteres especiais derivados do alfabeto latino são agrupados após seus originais: A, Ă, Â, ..., I, Î, ..., S, Ș, T, Ț, ..., Z.
  • O espanhol tratava (até 1994) "CH" e "LL" como letras únicas, dando uma ordem de cinco , credo , chispa e lomo , luz , llama . Isso não é mais verdade, pois em 1994 o RAE adotou o uso mais convencional, e agora LL é agrupado entre LK e LM, e CH entre CG e CI. Os seis caracteres com diacríticos Á, É, Í, Ó, Ú, Ü são tratados como as letras originais A, E, I, O, U, por exemplo: rádio , ráfaga , rana , rápido , rastrillo . A única questão de comparação específica do espanhol é Ñ ( eñe ) como uma letra diferente comparada após N.
  • No alfabeto sueco , existem três vogais extras colocadas em seu final (..., X, Y, Z, Å , Ä , Ö ), semelhantes ao alfabeto dinamarquês e norueguês, mas com glifos diferentes e uma ordem de agrupamento diferente. A letra "W" foi tratada como uma variante de "V", mas na 13ª edição da Svenska Akademiens ordlista (2006) "W" foi considerada uma letra separada.
  • No alfabeto turco, existem 6 letras adicionais: ç, ğ, ı, ö, ş e ü (mas sem q, w e x). Eles são agrupados com ç após c, ğ após g, ı antes de i, ö após o, ş após s e ü após u. Originalmente, quando o alfabeto foi introduzido em 1928, ı foi agrupado após i, mas a ordem foi alterada posteriormente para que as letras com formas contendo pontos, cedilhas ou outras marcas de adorno sempre sigam as letras com as formas nuas correspondentes. Observe que na ortografia turca, a letra I é a maiúscula do i sem ponto, enquanto que İ é a maiúscula do i pontilhado.
  • Em muitos idiomas túrquicos (tais como azeri ou o Jaꞑalif ortografia de tártaro ), existe para ser usado a letra Gha (Ƣƣ), o que veio entre G e H . Agora está em desuso.
  • Em vietnamita , há 7 letras adicionais: ă , â , đ , ê , ô , ơ , ư enquanto f , j , w , z estão ausentes, embora ainda sejam usados ​​(como endereço de Internet, idioma estrangeiro) . "f" é substituído pela combinação "ph". O mesmo que para "w" é "qu".
  • Em Volapük , ä , ö e ü são contados como letras separadas e agrupados separadamente (a, ä, b ... o, ö, p ... u, ü, v) enquanto q e w estão ausentes.
  • Em galês, os dígrafos CH, DD, FF, NG, LL, PH, RH e TH são tratados como letras únicas, e cada um é listado após o primeiro caractere do par (exceto para NG que está listado após G), produzindo o peça A, B, C, CH, D, DD, E, F, FF, G, NG, H e assim por diante. Às vezes pode acontecer, entretanto, que a composição de palavras resulte na justaposição de duas letras que não formam um dígrafo. Um exemplo é a palavra LLONGYFARCH (composta de LLON + GYFARCH). Isso resulta em uma ordem como, por exemplo, LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH (NG é um dígrafo em LLONG, mas não em LLONGYFARCH). A combinação de letras R + H (distinta do dígrafo RH) pode surgir de forma semelhante por justaposição em compostos, embora isso tenda a não produzir quaisquer pares nos quais a identificação incorreta possa afetar a ordenação. Para as outras combinações de letras potencialmente confusas que podem ocorrer - a saber, D + D e L + L - um hífen é usado na grafia (por exemplo, AD-DAL, CHWIL-LYS).

Automação

Algoritmos de agrupamento (em combinação com algoritmos de classificação ) são usados ​​em programação de computador para colocar strings em ordem alfabética. Um exemplo padrão é o Unicode Collation Algorithm , que pode ser usado para colocar strings contendo qualquer símbolo Unicode em (uma extensão) ordem alfabética. Ele pode ser feito para estar em conformidade com a maioria das convenções específicas do idioma descritas acima, adaptando sua tabela de intercalação padrão. Vários desses ajustes são coletados no Common Locale Data Repository .

Pedidos semelhantes

O princípio por trás da ordem alfabética ainda pode ser aplicado em línguas que não usam um alfabeto estritamente falando - por exemplo, eles podem ser escritos usando um silabário ou abugida - desde que os símbolos usados ​​tenham uma ordem estabelecida.

Para sistemas de escrita logográfica , como hanzi chinês ou kanji japonês , o método de classificação radical e traço é frequentemente usado como uma forma de definir uma ordem nos símbolos. O japonês às vezes usa a ordem de pronúncia, mais comumente com a ordem Gojūon , mas às vezes com a ordem Iroha mais antiga .

Em matemática, a ordem lexicográfica é um meio de ordenar as sequências de maneira análoga à usada para produzir a ordem alfabética.

Alguns aplicativos de computador usam uma versão em ordem alfabética que pode ser obtida usando um algoritmo muito simples , baseado puramente nos códigos ASCII ou Unicode para caracteres. Isso pode ter efeitos não padronizados, como colocar todas as letras maiúsculas antes das minúsculas. Veja ordem ASCIIbética .

Um dicionário de rima é baseado na classificação de palavras em ordem alfabética, começando da última até a primeira letra da palavra.

Veja também

Referências

Leitura adicional