Tanagra (aprendizado de máquina) - Tanagra (machine learning)

Tanagra
Desenvolvedor (s) Universidade Lumière Lyon 2
Versão estável
1.4.50 / 2013/12/18
Repositório Edite isso no Wikidata
Sistema operacional janelas
Modelo Aprendizado de máquina , mineração de dados , análise multivariada , análise de dados
Licença Código aberto
Local na rede Internet http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html

Tanagra é um pacote gratuito de software de aprendizado de máquina para fins acadêmicos e de pesquisa desenvolvido por Ricco Rakotomalala na Lumière University Lyon 2 , França. O Tanagra oferece suporte a várias tarefas de mineração de dados padrão , como: Visualização, Estatísticas descritivas, seleção de instância, seleção de recurso, construção de recurso, regressão , análise fatorial , agrupamento , classificação e aprendizagem de regras de associação .

Tanagra é um projeto acadêmico. É amplamente utilizado nas universidades de língua francesa. Tanagra é freqüentemente usado em estudos reais e em papéis de comparação de software.

História

O desenvolvimento do Tanagra foi iniciado em junho de 2003. A primeira versão foi distribuída em dezembro de 2003. Tanagra é o sucessor do Sipina, outra ferramenta gratuita de mineração de dados que se destina apenas a tarefas de aprendizagem supervisionada (classificação), especialmente a construção interativa e visual de Árvores de decisão. O Sipina ainda está disponível online e é mantido. Tanagra é um "projeto de código aberto", pois todo pesquisador pode acessar o código-fonte e adicionar seus próprios algoritmos, desde que concorde e esteja em conformidade com a licença de distribuição do software.

O objetivo principal do projeto Tanagra é fornecer aos pesquisadores e alunos um software de mineração de dados amigável, em conformidade com as normas atuais de desenvolvimento de software neste domínio (especialmente no design de sua GUI e na forma de usá-la), e permitindo a análise de dados reais ou sintéticos.

A partir de 2006, Ricco Rakotomalala fez um importante esforço de documentação. Um grande número de tutoriais é publicado em um site dedicado. Eles descrevem os métodos estatísticos e de aprendizado de máquina e sua implementação com Tanagra em estudos de caso reais. O uso de outras ferramentas gratuitas de mineração de dados nos mesmos problemas também é amplamente descrito. A comparação das ferramentas permite aos leitores compreender as possíveis diferenças na apresentação dos resultados.

Descrição

Uma captura de tela do software Tanagra

Tanagra funciona de forma semelhante às ferramentas atuais de mineração de dados. O usuário pode projetar visualmente um processo de mineração de dados em um diagrama. Cada nó é uma técnica estatística ou de aprendizado de máquina, a conexão entre dois nós representa a transferência de dados. Mas, ao contrário da maioria das ferramentas baseadas no paradigma do fluxo de trabalho, o Tanagra é muito simplificado. Os tratamentos são representados em um diagrama de árvore. Os resultados são exibidos em formato HTML. Isso torna mais fácil exportar as saídas para visualizar os resultados em um navegador. Também é possível copiar as tabelas de resultados para uma planilha.

Tanagra faz um bom compromisso entre abordagens estatísticas (por exemplo, testes estatísticos paramétricos e não paramétricos), métodos de análise multivariada (por exemplo, análise fatorial, análise de correspondência, análise de cluster, regressão) e técnicas de aprendizado de máquina (por exemplo, rede neural, máquina de vetor de suporte, árvores de decisão, aleatório floresta).

Veja também

Referências

links externos