Weka (aprendizado de máquina) - Weka (machine learning)

Weka
Logotipo da Weka, apresentando weka, uma ave endêmica da Nova Zelândia
Logotipo da Weka, apresentando weka , uma ave endêmica da Nova Zelândia
Weka-3.5.5.png
Weka 3.5.5 com janela do Explorer aberta com conjunto de dados Iris UCI
Desenvolvedor (s) Universidade de Waikato
Versão estável
3.8.5 (estável) / 21 de dezembro de 2020 ; 9 meses atrás ( 2020-12-21 )
Versão de visualização
3.9.5 / 21 de dezembro de 2020 ; 9 meses atrás ( 2020-12-21 )
Repositório
Escrito em Java
Sistema operacional Windows , OS X , Linux
Plataforma IA-32 , x86-64 ; Java SE
Modelo Aprendizado de máquina
Licença GNU General Public License
Local na rede Internet www .cs .waikato .ac .nz / ~ ml / weka

Waikato Environment for Knowledge Analysis ( Weka ), desenvolvido na University of Waikato , Nova Zelândia , é um software livre licenciado sob a GNU General Public License e o software que acompanha o livro "Data Mining: Practical Machine Learning Tools and Techniques".

Descrição

Weka contém uma coleção de ferramentas de visualização e algoritmos para análise de dados e modelagem preditiva , junto com interfaces gráficas de usuário para fácil acesso a essas funções. A versão original não Java do Weka era um front-end Tcl / Tk para algoritmos de modelagem (principalmente de terceiros) implementados em outras linguagens de programação, além de utilitários de pré-processamento de dados em C e um sistema baseado em makefile para executar experimentos de aprendizado de máquina. Esta versão original foi projetada principalmente como uma ferramenta para analisar dados de domínios agrícolas, mas a versão mais recente totalmente baseada em Java (Weka 3), para a qual o desenvolvimento começou em 1997, agora é usada em muitas áreas de aplicação diferentes, em particular para educação objetivos e pesquisas. As vantagens do Weka incluem:

  • Disponibilidade gratuita sob a GNU General Public License .
  • Portabilidade, uma vez que está totalmente implementado na linguagem de programação Java e, portanto, funciona em quase todas as plataformas de computação modernas.
  • Uma coleção abrangente de técnicas de pré-processamento e modelagem de dados.
  • Fácil de usar devido às suas interfaces gráficas com o usuário.

Weka oferece suporte a várias tarefas de mineração de dados padrão , mais especificamente, pré-processamento de dados, armazenamento em cluster , classificação , regressão , visualização e seleção de recursos . Espera-se que a entrada para o Weka seja formatada de acordo com o Formato de Arquivo Relacional de Atributo e com o nome do arquivo com a extensão .arff. Todas as técnicas de Weka são baseadas na suposição de que os dados estão disponíveis como um arquivo simples ou relação, onde cada ponto de dados é descrito por um número fixo de atributos (normalmente, atributos numéricos ou nominais, mas alguns outros tipos de atributos também são suportados) . Weka fornece acesso a bancos de dados SQL usando Java Database Connectivity e pode processar o resultado retornado por uma consulta de banco de dados. Weka fornece acesso ao aprendizado profundo com Deeplearning4j . Não é capaz de mineração de dados multi-relacional, mas há um software separado para converter uma coleção de tabelas de banco de dados vinculadas em uma única tabela que é adequada para processamento usando o Weka. Outra área importante que atualmente não é coberta pelos algoritmos incluídos na distribuição Weka é a modelagem de sequência.

Pacotes de extensão

Na versão 3.7.2, um gerenciador de pacotes foi adicionado para permitir a instalação mais fácil de pacotes de extensão. Algumas funcionalidades que costumavam ser incluídas no Weka antes desta versão foram movidas para esses pacotes de extensão, mas essa mudança também torna mais fácil para outros contribuírem com extensões para o Weka e manter o software, já que esta arquitetura modular permite atualizações independentes de o núcleo Weka e extensões individuais.

História

  • Em 1993, a Universidade de Waikato na Nova Zelândia começou a desenvolver a versão original do Weka, que se tornou uma mistura de Tcl / Tk, C e makefiles.
  • Em 1997, foi tomada a decisão de redesenvolver Weka do zero em Java, incluindo implementações de algoritmos de modelagem.
  • Em 2005, Weka recebeu o prêmio SIGKDD Data Mining and Knowledge Discovery Service.
  • Em 2006, a Pentaho Corporation adquiriu uma licença exclusiva para usar a Weka para inteligência de negócios . Ele forma o componente de mineração de dados e análise preditiva do pacote de inteligência de negócios da Pentaho. Pentaho já foi adquirido pela Hitachi Vantara, e Weka agora sustenta o componente de código aberto PMI (Plugin for Machine Intelligence).

Ferramentas relacionadas

Veja também

Referências

links externos