scikit-learn - scikit-learn
Autor (es) original (is) | David Cournapeau |
---|---|
lançamento inicial | Junho de 2007 |
Versão estável | 1.0 / 24 de setembro de 2021
|
Repositório | |
Escrito em | Python , Cython , C e C ++ |
Sistema operacional | Linux , macOS , Windows |
Modelo | Biblioteca para aprendizado de máquina |
Licença | Nova Licença BSD |
Local na rede Internet | scikit-learn |
Scikit-learn (anteriormente scikits.learn e também conhecido como sklearn ) é uma biblioteca de aprendizado de máquina de software livre para a linguagem de programação Python . Ele apresenta vários algoritmos de classificação , regressão e clustering , incluindo máquinas de vetor de suporte , florestas aleatórias , aumento de gradiente , k -means e DBSCAN , e é projetado para interoperar com as bibliotecas numéricas e científicas do Python NumPy e SciPy .
Visão geral
O projeto scikit-learn começou como scikits.learn, um projeto Google Summer of Code de David Cournapeau . Seu nome deriva da noção de que é um "SciKit" (SciPy Toolkit), uma extensão de terceiros desenvolvida e distribuída separadamente para o SciPy . A base de código original foi reescrita posteriormente por outros desenvolvedores. Em 2010 Fabian Pedregosa, Gael Varoquaux, Alexandre Gramfort e Vincent Michel, todos do Instituto Francês de Pesquisa em Informática e Automação de Rocquencourt , França , assumiram a liderança do projeto e fizeram o primeiro lançamento público em 1º de fevereiro de 2010. Da vários scikits, scikit-learn e também scikit-image foram descritos como "bem mantidos e populares" em novembro de 2012. Scikit-learn é uma das bibliotecas de aprendizado de máquina mais populares no GitHub .
Implementação
O Scikit-learn é amplamente escrito em Python e usa o NumPy extensivamente para álgebra linear de alto desempenho e operações de array. Além disso, alguns algoritmos principais são escritos em Cython para melhorar o desempenho. As máquinas de vetores de suporte são implementadas por um wrapper Cython em torno do LIBSVM ; regressão logística e máquinas de vetor de suporte linear por um invólucro semelhante em torno de LIBLINEAR . Nesses casos, estender esses métodos com Python pode não ser possível.
Scikit-learn integra-se bem com muitas outras bibliotecas Python, como Matplotlib e plotly para plotagem, NumPy para vetorização de array, dataframes Pandas , SciPy e muitos mais.
Histórico de versão
O Scikit-learn foi inicialmente desenvolvido por David Cournapeau como um projeto de verão do código do Google em 2007. Mais tarde, Matthieu Brucher se juntou ao projeto e começou a usá-lo como parte de seu trabalho de tese. Em 2010 , o INRIA , o Instituto Francês de Pesquisa em Ciência da Computação e Automação , se envolveu e o primeiro lançamento público (v0.1 beta) foi publicado no final de janeiro de 2010.
- Agosto de 2013. scikit-learn 0.14
- Julho de 2014. scikit-learn 0.15.0
- Março de 2015. scikit-learn 0.16.0
- Novembro de 2015. scikit-learn 0.17.0
- Setembro de 2016. scikit-learn 0.18.0
- Julho de 2017. scikit-learn 0.19.0
- Setembro de 2018. scikit-learn 0.20.0
- Maio de 2019. scikit-learn 0.21.0
- Dezembro de 2019. scikit-learn 0.22.0
- Maio de 2020. scikit-learn 0.23.0
- Janeiro de 2021. scikit-learn 0.24
- Setembro de 2021. scikit-learn 1.0