下面是25個(gè)Java機(jī)器學(xué)習(xí)的工具&&庫(kù)列表:
1. Weka 是一個(gè)數(shù)據(jù)挖掘任務(wù)機(jī)器學(xué)習(xí)算法的集合。這些算法可以直接應(yīng)用于數(shù)據(jù)集或者在你自己的Java代碼中調(diào)用。Weka 包含 數(shù)據(jù)預(yù)處理、分類(lèi)、回歸、聚類(lèi)、關(guān)聯(lián)規(guī)則、可視化 等工具。
2. Massive Online Analysis (MOA) 是一個(gè)非常流行的數(shù)據(jù)挖掘方面的開(kāi)源框架,它有一個(gè)非常活躍的社區(qū)。它包括一組機(jī)器學(xué)習(xí)算法(分類(lèi)、回歸、聚類(lèi)、異常檢測(cè)、概念漂移檢測(cè)和推薦系統(tǒng))和評(píng)估工具。同 WEKA 項(xiàng)目一樣,MOA 也是用Java編寫(xiě)的,但卻擴(kuò)展的更高。
3. MEKA 項(xiàng)目提供了多標(biāo)記學(xué)習(xí)和評(píng)價(jià)方法的一個(gè)開(kāi)源實(shí)現(xiàn)。在多標(biāo)記分類(lèi)中,我們要為每個(gè)輸入實(shí)例預(yù)測(cè)多個(gè)輸出變量。這不同于僅涉及單個(gè)目標(biāo)變量的“標(biāo)準(zhǔn)”的情況。 MEKA是基于WEKA機(jī)器學(xué)習(xí)工具包。
4. Advanced Data mining And Machine learning System (ADAMS) 是一種新型的,靈活的工作引擎,旨在快速構(gòu)建和維護(hù)現(xiàn)實(shí)世界,復(fù)雜的知識(shí)流程,基于GPLv3發(fā)布。
5. Environment for Developing KDD-Applications Supported by Index-Structure (ELKI) 是用Java編寫(xiě)的開(kāi)源的(AGPLv3) 數(shù)據(jù)挖掘軟件。ELKI 的重點(diǎn)是研究unsupervised methods in cluster analysis and outlier detection算法。
6. Mallet 是一個(gè)Java文本文檔的機(jī)器學(xué)習(xí)工具包。Mallet 支持最大熵、naive bayes以及決策樹(shù)分類(lèi)算法。
7. Encog 是一種先進(jìn)的機(jī)器學(xué)習(xí)框架,支持 Support Vector Machines,人工神經(jīng)網(wǎng)絡(luò),遺傳編程,貝葉斯網(wǎng)絡(luò),Hidden Markov Models,遺傳編程和遺傳算法。
8. Datumbox 是一個(gè)用Java編寫(xiě)的開(kāi)源機(jī)器學(xué)習(xí)框架,允許快速開(kāi)發(fā)機(jī)器學(xué)習(xí)和統(tǒng)計(jì)應(yīng)用。該框架的主要重點(diǎn)是,包括大量的機(jī)器學(xué)習(xí)算法和統(tǒng)計(jì)測(cè)試,并能夠處理中等規(guī)模的數(shù)據(jù)集。
9. Deeplearning4j 是第一個(gè)使用Java和Scala編寫(xiě)的商業(yè)級(jí)的、開(kāi)源的、分布式深度學(xué)習(xí)庫(kù)。它的目的是在商業(yè)環(huán)境中使用,而不是作為一種研究工具。
10. Mahout 是一個(gè)帶有內(nèi)置算法的機(jī)器學(xué)習(xí)框架,Mahout-Samsara 幫助人們創(chuàng)建自己的數(shù)學(xué),同時(shí)提供一些現(xiàn)成的算法實(shí)現(xiàn)。
11. Rapid Miner 是由德國(guó)的多特蒙德大學(xué)開(kāi)發(fā)的。它為用戶(hù)創(chuàng)建自己的應(yīng)用提供了圖形用戶(hù)界面和Java API。它提供了數(shù)據(jù)處理,可視化和機(jī)器學(xué)習(xí)算法建模。
12. Apache SAMOA 是一個(gè)機(jī)器學(xué)習(xí)框架。包含了一個(gè)分布式流媒體編程抽象ML算法,使開(kāi)發(fā)新的ML算法不用直接處理復(fù)雜的底層分布式流處理引擎(DSPEe, 如 Apache Storm, Apache S4, 和 Apache Samza)。它的用戶(hù)可以一次開(kāi)發(fā)分布式流媒體ML算法,并執(zhí)行多個(gè)DSPEs。
13. Neuroph 通過(guò)提供支持創(chuàng)建、培訓(xùn)并保存神經(jīng)網(wǎng)絡(luò)的Java神經(jīng)網(wǎng)絡(luò)簡(jiǎn)化了神經(jīng)網(wǎng)絡(luò)的發(fā)展。
14. Oryx 2 是一個(gè)建立在Apache Spark 和 Apache Kafka之上,但專(zhuān)業(yè)化的實(shí)時(shí)大規(guī)模機(jī)器學(xué)習(xí)的 lambda 架構(gòu)。它是一個(gè)創(chuàng)建應(yīng)用的框架,但同時(shí)提供了包,以及協(xié)同過(guò)濾、分類(lèi)、回歸和聚類(lèi)的終端到終端的應(yīng)用程序。
15. Stanford Classifier 是一個(gè)機(jī)器學(xué)習(xí)工具,得到數(shù)據(jù)并把它們分成 K 類(lèi)。這個(gè)軟件是一個(gè)Java實(shí)現(xiàn)的最大熵分類(lèi)器。
16. Cortical.io 是一個(gè)快速、精確、像大腦一樣的Retina API 。
17. JSAT 是一個(gè)機(jī)器學(xué)習(xí)快速入門(mén)的庫(kù)。它是我業(yè)余時(shí)間開(kāi)發(fā)的,可以在GPL 3下使用。庫(kù)的一部分是自我教育,因此,所有的代碼是自包含的。JSAT是純Java的,沒(méi)有外部的依賴(lài)。
18. N-Dimensional Arrays for Java (ND4J) 是一個(gè) JVM 的科學(xué)計(jì)算庫(kù)。它們是用來(lái)在生產(chǎn)環(huán)境中使用的,這意味著程序的設(shè)計(jì)是以最小的內(nèi)存需求來(lái)運(yùn)行的。
19. Java Machine Learning Library 是一組機(jī)器學(xué)習(xí)算法的參考實(shí)現(xiàn)。這些算法都是有記錄的,包括源代碼,都記錄在文檔網(wǎng)站。它主要是用Java編寫(xiě)的。
20. Java-ML 是一個(gè)Java API,是一個(gè)Java實(shí)現(xiàn)的機(jī)器學(xué)習(xí)算法的集合。它只提供了一個(gè)標(biāo)準(zhǔn)的算法接口。
21. MLlib (Spark) 是一個(gè) Apache Spark 擴(kuò)展的機(jī)器學(xué)習(xí)庫(kù)。雖然是Java,但該庫(kù)提供Java, Scala 以及 Python 綁定。庫(kù)是新的,并且算法的列表很長(zhǎng)。
22. H2O 是一個(gè)智能應(yīng)用的機(jī)器學(xué)習(xí) API。它擴(kuò)展了統(tǒng)計(jì)、機(jī)器學(xué)習(xí)以及大數(shù)據(jù)的運(yùn)算。H2O 是可擴(kuò)展的。
23. WalnutiQ 是一個(gè)理論上與部分人腦有共同學(xué)習(xí)算法的面向?qū)ο蟮哪P停üぷ髂繕?biāo)是一個(gè)簡(jiǎn)單的帶有情感的人工智能模型)。
24. RankLib 是一個(gè)排序?qū)W習(xí)算法庫(kù)。目前已經(jīng)實(shí)現(xiàn)了八種流行的算法。
25. htm.java (Hierarchical Temporal Memory implementation in Java) 是智能學(xué)習(xí)平臺(tái) Numenta 的一個(gè)Java端口。
via:demnag,本文由 Specs 翻譯整理,發(fā)布在 Coder資源網(wǎng),轉(zhuǎn)載請(qǐng)注明來(lái)源。
哈爾濱品用軟件有限公司致力于為哈爾濱的中小企業(yè)制作大氣、美觀的優(yōu)秀網(wǎng)站,并且能夠搭建符合百度排名規(guī)范的網(wǎng)站基底,使您的網(wǎng)站無(wú)需額外費(fèi)用,即可穩(wěn)步提升排名至首頁(yè)。歡迎體驗(yàn)最佳的哈爾濱網(wǎng)站建設(shè)。
