华人澳洲中文论坛

热图推荐

    smile——Java机器学习引擎

    [复制链接]

    2022-9-1 09:28:53 24 0

    引见
    Smile(统计机器智能和学习引擎)是一个基于Java和Scala的疾速、片面的机器学习、NLP、线性代数、图形、插值和可视化零碎。
    凭借先进的数据构造和算法,Smile提供了最早进的机能。Smile有很好的文档记载,请查看名目网站以获得编程指南和更多信息。
    Smile涵盖了机器学习的方方面面,包罗分类、回归、聚类、关联规定挖掘、特点选择、流形学习、多维缩放、遗传算法、缺失值插补、高效比来邻搜寻等。
    Smile完成了下列次要的机器学习算法:
    分类:反对向量机、决策树、AdaBoost、梯度晋升、随机森林、逻辑回归、神经网络、RBF网络、最大熵分类器、KNN、朴素贝叶斯、Fisher/线性/二次/正则判断剖析。回归:反对向量回归、高斯进程、回归树、梯度晋升、随机森林、RBF网络、OLS、套索、弹性网络、岭回归。特点选择:基于遗传算法的特点选择,基于集成学习的特点选择、树形图、信噪比战争方比。聚类:BIRCH、CLARANS、DBSCAN、DENCLUE、肯定性退火、K-均值、X-均值、G-均值、神经气体、成长神经气体、档次聚类、程序信息瓶颈、自组织映照、光谱聚类、最小熵聚类。关联规定和频繁项集挖掘:FP增长挖掘算法。流形学习:IsoMap、LLE、拉普拉斯特点映照、t-SNE、UMAP、PCA、核PCA、几率PCA、GHA、随机投影、ICA。多维标度:经典MDS、等渗MDS和Sa妹妹on映照。比来邻搜寻:BK树、掩盖树、KD树、SimHash、LSH。序列学习:隐马尔可夫模型,前提随机场。天然言语处置:分句器和标志器、双元统计测试、短语提取器、症结词提取器、词干剖析器、词性标注、相干性排序使用(Java等集成)maven引入
    com.github.haifengl smile-core 2.6.0 Shell使用模型序列化
    大少数模型反对Java可序列化接口(一切分类器都反对可序列化接口),因此您能够在Spark中使用它们。
    关于在非Java代码中读/写模型,咱们倡议使用 XStream 以串行化训练的模型。XStream是一个简略的库,用于将对象序列化为XML并再次第列化。XStream易于使用,不需求映照(实际上不需求修正对象)。Protostuff是一个很好的代替计划,它反对向前向后兼容性(模式演变)和验证。除了XML以外,Protostuff还反对许多其余格局,如JSON、YAML、protobuf等。
    可视化
    Smile提供了一个基于Swing的数据可视化库SmilePlot,它提供散点图、线图、阶梯图、条形图、方框图、直方图、3D直方图、树状图、热图、hexmap、QQ图、等高线图、曲面和线框。
    需求引入库
    com.github.haifengl smile-plot 2.6.0
    Smile还反对声明形式的数据可视化。使用mile.plot.vega软件包,咱们能够创立一个标准,将可视化形容为从数据到图形标志(如点或条)属性的映照。
    该标准基于Vega-Lite。Vega-Lite编译器自动生成可视化组件,包罗轴、图例和比例。而后,它按照一组精心设计的规定肯定这些组件的属性。
    示例


    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题25

    帖子35

    积分165

    图文推荐