数据挖掘weka实验报告(weka数据挖掘平台实验报告)

我在做文本数据挖掘,要用到聚类分析,想请问matlab、weka这两款软件哪...

1、如果单指软件本身,显然是weka,至少有这方面的功能模块。matlab本身是数值计算软件,根本没有这类功能。另外这两个软件都可以添加功能库,相对来说weka可加的库只能是java的,步骤也麻烦。matlab的添加工具箱之类很简单,引用也方便,但估计做这方面研究的很少拿matlab做,应该很难找相关资源。

2、你熟悉python 就用 python,你熟悉java 就学weka, weka 一个软件连续开发20多年,及其成熟而且做到极致,很多都已经能自动化,其扩展版本甚至算法都能自己选择,极致到完全不懂的人都可以用。weka有损自以为高深的人的威严和神秘感。

3、Tanagra:使用图形界面的数据挖掘软件,采用了类似Windows资源管理器中的树状结构来组织分析组件。Tanagra缺乏高级的可视化能力,但它的强项是统计分析,提供了众多的有参和无参检验方法。Weka:可能是名气最大的开源机器学习和数据挖掘软件。高级用户可以通过Java编程和命令行来调用其分析组件。

4、数据挖掘工作现在很多都是写脚本代码进行的,像r,python,工具的话商用就是IBM的SPSS Modeler,就是以前的Clementine, 还有SAS,matlab,这些都是超贵的,excel也有数据挖掘插件。开源的也很多,像RapidMiner,Knime,Weka,Orange这些都是知名的开源数据挖掘工具。

weka是什么意思

1、weka的意思是秧鸡;怀卡托智能分析环境;分析环境;数据挖掘工具;维卡。网络释义:秧鸡 新西兰是罕见鸟类的天堂。最著名的是不会飞的奇异鸟,新西兰的非正式国家标志。其它不会飞的鸟还有威卡秧鸡(weka)及濒临灭绝的kakapo鹦鹉。怀卡托智能分析环境 分类实验是在怀卡托智能分析环境(WEKA)中完成的。

2、就是指互联网、电信、政府等行业领域前端业务人员;或者是从事市场、咨询、BI、管理、财务、数据分析等职位业务人员;也可能是一些非统计、计算机专业背景零基础入行和转行就业人员。CDA Level II:大数据分析师 有着一年以上数据分析岗位工作经验,或者是通过CDA Level Ⅰ认证。

3、通常weka的数据集的最后一列表示类别,当点击类时(图上左侧class),右侧为两个柱子,分别为蓝红色,表示有两个类别,设蓝色表示类别1,红色表示类别2。

用weka进行数据挖掘,其中使用到了Id3和J48,为什么结果会很不一样...

不同算法的结果当然会不一样 J48是简单算法,按照树枝分类法来分析数据。

weka 对数据进行操作的时候没有要求必须使用arff文件类型的,可以选择,一般都是将表格数据转换为.csv格式的数据进行导入。

weka的ID3算法是会输出一个决策树的,只不过那只是中间计算时输出的结果。同时还会输出很多其他的统计结果。要看看它有没有报错。 数据集的属性是不是都是离散型的。如果有些是实数型,如11,12,735,1..这样就不符合要求,无法生成合理的决策树。

可以考虑离散的粒度,以及离散的分界点是否合适?另外,不同的算法对不同类别的数据效果不同,尝试用其他算法汝J4NB、SVM等试一试。