@Team
2018-06-16T20:37:36.000000Z
字数 2020
阅读 2928
李中梁
数据集一: Wine Data Set
数据集介绍:包括了三种酒中13种不同成分的数量。13种成分为:Alcohol,Malicacid,Ash,等。在 “wine.data”文件中,每行代表一种酒的样本,共有178个样本;一共有14列,其中,第一列为类标志属性,共有三类,分别记为“1”,“2”,“3”;后面的13列为每个样本的对应属性的样本值。其中第1类有59个样本,第2类有71个样本,第3类有48个样本。
例子:用朴素贝叶斯对wine数据集分类
数据集二:mnist
数据集介绍:大名鼎鼎的手写数字识别,不多介绍。注意一点,原始数据太麻烦了,可以选择kaggle提供的已处理好的数据。
例子:用Python实现朴素贝叶斯分类器(MNIST数据集)
数据集三:mnist
K-Means算法:
- 数据集一:Iris
- 数据集介绍:安德森鸢尾花卉数据集,包含150个样本,每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度4个特征,可以通过样本的4个特征来判断样本属于山鸢尾、变色鸢尾还是维吉尼亚鸢尾
- 例子:python中使用k-means对鸢尾花数据集聚类
密度聚类算法之 DBSCAN:
k-means不能识别球形类数据,但是DBSCAN可以
层次聚类算法之 AGNES:
- 数据集一:Iris
- 数据集介绍:安德森鸢尾花卉数据集,包含150个样本,每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度4个特征,可以通过样本的4个特征来判断样本属于山鸢尾、变色鸢尾还是维吉尼亚鸢尾
- 例子:鸢尾花三种聚类算法(K-means,AGNES,DBScan)的python实现
现在深度学习火热,似乎什么任务(特别是图像、文本和语音数据)都可以上神经网络模型,并且可以取得不错的效果。
数据集一:mnist
数据集介绍:大名鼎鼎的手写数字识别,不多介绍。注意一点,原始数据太麻烦了,可以选择kaggle提供的已处理好的数据。
例子: 使用scikit-learn只提供多层感知机模型,建议使用keras教学,用pip install
命令安装即可使用
数据集二:猫狗大战(图像二分类任务)