必威体育Betway必威体育官网
当前位置:首页 > IT技术

鸢尾花分类

时间:2019-09-28 22:43:28来源:IT技术作者:seo实验室小编阅读:77次「手机版」
 

鸢尾花

鸢尾花分类

以前的机器学习之路是三天打鱼两天晒网的,导致现在学的不深入,今天重新开始学习

初识数据

鸢尾花数据是机器学习和统计学中经典的数据集,包含在scikir-learn的datasets中,使用load_iris函数加载数据

from sklearn.datasets import load_iris
iris_dataset=load_iris()
print("Keys of iris_dataset: \n{}".format(iris_dataset.keys()))

其中 load_iris返回iris对象的一个Bunch对象,里面包含有键和值,与字典非常相似

在这里插入图片描述

其中target_names键对应的值是一个字符串数据,里面包含所要预测的花的品种

print("Target names: {}".format(iris_dataset['target_names']))

在这里插入图片描述

数据包含在target和data字符你,其中data包含花萼长度与宽度,花瓣长度与宽度测量数据,其中data数据的每一行对应一朵花

iris_dataset['data'].shape

在这里插入图片描述通过shape函数得出总共有150朵不同的花的测量数据。

查看前五个样本的特称数值

iris_dataset['data'][:5]

在这里插入图片描述讲品种转化为从0-2的整数

print("Target: \n{}".format(iris_dataset['target']))

在这里插入图片描述这样做的目的是为了得出的预测结果方便转化为花的种类

接下来使用skikit-learn中的train_test_split函数将数据集打乱并拆分这个函数将75%的行数据及对应标签作为训练集,将剩下的25%的数据作为测试集

对数据调用train_test_split

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(iris_dataset['data'],iris_dataset['target'],random_state=0)

查看训练集和测试集

print("X_train shape: {}".format(X_train.shape))
print("y_train shape: {}".format(y_train.shape))

在这里插入图片描述

构建K近邻分类算法

k近邻算分类算法在neigbors模块的KNeighborsClassifier类中实现,在这里需要将这个类实例化为一个对象,然后才能使用这个模型

from sklearn.neighbors import KNeighborsClassifier
knn=KNeighborsClassifier(n_neighbors=1)

接下来调用knn对象的fit方法,输入参数分本别为X_train,y_train

knn.fit(X_train,y_train)

在这里插入图片描述

做出预测

现在可以用这个模型对新数据进行预测了,假设新的鸢尾花花萼长度和宽度为5cm和2.9cm,花瓣长和宽为1cm和0.2cm,将数据存放在一个numpy数组

import numpy as np
X_new=np.array([[5,2.9,1,0.2]])

将这朵花的测量数据转化为二维的numpy数组中的一行,因为scikit-learn的输入数据必须是二维数组

接下来调用knn对象的predict方法进行预测

prediction=knn.predict(X_new)
print("Preiction: {}".format(prediction))
print("Predicted target name : {}".format(iris_dataset['target_names'][prediction]))

在这里插入图片描述

根据模型预测,这朵花属于setosa品种。但是这个模型是否准确可靠我们并不清楚

评估模型

通过对测试数据中的每朵鸢尾花进行预测,并将预测结果与标签进行对比,通过计算精度(品种预测正确的花所占的比例)来衡量模型的好坏

y_pred=knn.predict(X_test)
print(np.mean(y_pred==y_test))

在这里插入图片描述

对于这个模型来说,测试集的精确度约为0.97,即有97%的准确率,模型足够可信,之前的预测结果也就相当可靠 了

相关阅读

亚马逊分类目录提交网站教程 提升网站权重

亚马逊分类目录是国际高权重的分类目录网站,全人工编辑的专业分类目录网站,收录国内外,各行业优秀网站。所以我们在亚马逊分类目录

Excel中表格数据进行分类汇总的操作方法

Excel作为公司的出具处理工具,一定离不开分类汇总。我们又该如何对数据进行分类汇总呢。今天,seo实验室小编就教大家在Excel中进行

深度学习中Attention Mechanism详细介绍:原理、分类及

Attention是一种用于提升基于RNN(LSTM或GRU)的Encoder + Decoder模型的效果的的机制(Mechanism),一般称为Attention Mechanism。Attent

分类目录与搜索引擎的关系

在搜索引擎未成熟之时,网址导航对我们在互联网上冲浪有着非常重要的作用。那么什么是网站导航,什么又是分类目录,什么又是搜索引擎呢

小米平板4照片怎么设置智能分类?

小米平板4中的图片很多,查找起来很不方便,想要开启照片智能分类呢?下面我们就来看看详细的教程。1、首先我们打开小米平板四,然后找到

分享到:

栏目导航

推荐阅读

热门阅读