""" Iris数据集,也成为“鸢尾花卉数据集”,是一类多重变量分析、并常用于分类实验的数据集,由Fisher于1936年收集整理。 Iris数据集包含了150行数据,包括3种鸢尾花种类(山鸢尾、虹膜锦葵、变色鸢尾)各50各样品。 鸢尾花数据集包含4个特征和1个目标值。这4个特征确定了单株鸢尾花的下列植物学特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度 20221113 byp """ import seaborn as sns import matplotlib.pyplot as plt import pandas as pd from sklearn.datasets import load_iris plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文 plt.rcParams['axes.unicode_minus'] = False # 正常显示负号 iris = load_iris() # 把数据转换成dataframe的格式 # iris_d = pd.DataFrame(iris['data'], columns=['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width']) iris_d = pd.DataFrame(iris['data'], columns=['花萼长度', '花萼宽度', '花瓣长度', '花瓣宽度']) # iris_d['Species'] = iris.target iris_d['种类'] = iris.target def iris_datasets(): print("鸢尾花数据集的返回集:\n", iris) print("鸢尾花的特征值:\n", iris["data"]) print("数据集为:\n", iris.data.shape) print("鸢尾花的目标值:\n", iris.target) print("鸢尾花特征的名字:\n", iris.feature_names) print("鸢尾花目标值的名字:\n", iris.target_names) print("鸢尾花的描述:\n", iris.DESCR) def plot_iris(iris, col1, col2): # 创建空白画布 plt.figure(figsize=(6, 8), facecolor="white") # facecolor设置画布的颜色 # 背景颜色 plt.rcParams["axes.facecolor"] = "white" # s设置坐标轴颜色 # sns.lmplot(x=col1, y=col2, data=iris, hue="Species", fit_reg=False) sns.lmplot(x=col1, y=col2, data=iris, hue="种类", fit_reg=False) plt.xlabel(col1) plt.ylabel(col2) # plt.title('鸢尾花种类分布图') plt.title("鸢尾花种类分布图", x=0.5, y=1, fontsize=10, pad=1) # x:标题相对于绘制的图形横轴的位置, 0则表示最左边,1则表示靠最右边; # y:标题相对于绘制的图形纵轴的位置, 0则表示最下边,1则表示靠最上边; # plt.subplots_adjust(top=0) plt.savefig('Iris.png', dpi=300) """ savefig(fname, dpi=None, facecolor='w', edgecolor='w', orientation='portrait', papertype=None, format=None, transparent=False, bbox_inches=None, pad_inches=0.1, frameon=None, metadata=None)""" plt.show() if __name__ == '__main__': iris_datasets() # plot_iris(iris_d, 'Petal_Width', 'Sepal_Length') plot_iris(iris_d, '花瓣宽度', '花萼长度')