第2章.zip
大小:12.38KB
价格:10积分
下载量:0
评分:
5.0
上传者:m0_72507459
更新日期:2025-09-22

数据挖掘第二章代码啦啦啦

资源文件列表(大概)

文件名
大小
第2章/代码2-1.py
183B
第2章/代码2-10.py
433B
第2章/代码2-11.py
329B
第2章/代码2-12.py
615B
第2章/代码2-13.py
662B
第2章/代码2-14.py
724B
第2章/代码2-15.py
859B
第2章/代码2-16.py
488B
第2章/代码2-17.py
879B
第2章/代码2-18.py
516B
第2章/代码2-19.py
551B
第2章/代码2-2.py
446B
第2章/代码2-20.py
464B
第2章/代码2-21.py
637B
第2章/代码2-22.py
1.14KB
第2章/代码2-23.py
735B
第2章/代码2-24.py
631B
第2章/代码2-25.py
776B
第2章/代码2-26.py
1.15KB
第2章/代码2-3.py
208B
第2章/代码2-4.py
365B
第2章/代码2-5.py
519B
第2章/代码2-6.py
378B
第2章/代码2-7.py
244B
第2章/代码2-8.py
249B
第2章/代码2-9.py
471B

资源内容介绍

数据挖掘第二章代码啦啦啦
# -*- coding: utf-8 -*-"""Created on Wed Mar 8 13:09:56 2023@author: 数据挖掘课程组"""from sklearn import datasetsfrom sklearn import preprocessingfrom sklearn import tree#步骤1: 加载数据集iris = datasets.load_iris()n_samples, n_features = iris.data.shapeX = iris.dataY = iris.targetprint('步骤1:加载iris数据集')print('iris数据集中有%d个样本,%d个特征。' % (n_samples, n_features))print('iris的前5个样本为:\n', X[0:5])#步骤2: 数据预处理min_max_scaler = preprocessing.MinMaxScaler()X_scale = min_max_scaler.fit_transform(X)print('步骤2:数据预处理')print('规范化后iris的前5个样本:\n', X_scale[0:5])#步骤3: 使用决策树算法构建分类器模型classifier = tree.DecisionTreeClassifier()classifier = classifier.fit(X, Y) #在训练集上训练Y_predict = classifier.predict(X) #使用训练好的模型进行预测print('步骤3:决策树模型构建…')#步骤4:模型的评估accuracy = (Y == Y_predict).sum() / Y.shape[0]print('步骤4:模型评估')print("决策树在训练集上的分类准确度为: %.3f" % (accuracy*100))

用户评论 (0)

发表评论

captcha

相关资源

LanhuProject0904.zip

LanhuProject0904.zip

474.5KB39积分

AT32模板工程创建及注意要点

这篇文章的目的是为了了解AT32工程模板的创建,方便后期调用。其模板工程包含默认的UART1串口作为printf输出,工程文件参考雅特力官方提供的library。链接: 固件库,雅特力提供的文档还是很详细的,而且有中文数据手册;

5.59MB50积分

R语言 多个基因集合取交集

R语言 多个基因集合取交集,可以在多个基因集合中找到之间的交集

32.72MB12积分

git分布式版本控制系统安装包

Git 是一个分布式版本控制系统,用于跟踪计算机文件的变更历史,并支持多个开发者协同工作。它由 Linus Torvalds 在2005年创建,主要用于Linux内核的开发,但因其灵活性和强大的功能迅速成为了众多软件项目首选的版本控制工具。Git 的设计目标是速度、数据完整性以及支持非线性开发模式(即分支和合并)。以下是 Git 的一些核心特点:分布式架构 - 每个开发者的 Git 仓库都有完整的项目历史记录,这意味着即使没有网络连接,也可以提交更改。快速性能 - Git 使用快照方式存储数据,而不是记录每次文件变化差异,这种方式使得 Git 非常快速和高效。数据完整性 - Git 使用 SHA-1 散列算法对每个文件版本进行校验,确保数据的一致性和安全性。灵活的分支管理 - 开发者可以轻松创建和切换分支,这极大地促进了特征开发和代码集成。非线性开发 - 支持复杂的合并和分支工作流,便于处理大型项目和团队合作。

64.61MB10积分