女排世界杯_1966世界杯 - ezrjnk120.com

数据挖掘 - 基于规则的分类

2025-05-27 05:21:00

上一节: 数据挖掘 - 贝叶斯分类

上一节

下一节: 数据挖掘 - 杂项分类方法

下一节

数据挖掘 - 基于规则的分类

IF-THEN 规则

基于规则的分类器使用一组 IF-THEN 规则进行分类。我们可以从以下表达规则 -

IF 条件 THEN 结论

让我们考虑一个规则 R1,

R1: IF age = youth AND student = yes

THEN buy_computer = yes

要记住的要点 −

规则的 IF 部分称为先行规则或者precondition.

规则的 THEN 部分称为规则结果.

条件的先行部分由一个或多个属性测试组成,并且这些测试是逻辑与的。

后续部分包括类别预测。

Note- 我们也可以将规则 R1 编写如下 -

R1: (age = youth) ^ (student = yes))(buys computer = yes)

如果条件对给定的元组成立,则满足前件。

规则提取

在这里,我们将学习如何通过从决策树中提取 IF-THEN 规则来构建基于规则的分类器。

Points to remember −

从决策树中提取规则 -

为从根到叶节点的每条路径创建一个规则。

为了形成一个规则前件,每个分割标准都是逻辑与的。

叶节点保存类预测,形成规则结果。

使用顺序覆盖算法的规则归纳

顺序覆盖算法可用于从训练数据中提取 IF-THEN 规则。我们不需要先生成决策树。在这个算法中,给定类的每个规则都覆盖了该类的许多元组。

一些顺序覆盖算法是 AQ、CN2 和 RIPPER。根据一般策略,一次学习一个规则。每次学习规则时,都会删除该规则所覆盖的元组,然后继续处理其余的元组。这是因为决策树中每个叶子的路径都对应一个规则。

Note− 决策树归纳可以被认为是同时学习一组规则。

以下是顺序学习算法,其中一次学习一个类的规则。当从 Ci 类学习规则时,我们希望该规则仅覆盖 C 类的所有元组,而没有任何其他类的元组。

Algorithm: Sequential Covering

Input:

D, a data set class-labeled tuples,

Att_vals, the set of all attributes and their possible values.

Output: A Set of IF-THEN rules.

Method:

Rule_set={ }; // initial set of rules learned is empty

for each class c do

repeat

Rule = Learn_One_Rule(D, Att_valls, c);

remove tuples covered by Rule form D;

until termination condition;

Rule_set=Rule_set+Rule; // add a new rule to rule-set

end for

return Rule_Set;

规则修剪

该规则被修剪是由于以下原因 -

质量评估是在原始训练数据集上进行的。该规则可能在训练数据上表现良好,但在后续数据上表现不佳。这就是为什么需要规则修剪的原因。

通过删除连接来修剪规则。如果 R 的修剪版本的质量高于在独立元组集上评估的质量,则规则 R 被修剪。

FOIL是一种简单有效的规则剪枝方法。对于给定的规则 R,

FOIL_Prune = pos - neg / pos + neg

其中 pos 和 neg 分别是 R 覆盖的正元组的数量。

Note− 该值将随着修剪集上 R 的准确度而增加。因此,如果 R 的修剪版本的 FOIL_Prune 值更高,则我们修剪 R。

上一节: 数据挖掘 - 贝叶斯分类

上一节

下一节: 数据挖掘 - 杂项分类方法

下一节

查看笔记 分享笔记

笔记内容:

称呼:

Email:

站点:

分享笔记 重置

分类导航

前端

Ajax 教程

Angular 教程

Aurelia 教程

Bootstrap 教程

ChartJS 教程

CSS 教程

ES6 教程

FontAwesome 教程

HTML 教程

HTML 字符集 教程

HTML 游戏 教程

JavaScript 教程

jQuery 教程

Less 教程

React 教程

Sass 教程

Stylus 教程

TypeScript 教程

Unity 教程

Vue.js 教程

WebAssembly 教程

XAML 教程

颜色 教程

服务端

C# 教程

C++ 教程

COBOL 教程

C语言 教程

Fortran 教程

Go 教程

Groovy 教程

Java 教程

JSP 教程

JVM 教程

Kotlin 教程

Lisp 教程

Lua 教程

Node.js 教程

Pascal 教程

Perl 教程

PHP 教程

Python 教程

Python 3 教程

Ruby 教程

Rust 教程

Scala 教程

Spring 教程

Spring Boot 教程

Spring Cloud 教程

VB.Net 教程

移动端

Android 教程

IOS 教程

Objective-C 教程

React Native 教程

Swift 教程

小程序 教程

数据库

Access 教程

DB2 教程

Mariadb 教程

Memcached 教程

MongoDB 教程

MySQL 教程

Neo4j 教程

PL/SQL 教程

PostgreSQL 教程

Redis 教程

SQL 教程

SQL Server 教程

SQLite 教程

T-SQL 教程

数据格式

Jackson 教程

JSON 教程

SVG 教程

XML 教程

开发工具

ActiveMQ 教程

Ant 教程

Apache HttpClient 教程

Apache POI PPT 教程

AWS 教程

Docker 教程

ElasticSearch 教程

ExpressJS 教程

GIT 教程

GitLab 教程

Google Maps 教程

Gradle 教程

Java NIO 教程

JavaFX 教程

JavaMail 教程

JDBC 教程

jMeter 教程

JPA 教程

jsoup 教程

Junit 教程

KoaJS 教程

Kubernetes 教程

Log4j 教程

Logstash 教程

Lucene 教程

Makefile 教程

Maven 教程

RESTful 教程

Sed 教程

SEO 教程

Servlet 教程

SLF4J 教程

Socket.IO 教程

Struts 教程

SVN 教程

TestNG 教程

UML 教程

UNIX / LINUX 教程

WebSocket 教程

WPF 教程

xStream 教程

区块链 教程

数据处理

Flink 教程

Flume 教程

Hadoop 教程

Hbase 教程

Hive 教程

Kafka 教程

Kibana 教程

MapReduce 教程

MATLAB 教程

MyBatis 教程

Pig 教程

R语言 教程

Solr 教程

Spark 教程

Storm 教程

Zookeeper 教程

大数据分析 教程

数据仓库 教程

数据挖掘 教程

计算机基础

HTTP 教程

IPv4 教程

IPv6 教程

Ubantu 教程

WebServices 教程

嵌入式系统 教程

操作系统 教程

数据结构和算法 教程

汇编语言 教程

物联网 教程

电子电路基础 教程

编译器设计 教程

网站开发 教程

计算机 教程

计算机基础 教程

计算机网络 教程

设计模式 教程

AI

CNTK 教程

Keras 教程

PyTorch 教程

TensorFlow 教程

人工智能 教程

机器学习 教程

Python 技术

Django 教程

Flask 教程

NumPy 教程

Pandas 教程

Pillow 教程

PyGTK 教程

PyQt5 教程

PySpark 教程

pytest 教程

Python -数据科学 教程

Python MySQL 教程

Python 取证 教程

Python 数据结构 教程

Python 文本处理 教程

Python 网络编程 教程

Python 网页抓取 教程

Python 设计模式 教程

RxPY 教程

SciPy 教程

Seaborn 教程

SymPy 教程

wxPython 教程

框架

Laravel 教程

Web 图标Icon 教程

Web2py 教程

WebGL 教程

WebRTC 教程

WordPress 教程

Yii 教程

Zend Framework 教程

SAP

Crystal Reports 教程