上一节: 数据挖掘 - 贝叶斯分类
上一节
下一节: 数据挖掘 - 杂项分类方法
下一节
数据挖掘 - 基于规则的分类
IF-THEN 规则
基于规则的分类器使用一组 IF-THEN 规则进行分类。我们可以从以下表达规则 -
IF 条件 THEN 结论
让我们考虑一个规则 R1,
R1: IF age = youth AND student = yes
THEN buy_computer = yes
要记住的要点 −
规则的 IF 部分称为先行规则或者precondition.
规则的 THEN 部分称为规则结果.
条件的先行部分由一个或多个属性测试组成,并且这些测试是逻辑与的。
后续部分包括类别预测。
Note- 我们也可以将规则 R1 编写如下 -
R1: (age = youth) ^ (student = yes))(buys computer = yes)
如果条件对给定的元组成立,则满足前件。
规则提取
在这里,我们将学习如何通过从决策树中提取 IF-THEN 规则来构建基于规则的分类器。
Points to remember −
从决策树中提取规则 -
为从根到叶节点的每条路径创建一个规则。
为了形成一个规则前件,每个分割标准都是逻辑与的。
叶节点保存类预测,形成规则结果。
使用顺序覆盖算法的规则归纳
顺序覆盖算法可用于从训练数据中提取 IF-THEN 规则。我们不需要先生成决策树。在这个算法中,给定类的每个规则都覆盖了该类的许多元组。
一些顺序覆盖算法是 AQ、CN2 和 RIPPER。根据一般策略,一次学习一个规则。每次学习规则时,都会删除该规则所覆盖的元组,然后继续处理其余的元组。这是因为决策树中每个叶子的路径都对应一个规则。
Note− 决策树归纳可以被认为是同时学习一组规则。
以下是顺序学习算法,其中一次学习一个类的规则。当从 Ci 类学习规则时,我们希望该规则仅覆盖 C 类的所有元组,而没有任何其他类的元组。
Algorithm: Sequential Covering
Input:
D, a data set class-labeled tuples,
Att_vals, the set of all attributes and their possible values.
Output: A Set of IF-THEN rules.
Method:
Rule_set={ }; // initial set of rules learned is empty
for each class c do
repeat
Rule = Learn_One_Rule(D, Att_valls, c);
remove tuples covered by Rule form D;
until termination condition;
Rule_set=Rule_set+Rule; // add a new rule to rule-set
end for
return Rule_Set;
规则修剪
该规则被修剪是由于以下原因 -
质量评估是在原始训练数据集上进行的。该规则可能在训练数据上表现良好,但在后续数据上表现不佳。这就是为什么需要规则修剪的原因。
通过删除连接来修剪规则。如果 R 的修剪版本的质量高于在独立元组集上评估的质量,则规则 R 被修剪。
FOIL是一种简单有效的规则剪枝方法。对于给定的规则 R,
FOIL_Prune = pos - neg / pos + neg
其中 pos 和 neg 分别是 R 覆盖的正元组的数量。
Note− 该值将随着修剪集上 R 的准确度而增加。因此,如果 R 的修剪版本的 FOIL_Prune 值更高,则我们修剪 R。
上一节: 数据挖掘 - 贝叶斯分类
上一节
下一节: 数据挖掘 - 杂项分类方法
下一节
查看笔记 分享笔记
笔记内容:
称呼:
Email:
站点:
分享笔记 重置
分类导航
前端
Ajax 教程
Angular 教程
Aurelia 教程
Bootstrap 教程
ChartJS 教程
CSS 教程
ES6 教程
FontAwesome 教程
HTML 教程
HTML 字符集 教程
HTML 游戏 教程
JavaScript 教程
jQuery 教程
Less 教程
React 教程
Sass 教程
Stylus 教程
TypeScript 教程
Unity 教程
Vue.js 教程
WebAssembly 教程
XAML 教程
颜色 教程
服务端
C# 教程
C++ 教程
COBOL 教程
C语言 教程
Fortran 教程
Go 教程
Groovy 教程
Java 教程
JSP 教程
JVM 教程
Kotlin 教程
Lisp 教程
Lua 教程
Node.js 教程
Pascal 教程
Perl 教程
PHP 教程
Python 教程
Python 3 教程
Ruby 教程
Rust 教程
Scala 教程
Spring 教程
Spring Boot 教程
Spring Cloud 教程
VB.Net 教程
移动端
Android 教程
IOS 教程
Objective-C 教程
React Native 教程
Swift 教程
小程序 教程
数据库
Access 教程
DB2 教程
Mariadb 教程
Memcached 教程
MongoDB 教程
MySQL 教程
Neo4j 教程
PL/SQL 教程
PostgreSQL 教程
Redis 教程
SQL 教程
SQL Server 教程
SQLite 教程
T-SQL 教程
数据格式
Jackson 教程
JSON 教程
SVG 教程
XML 教程
开发工具
ActiveMQ 教程
Ant 教程
Apache HttpClient 教程
Apache POI PPT 教程
AWS 教程
Docker 教程
ElasticSearch 教程
ExpressJS 教程
GIT 教程
GitLab 教程
Google Maps 教程
Gradle 教程
Java NIO 教程
JavaFX 教程
JavaMail 教程
JDBC 教程
jMeter 教程
JPA 教程
jsoup 教程
Junit 教程
KoaJS 教程
Kubernetes 教程
Log4j 教程
Logstash 教程
Lucene 教程
Makefile 教程
Maven 教程
RESTful 教程
Sed 教程
SEO 教程
Servlet 教程
SLF4J 教程
Socket.IO 教程
Struts 教程
SVN 教程
TestNG 教程
UML 教程
UNIX / LINUX 教程
WebSocket 教程
WPF 教程
xStream 教程
区块链 教程
数据处理
Flink 教程
Flume 教程
Hadoop 教程
Hbase 教程
Hive 教程
Kafka 教程
Kibana 教程
MapReduce 教程
MATLAB 教程
MyBatis 教程
Pig 教程
R语言 教程
Solr 教程
Spark 教程
Storm 教程
Zookeeper 教程
大数据分析 教程
数据仓库 教程
数据挖掘 教程
计算机基础
HTTP 教程
IPv4 教程
IPv6 教程
Ubantu 教程
WebServices 教程
嵌入式系统 教程
操作系统 教程
数据结构和算法 教程
汇编语言 教程
物联网 教程
电子电路基础 教程
编译器设计 教程
网站开发 教程
计算机 教程
计算机基础 教程
计算机网络 教程
设计模式 教程
AI
CNTK 教程
Keras 教程
PyTorch 教程
TensorFlow 教程
人工智能 教程
机器学习 教程
Python 技术
Django 教程
Flask 教程
NumPy 教程
Pandas 教程
Pillow 教程
PyGTK 教程
PyQt5 教程
PySpark 教程
pytest 教程
Python -数据科学 教程
Python MySQL 教程
Python 取证 教程
Python 数据结构 教程
Python 文本处理 教程
Python 网络编程 教程
Python 网页抓取 教程
Python 设计模式 教程
RxPY 教程
SciPy 教程
Seaborn 教程
SymPy 教程
wxPython 教程
框架
Laravel 教程
Web 图标Icon 教程
Web2py 教程
WebGL 教程
WebRTC 教程
WordPress 教程
Yii 教程
Zend Framework 教程
SAP
Crystal Reports 教程