【分类与回归】

作者

猴君

首页»
业界新闻»
新闻资讯»
【分类与回归】

发布时间:2024-08-03 06:13

阅读量:0

分类与回归是机器学习的基本问题。

一、定义

分类是一种监督学习任务，其目标是将数据集中的样本分配到预定义的类别或标签中。在分类问题中，输出变量是离散的，通常表示为类别标签或整数。分类问题可以是二分类（如，判断邮件是否为垃圾邮件），也可以是多分类（如，将图片分类为猫、狗、鸟等）。
回归是另一种监督学习任务，其目标是预测一个或多个连续值。在回归问题中，输出变量是实数值，而不是离散的类别标签。回归问题的目标是找到一个能够最好地拟合数据点（即最小化预测值与实际值之间的差异）的函数。

回归是预测连续值，分类是预测离散值。回归的输出可以是任意值，而分类的输出只能是预设的分类输出的一个，比如(0，1)中的0或1。从理论上讲，如果回归的输入值相近，那么它的预测值也是相近的，而分类的输入相近(在同一个分类决策边界内)，那么它们的预测值是一样的，代表属于同一类别。

二、常见算法

（1）分类算法

逻辑回归：尽管名字中有“回归”，但逻辑回归常用于二分类问题。
决策树：通过构建决策树来分类数据。随机森林：基于多个决策树的集成学习方法。
支持向量机（SVM）：寻找一个超平面来分隔不同类别的数据。
神经网络：特别是深度神经网络，在复杂分类任务中表现出色。

（2）回归算法

线性回归：预测一个或多个自变量（特征）与因变量（目标）之间的线性关系。
多项式回归：是线性回归的扩展，通过增加自变量的多项式项来拟合非线性数据。
岭回归（Ridge Regression）和套索回归（Lasso Regression）：都是线性回归的正则化版本，用于减少过拟合。
决策树回归：基于决策树模型进行回归预测。
随机森林回归：基于多个决策树的集成学习方法，用于回归任务。
神经网络回归：特别是深度神经网络，可以处理复杂的非线性回归问题。