在人工智能和机器学习方面,监督学习和无监督学习的区别是什么? 你能举个例子简单地解释一下吗?


当前回答

我一直认为无监督学习和有监督学习之间的区别是随意的,有点令人困惑。这两种情况之间没有真正的区别,相反,在一系列情况下,算法可以或多或少地“监督”。半监督学习的存在是界限模糊的一个明显例子。

我倾向于认为监督是对算法提供关于应该首选哪些解决方案的反馈。对于传统的监督设置,比如垃圾邮件检测,你告诉算法“不要在训练集上犯任何错误”;对于传统的无监督设置,比如聚类,你告诉算法“彼此接近的点应该在同一个聚类中”。很巧的是,第一种反馈形式比后者更具体。

简而言之,当有人说“有监督”时,想想分类,当他们说“无监督”时,想想聚类,尽量不要过于担心除此之外的问题。

其他回答

监督式学习

监督学习是我们知道原始输入的输出,即数据被标记,以便在机器学习模型的训练期间,它将了解它需要在给定的输出中检测什么,并且它将指导系统在训练期间检测预先标记的对象,在此基础上,它将检测我们在训练中提供的类似对象。

在这里,算法将知道数据的结构和模式。监督学习用于分类

例如,我们可以有一个不同的物体,其形状是正方形,圆形,三角形,我们的任务是排列相同类型的形状 标记的数据集已经标记了所有的形状,我们将在该数据集上训练机器学习模型,在训练数据集的基础上,它将开始检测形状。

联合国监管下学习

无监督学习是一种最终结果未知的无指导学习,它将对数据集进行聚类,并基于对象的相似属性将对象划分在不同的簇上并检测对象。

算法将在原始数据中搜索不同的模式,并在此基础上对数据进行聚类。无监督学习用于聚类。

例如,我们可以有多种形状的不同物体,正方形,圆形,三角形,所以它会根据对象属性进行分组,如果一个物体有四个边,它会认为它是正方形,如果它有三个边,三角形,如果没有边比圆形,这里的数据没有标记,它会学习自己检测各种形状

监督式学习

训练数据包括输入向量的示例及其相应的目标向量的应用被称为监督学习问题。

无监督学习

在其他模式识别问题中,训练数据由一组输入向量x组成,没有任何对应的目标值。这种无监督学习问题的目标可能是在数据中发现相似的例子组,在这里它被称为聚类

模式识别和机器学习(Bishop, 2006)

我可以给你们举个例子。

假设您需要识别哪些车辆是汽车,哪些是摩托车。

在监督学习的情况下,你的输入(训练)数据集需要被标记,也就是说,对于你的输入(训练)数据集中的每个输入元素,你应该指定它是代表一辆汽车还是一辆摩托车。

在无监督学习的情况下,你不标记输入。无监督模型将输入聚类到基于相似特征/属性的聚类中。所以,在这种情况下,没有像“car”这样的标签。

监督式学习:

监督学习算法分析训练数据并产生推断函数,该函数可用于映射新的示例。

我们提供训练数据,我们知道对某个输入的正确输出 我们知道输入和输出之间的关系

问题类别:

回归:预测连续输出中的结果=>将输入变量映射到某个连续函数。

例子:

给一个人的照片,预测他的年龄

分类:在离散输出中预测结果=>映射输入变量到离散类别

例子:

这个肿瘤癌变了吗?

无监督学习:

无监督学习从未被标记、分类或分类的测试数据中学习。无监督学习识别数据中的共性,并根据每个新数据中这些共性的存在与否做出反应。

我们可以根据数据中变量之间的关系对数据进行聚类,从而推导出这种结构。 基于预测结果没有反馈。

问题类别:

聚类:是对一组对象进行分组,使同一组(称为聚类)中的对象彼此之间(在某种意义上)比其他组(聚类)中的对象更相似。

例子:

收集100万个不同的基因,找到一种方法,自动将这些基因分组,这些基因在某种程度上是相似的,或因不同的变量(如寿命、位置、角色等)而相关。

这里列出了常用的用例。

数据挖掘中分类和聚类的区别?

引用:

Supervised_learning

Unsupervised_learning

来自coursera的机器学习

走向数据科学

监督学习是指你为算法提供的数据被“标记”或“标记”,以帮助你的逻辑做出决策。

示例:贝叶斯垃圾邮件过滤,您必须将一个项目标记为垃圾邮件以优化结果。

无监督学习是一种试图在原始数据之外没有任何外部输入的情况下找到相关性的算法。

例如:数据挖掘聚类算法。