监督学习

Posted on 2024-09-24 Word count in article: 308 Reading time ≈ 1 mins.

监督学习

定义：

监督学习是一种基于已标记数据进行训练的机器学习方法。训练数据由输入特征和对应的目标输出（标签）组成，模型的目标是学习输入与输出之间的映射关系，以便对新数据进行准确的预测。

无监督学习

定义：

无监督学习是在没有预先标记的数据上进行训练的机器学习方法。模型需要自行发现数据的结构、模式或分布，以揭示数据中的隐藏信息。

自监督学习（额外补充）

定义：

自监督学习是一种特殊的无监督学习，模型从数据本身生成标签进行训练，旨在学习数据的有效表示。

特点：

• 标签生成：通过预定义的任务（如预测图像的一部分）自动生成标签。

• 表示学习：获取对下游任务有用的特征表示。

应用场景：

• 自然语言处理：BERT、GPT等模型通过预测下一个词或填空任务进行训练。

• 计算机视觉：通过图像的旋转预测、颜色恢复等任务学习图像特征。