深度学习概述

深度学习概述

本人没看过任何深度学习概述资料,下面的话都是根据我参考各样模型后瞎诌出来的。

在大家都过着七夕看喜鹊的时候,本鸽忽然想起了本组还没更新博客,看了下发现进度居然还没更新到深度学习(别说了,我发现传统的机器学习算法也没搞),于是打算开始挖个深度学习坑。

AI现状

要说现在的AI,基本都在搞深度学习(为什么,因为无敌啊)。传统的机器学习算法算法效果在目前的一些问题上往往非常复杂,而且效果很差,很多算法已经发展的比较饱和,性能上很难有大突破。但深度学习是机器学习上比较新的领域,结构比较统一(但有些还是复杂),训练过程简单(但时间仍然长),发展迅速(主要是钱多)一线的研究人员多(论文好混)。于是本组的学习现在基本都从传统算法向深度学习靠近。

深度学习和传统机器学习算法的区别

传统机器学习算法基本都在分类、聚类等问题做了些模型,在分类问题上做的比较多(因为很多问题都可以转化为分类问题),要说有什么可以随便翻翻书有一大堆。在分类问题上,一个模型预测一条数据的过程基本是这样的

特征->分类结果

也就是给一个模型数据特征,然后模型返回出他的结果。看起来简单,但实际问题中,特征往往不好确定。比如简单的iris数据(鸢尾花卉数据),每条数据只有4个属性(花萼长度,花萼宽度,花瓣长度,花瓣宽度),那这4个数据都可以作为特征进行学习。但如果是320*240像素的一张图片,把像素拉成一个向量,有76,800个像素,全用作特征的话特征数量就非常大了,即使有各种降维算法,效果和速度仍然会非常慢。所以有人想出了简单的方法,使用一种设计好的特征提取器,用这个特征提取器从原始图片中提取特征,这样就可以疯狂减少特征量。(和之前文章中的haar算法很像,从图片提取人脸特征的就是一种)但这样就会出现另外一种问题:如何设计这个特征提取器,不同的提取器最终分类效果各异,要找出非常好用的实际上非常困难。最难受的是这个特征提取器不容易迁移,在一个问题上表现非常好的提取器,在另外一个问题上可能就不行。
至此,深度学习概念可以比较好解决这个问题。研究发现,一段声音可以分解成数个基础波(复变函数学的好的同学已经可以理解了,此处不多加解释,不懂的同学可以翻阅傅里叶变换),同样,图像也可以(二维的傅里叶变换),从这个角度设计滤波器,把图像分解成无数个(理想模型是无数个,实际上受限于机器)正交纹理(正交纹理是我随便叫的)的叠加,统计每个正交纹理的数量,把这个数量作为特征进行分类。同时这个滤波器作为特征提取器是由参数构成的,分类模型通过学习训练调整参数,特征提取器也同样可以。在训练过程中调整特征提取器的参数,从而提取出更加正交的特征,这就是深度学习特有的地方。也就是说,深度学习预测数据的过程是这样的

原始数据->特征->分类结果

这样考虑,不同的问题,只需要训练一遍,他就能自动训练出一个好用的提取器,而且有比较好的迁移能力(大部分深度学习模型都通过预训练加快学习速度)因此,深度学习在图像、视频、文字处理上都有比传统机器学习更好的表现。

发表评论

电子邮件地址不会被公开。 必填项已用*标注