CNN
CNN简述及其影响 从动物的中枢神经系统得到灵感,于是诞生了人工神经网络。大量节点之间建立联系能够让机器解决更多更复杂的问题。在此讨论卷积神经网络(CNN)的模型及其影响。
- CNN简述
1.1人工神经网络。类似于生物界,人工神经网络的基本处理单元是神经元,其一般是多输入单输出的单元。多层感知器则是目前神经网络研究应用中最基本的模型之一,是一种单向传播的多层前馈网络模型,具有高度的非线性映射能力[1]。其当下最重要算法是BP算法,正向输出与误差逆向可让最终结果误差不断变小,类似于生物界中的负反馈调节机制。 1.2卷积神经网络。它是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现[2]。CNN的基本结构由输入层、卷积层、池化层、全连接层及输出层构成。其中,大部分是由卷积层与池化层相连形成。卷积层输出特征面通过加权求和并加上偏置值,提取输入区域的某些局部特征[3]。然后将其局部加权和传递给非线性函数之后即可输出[4]。卷积层则是池化层的输入层,卷积层的一个特征面与池化层的一个特征面唯一对应。池化层旨在通过降低特征面的分辨率来获得具有空间不变性的特征[5]。多个卷积层和池化层后有全连接层,它可以整合卷积层或池化层中具有类别区分性的信息[6]。因此,各层提取的特征在不同角度一次次增强,最后使整体变得十分抽象[7],但同时局部特征变得尤为凸显。
- CNN的优势与作用
CNN提取局部信息特征的特点,让它在识别与分类方面有着得天独厚的优势。从以下几个方面进行探讨: 2.1人物识别。如果要提取某种弧度的曲线,只需要在曲线路径上设置较大的加权,再有足够多的训练样例即可。这样,它能够将相近的图像通过微小的差异进行分类。因此,通过CNN,可以在众多人脸中判别犯罪嫌疑人,相较于传统方法,误差小效率高。同理,还可以提取语音、指纹等特征对人物进行区分,强化治安。特别是语音识别中,在计算量比深层神经网络更少的情况下,卷积神经网络识别性能更优[8]。并且它还可以通过提取手写体的特征,辨认人物字迹,古玩器物,方便对古迹进行判别,降低判断的失误率。 2.2医学识别。CNN可以为医学创造更好的条件。仪器检测过程中,它可以通过提取图像局部特征,提高分析效率和准确率,另外还能辨识各种生物信号,降低误诊率。 2.3遥感影像分类。在传统的模式识别模型中,通常用一个手工设计的特征抽取器来收集输入数据中相关的有用信息,同时删除一些无关的变量,得到一组特征变量,然后通过一个可训练的分类器对这些特征变量进行分类识别[9]。这种识别模型暴露出诸多的问题,难以解决数据量大或是差别微小(例如轻微的平移)的影像。而遥感技术的分辨,又是如今热门的话题。气象观测,救灾抢险,军事侦察,都依赖更加良好的遥感影像分类技术。CNN通过共享权值和网络结构重组将特征学习融入到多层神经网络中,同时使得整个网络可以通过反向传播算法得到很好地训练并用于分类[10]。这正是CNN对生物界负反馈调节机制很好的模仿,在此基础上可让网络得到大量的训练,误差小因而可以较传统方式更加精确地做好分类工作。 2.4其他方面。CNN的识别能力还能在经济、交通、甚至心理学等领域发挥独特的作用。我想,或许还能将CNN用于更加贴近人们生活的方面,比如说对垃圾邮件垃圾短信的更精确识别,防止重要邮件和信息在当事人不知情的情况下便被系统自动屏蔽删除。更有可能的是,今后CNN遍布生活角落,不断完善而且更加精确,完成更多人力不可及之事。
- 潜在的CNN的不利影响
但是,世间难有完美事物的存在。CNN高超的识别技术,同样也会有它的一些弊端。作为对生物神经的初级模仿,CNN占用资源不少,能耗不菲。这些或可通过技术的进一步发展解决。然而,一个不断牵绊的问题又被提上银幕:机器已能模仿人的神经,那么以后,所有工作机器均可承担,是否会造成人类的无用?神经系统的发展最终或可使机器真正具有自己的思想,是否会对人类社会造成冲击甚至是威胁?这些问题可能过早提出,可能过度悲观,可能过于宽泛,不能仅仅归咎于CNN,但确实值得我们思考。不可质疑的是,CNN带来的强大的图像识别能力,若被不当利用,有很大可能让早已难以藏身的个人隐私更加难以找到生存空间。写下的信件,甚至是订单等极易忽视的物件,在极其大量的废品中也难以藏身。不法分子甚至可以用它做出威胁更大的武器危害社会,让机器在不断的自我训练中取得他们所需要的一切。
- 总结
科技的发展是一把双刃剑,历史已经多次教导我们这个道理。但是,不利影响并非停滞发展的理由。唯有科技进步,才能让人类社会往高层发展。因此,对CNN的研究与算法改进,仍应有无数仁人志士投身其中,让它更加精确,更能发挥优势。
参考文献 [1] Simon Haykin.神经网络原理[M].北京:机械工业出版社,2004. [2] 维基百科.Convolutional neural network[EB/OL]. https://en.wikipedia.org/wiki/Convolutional_neural_network, 2017-11-09. [3] LeCun Y, Bottou L, Bengio Y.Gradient-based learning applied to document recognition.[J].Proceedings of the IEEE,1998,(11):2278-2324. [4] 周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(06):1229-1251. [5] Jiujiang, Gu, Zhenhua, Wang, Jason, Kuen. Recent advances in convolutional neural networks[J]. Pattern Recognition, 2018, (77): 354-377. [6] Tara, N, Sainath, Brian, Kingsbury. Deep Convolutional Neural Networks for Large-scale Speech Tasks[J]. Neural Networks, 2015, (64): 39-48. [7] 金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学:信息科学,2015,45(03):398-416. [8] 张晴晴,刘勇,王智超,潘接林,颜永红.卷积神经网络在语音识别中的应用[J].网络新媒体技术,2014,3(06):39-42. [9] Tai Sing Lee,David Mumford,Richard Romero,Victor A.F. Lamme. The role of the primary visual cortex in higher level vision[J]. Vision Research,1998,38(15):2429-2454. [10] 曹林林,李海涛,韩颜顺,余凡,顾海燕.卷积神经网络在高分遥感影像分类中的应用[J].测绘科学,2016,41(09):170-175.