查看“计算机视觉”的源代码
←
计算机视觉
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您刚才请求的操作只对以下1个用户组开放:
用户
。
您可以查看并复制此页面的源代码:
= 计算机视觉 = 计算机视觉(Computer Vision),简称CV,包含对象检测、人脸识别、文字识别等。 计算机视觉任务(Visual Task)包括:分类(Classification)、定位(localization)、 检测(detection)和 分割(segmentation),即识别对象的类别,位置,以及所在场景解析与标记。 = 对象检测 = 对象检测,Object Detection,是计算机视觉一项基本功能。 == R-CNN == [http://www.rossgirshick.info/ Ross Girshick],FAIR研究员,R-CNN 和YOLO 算法的开创者。 '''R-CNN''' ((Region-based Convolutional Network)) (Code: [https://github.com/rbgirshick/rcnn Matlab]) # Region based convolutional networks for accurate object detection and segmentation, TPAMI, 2015. # Rich feature hierarchies for accurate object detection and semantic segmentation, CVPR 2014. '''Fast R-CNN''' (Code: [https://github.com/rbgirshick/fast-rcnn Python]) # Fast R-CNN, ICCV 2015. '''Faster R-CNN''' (Code: [https://github.com/ShaoqingRen/faster_rcnn Matlab], [https://github.com/rbgirshick/py-faster-rcnn Python]) # Faster R-CNN Towards real-time object detection with region proposal networks, NIPS, 2015. ==YOLO== (Code [https://pjreddie.com/darknet/yolo/ Yolo]) [https://github.com/hizhangp/yolo_tensorflow Yolo_TensorFlow] # You Only Look Once: Unified, Real-Time Object Detection, CVPR 2016 ==SSD== #Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg, SSD: Single Shot MultiBox Detector, ECCV 2016. [https://github.com/balancap/SSD-Tensorflow SSD-Tensorflow] =图像语义分割= ==Semantic Segmentation== mask r-CNN [x] Ronghang Hu, Piotr Dollár, Kaiming He, Trevor Darrell, Ross Girshick, Learning to Segment Every Thing, https://arxiv.org/abs/1711.10370 =计算机视觉应用= == 人脸识别和辨识 == 人脸识别和辨识,Face Detection, Recognition and Identification,分为传统机器学习和深度神经网络两大类方法。 *传统机器学习 特征脸算法(Eigenface), 局部二值模式(Local Binary Patterns,简称LBP), Fisherface算法 *深度神经网络 基于深度神经网络的方法,如 CMU - [http://cmusatyalab.github.io/openface/ OpenFace] ==交通标志识别== 学术界和工业界对于交通标志识别(Traffic Sign Recognition,TSR)和交通标志检测(Traffic Sign Detection,TSD)领域的研究由来已久。TSD在TSR正确识别标志类型的基础上,还要求对识别出的交通标志进行定位,与目标检测类似。 在2011年IJCNN的交通标志识别比赛中,Ciresan等人使用深度神经网络的方法,获得了比人类平均识别水平更高的结果,使得科学家们将研究的目光转到了基于深度学习的检测方法上来。 ==病变图像识别== 深度学习在医学领域的应用有广阔的前景。对深度学习用在医学影像的检测研究文献中,谷歌采用深度学习检测糖尿病视网膜病变并得出与医生诊断结果高度一致的结论。 台湾的交通大学的Peng-Jen Chen等人开发了结肠镜成像的计算机辅助诊断系统对结直肠息肉进行类型分类。
返回
计算机视觉
。
导航菜单
个人工具
创建账户
登录
名字空间
页面
讨论
变种
查看
阅读
查看源代码
查看历史
操作
搜索
导航
首页
实践教学
个性化3D设计与实现
人工智能实践教学
区块链技术及应用
虚拟现实技术与内容制作
超越学科界限的认知基础课程
电子工艺实习
Nand2Tetris Engine Curriculum
TULLL Creative Learning Group
Wiki上手说明
Wiki账户创建
最近更改
工具
链入页面
相关更改
特殊页面
页面信息