计算机视觉基础
- 作者:宫文娟,刘昕,李昕,李华昱 编
- 出版时间:2020/12
- ISBN:9787308208437
- 出版社:浙江大学出版社
*如果课本与课件内容有冲突,请以课件内容为准。
计算机视觉课程设计
1. 环境
- 安装Anaconda
- 安装OpenCV:在Windows操作系统中,以管理员身份打开Anaconda Prompt,运行conda install -c conda-forge opencv。如果安装时solving environment一直报错,可以采用下面的解决方法:
- conda create --name ***,***是你自己命名的环境名字;
- 运行activate ***,激活这个环境;
- 运行conda install -c conda-forge opencv安装库。
- 打开Anaconda,运行Jupyter,选择代码路径或者创建新的Notebook代码,运行。
2. 代码
- SIFT Python实现
- SIFT特征点匹配
- 视觉词袋模型
- LeNet-5实现
- Cifar100图像分类
- 谱聚类
- 基于谱聚类的图像分割
- Mean Shift实现
- Mean Shift聚类
- 利用SLIC计算超像素
- 不同边缘检测算子效果对比
- 基于Canny边缘检测的图像分割
- 反卷积操作例子
- 基于全卷积神经网络的图像分割
- 基于滑动窗口和模板匹配的目标检测
- Viola-Jones人脸检测器
- 可变形部件模型(Matlab)
- Faster R-CNN
- Mask R-CNN
- Yolo v3
- 人脸识别
- 人体姿态识别
- OpenPose人体姿态识别
- id3人体行为识别
- Optical Flow
- Kalman Filter
- Kalman Filter for Body Joint Tracking
- Yolov5+Deep Sort
3. 作业
3.1 安装配置实验环境,理解SIFT的整个流程,能够利用OpenCV库调用SIFT函数。替换实验二中的两幅图像,并给出匹配结果。
3.2 在视觉词袋模型方法中,使用除了SIFT之外的其他特征;比较这个特征与SIFT的效果;并将包括SIFT在内的不同特征联合使用;比较单个特征和联合特征的效果。
3.3 添加一层二维卷积层,并与现在的网络识别结果进行比对,主要是比较准确率、收敛速度等;实验结果要通过tensorboard进行可视化的显示。
3.4 运行谱聚类程序,选择UCI图像分割数据库或者Kaggle皮肤癌图像分割数据库中的2幅图像,利用谱聚类进行图像分割,对比谱聚类与k-means聚类效果。
3.5 拍摄一幅自己的大头照,用不同边缘算子(Canny、Sobel X、 Sobel Y、 Sobel、 Prewitt X、 Prewitt Y、 Prewitt)对自己的人脸进行边缘提取;用Canny算子对大头照进行图像分割。
3.6 运行基于滑动窗口和模板匹配的目标检测方法,选择公开的数据库或者自己收集的数据库,实现除了汽车之外的其他类别的物体检测方法。
3.7 运行Viola-Jones人脸检测器,改变数据库,实现除了人脸检测之外的其他类别的物体检测。
3.8 采用不同的经典分类模型(例如VGG,ResNet, GoogleNet, Inception等)实现一个猫/狗分类器。
4. 报告模板
人体姿态估计
1. 课件