机器智能研究组 (Machine Intelligence Group)

计算机视觉基础

*如果课本与课件内容有冲突,请以课件内容为准。

计算机视觉课程设计

1. 环境

    • 安装Anaconda
    • 安装OpenCV:在Windows操作系统中,以管理员身份打开Anaconda Prompt,运行conda install -c conda-forge opencv。如果安装时solving environment一直报错,可以采用下面的解决方法:
      1. conda create --name ***,***是你自己命名的环境名字;
      2. 运行activate ***,激活这个环境;
      3. 运行conda install -c conda-forge opencv安装库。
    • 打开Anaconda,运行Jupyter,选择代码路径或者创建新的Notebook代码,运行。

2. 代码


3. 作业

   3.1 安装配置实验环境,理解SIFT的整个流程,能够利用OpenCV库调用SIFT函数。替换实验二中的两幅图像,并给出匹配结果。

   3.2 在视觉词袋模型方法中,使用除了SIFT之外的其他特征;比较这个特征与SIFT的效果;并将包括SIFT在内的不同特征联合使用;比较单个特征和联合特征的效果。

   3.3 添加一层二维卷积层,并与现在的网络识别结果进行比对,主要是比较准确率、收敛速度等;实验结果要通过tensorboard进行可视化的显示。

   3.4 运行谱聚类程序,选择UCI图像分割数据库或者Kaggle皮肤癌图像分割数据库中的2幅图像,利用谱聚类进行图像分割,对比谱聚类与k-means聚类效果。

   3.5 拍摄一幅自己的大头照,用不同边缘算子(Canny、Sobel X、 Sobel Y、 Sobel、 Prewitt X、 Prewitt Y、 Prewitt)对自己的人脸进行边缘提取;用Canny算子对大头照进行图像分割。

   3.6 运行基于滑动窗口和模板匹配的目标检测方法,选择公开的数据库或者自己收集的数据库,实现除了汽车之外的其他类别的物体检测方法。

   3.7 运行Viola-Jones人脸检测器,改变数据库,实现除了人脸检测之外的其他类别的物体检测。

   3.8 采用不同的经典分类模型(例如VGG,ResNet, GoogleNet, Inception等)实现一个猫/狗分类器

4. 报告模板

人体姿态估计

人工智能导论

前沿技术

一些有用的小程序