本文是XJTU计算机视觉2022 Spring 第一节课Introduction的笔记,对计算机视觉、模式识别等内容进行了介绍,同时说明了课程相关的要求
XJTU计算机视觉2022-Spring-1: 绪论
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等任务,从而实现机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
第一节课绪论的所有内容如下
不过由于我所写的是笔记,而非课程的PPT的复制粘贴,因此我将有选择性的介绍一些内容。
1. 计算机视觉的定义
维基百科上对计算机视觉(Computer Vision)的介绍如下
Computer vision is an interdisciplinary scientific field that deals with how computers can gain high-level understanding from digital images or videos. From the perspective of engineering, it seeks to understand and automate tasks that the human visual system can do.
通俗的来说:
- 计算机视觉是一门研究如何使机器“看”的科学
- 更进一步的说,就是是指用摄影机和电脑代替人眼,完成
- 对目标进行识别、跟踪和测量
- 并进一步做图形处理
- 使电脑处理成为更适合人眼观察或传送给仪器检测的图像
2. 模式识别的定义
这门课程的名称是计算机视觉与模式识别
,其中包含了Computer Vision和Pattern Recognition两个部分。因此下面就将介绍一下模式识别的定义。
想要明白什么是模式识别,就需要先明白什么是模式识别。在前面的某一个博客中我其实以及介绍过了模式(Pattern),这里再介绍一下
Pattern虽然直译为模式,但其含义其实是规律,即万事万物中存在的规律。用维基百科的话来说如下
模式(英语:Pattern)是存在于人们感知到的世界、人造设计或抽象思想中的规律。因此,模式的元素以可预测的方式重复。几何图案是一种由几何形状形成的图案,通常像壁纸设计一样重复。
任何感官都可以直接观察模式。相反,科学、数学或语言中的抽象模式可能只有透过分析才能观察到。实践中的直接观察,意味著看到在自然界和艺术中普遍存在的视觉模式。自然界中的视觉模式通常是混乱的,很少完全重复,并且经常涉及分形。自然图案包括螺旋、曲折、波浪、泡沫、瓷砖、裂缝,以及由旋转和反射的对称性产生的图案。模式有一个潜在的数学结构[1];事实上,数学可以被看作是对规律的探索,任何函数的输出都是一个数学模式。同样在科学中,理论解释和预测世界的规律。
在艺术和建筑中,装饰或视觉图案可以组合和重复以形成设计用于对观看者产生选定效果的图案。在计算机科学中,软体设计模式是对一类编程问题的已知解决方案。在时尚界,图案是用于创建任意数量的类似服装的模板。
在模式之中,某些固定的元素不断以可预测的方式周期性重现。最基本而常见的模式,称为密铺,具备重复性以及周期性两大特征。找寻出固定模式是人类基本的认知功能之一。
所以模式识别的意思其实指的就是识别存在于事物中的规律。然后利用这种规律来帮助我们完成任务。
3. 模式识别和计算机视觉的关系
我们上面说道,计算机视觉其实指的就是用机器来完成诸如追踪、目标识别和测量等视觉任务。因此,计算机视觉和模式识别的关系其实就是:模式识别为计算机视觉解决机器视觉任务提供了工具
换而言之,本课程的关注的对象就是计算机视觉,而模式识别是帮助计算机视觉完成任务的有力工具。
所以我们后面要讲的内容就包括:
- 计算机表示视觉的方式(图像的表示)
- 计算机(摄像机)成像的原理
- 对图像的变换(几何变换、灰度变换、空间滤波、频域变换等等)
- 等等
这些内容都是经典的计算机视觉的内容,并且将会为接下来的学习做好准备