zoukankan      html  css  js  c++  java
  • 计算机视觉初涉(一)

    计算机视觉

    计算机视觉(computer vision)是从图像和视频中提出数值或符号信息的计算系统,更形象的来说就是,计算机视觉是让计算机具备像人类一样的眼睛,可以看到图像或视频,并理解图像或视频。

    数据:图像,视频

    算法:机器学习,深度学习神经网络(分类+回归)

    三大任务之识别

    1、车牌识别(通过算法获取车辆的相关信息)

    2、人脸识别(识别出人脸,并且获取所识别人的相关属性,如年龄,性别的等),扩展的还有情绪识别。

    三大任务之目标检测

    目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。

    计算机视觉中关于图像识别有四大类任务:

    分类-Classification:解决“是什么?”的问题,即给定一张图片或一段视频判断里面包含什么类别的目标。

    定位-Location:解决“在哪里?”的问题,即定位出这个目标的的位置。

    检测-Detection:解决“是什么?在哪里?”的问题,即定位出这个目标的的位置并且知道目标物是什么。

    分割-Segmentation:分为实例的分割(Instance-level)和场景分割(Scene-level),解决“每一个像素属于哪个目标物或场景”的问题。

    object detection= classification +localization,可以应用于行人检测/车辆检测等。

    三大任务之分割

    把图像空间按照一定的要求分成一些“有意义”的区域的技术叫做图像分割。

    语义分割:语义指的是图像的内容,对图片意思的理解;分割的意思是从像素的角度分割出图片中的不同对象,对原图中的每个像素都进行标注,语义分割不区分属于相同类别的不同实例。

    实例分割:机器自动从图像中用目标检测方法框出不同实例,再用语义分割方法在不同实例区域内进行逐像素标记,每一个实例都进行标记,不论是否属于统一类别。

    其他方面

    视觉目标跟踪、视频分割、图像风格迁移,对抗生成网络、图题生成等。

    网络架构

    图像识别:AlexNet、VGGNet、GoogleNet、ResNet、RetinaNet.......

    目标检测:Fast-RCNN、Faster-RCNN、Yolo,RetinaNet

    图像分割:FCN、Mask-RCNN

    目标跟踪:GOTURN、eco

    图像生成:GAN、WGAN

    光流:FlowNet

    视频分割:SegNet

    图像特征

    颜色、形状(全局形状、局部形状)、纹理、SIFT特征(局部特征)、HoG特征(检测)、LBP特征(人脸)、Harr特征等

  • 相关阅读:
    DDD 领域驱动设计-谈谈 Repository、IUnitOfWork 和 IDbContext 的实践
    UVA10071 Back to High School Physics
    UVA10071 Back to High School Physics
    UVA10055 Hashmat the Brave Warrior
    UVA10055 Hashmat the Brave Warrior
    UVA458 The Decoder
    UVA458 The Decoder
    HDU2054 A == B ?
    HDU2054 A == B ?
    POJ3414 Pots
  • 原文地址:https://www.cnblogs.com/ddgjye/p/11176015.html
Copyright © 2011-2022 走看看