zoukankan      html  css  js  c++  java
  • 软件杯-视频全量目标分析和建模需求分析说明

    开发环境:

    1. 华为云 AI开发平台ModelArts

    开发语言:

    1. python3.7

    深度学习框架:

    1. TensorFlow1.x

    数据集:

    1. 参考cityscapes-image-pairs等

    预计初步实现:

    简单来说 提取视频的帧 然后处理 在合成
    我们感觉原视频和分割后的视频放一起比较好,但是抽帧分割再合成后的视频和原视频对不上
    感觉视频分割方面还得改,但是还没想好咋弄?

    提取每帧:

    初步效果:

    功能需求:利用视觉分析技术对高分辨率视频进行目标检测和语义分割

    具体:

    基本要求:
    1. 分类和定位。针对10分钟1080P视频内容进行移动目标识别(包括人、机动车、非机动车、建筑、植物等5种以上)
    2. 语义分割。实现对高清视频图像语义分割(对每帧的每个点的类别预测)
    3. 重点实现对建筑物等固定目标的识别和分割
    进阶需求:
    1. 实现移动目标10种以上(其中建筑物必须识别)
    2. 实现实例分割
    3. 性能优化,创新深度学习算法模型

    计算机视觉四大步骤:(分类、定位、检测、分割)

  • 相关阅读:
    图解Eclipse中配置Maven并创建Maven的Web工程
    Bzoj1922: [Sdoi2010]大陆争霸
    Bzoj2007: [Noi2010]海拔
    Bzoj5212: [Zjoi2018]历史
    NOIP2017:列队
    NOIP2017:逛公园
    CF908D New Year and Arbitrary Arrangement
    HDU4652:Dice
    HDU4336:Card Collector(min-max容斥)
    [NOI2017]游戏
  • 原文地址:https://www.cnblogs.com/zzstdruan1707-4/p/12804467.html
Copyright © 2011-2022 走看看