zoukankan      html  css  js  c++  java
  • 软件杯-视频全量目标分析和建模需求分析说明

    开发环境:

    1. 华为云 AI开发平台ModelArts

    开发语言:

    1. python3.7

    深度学习框架:

    1. TensorFlow1.x

    数据集:

    1. 参考cityscapes-image-pairs等

    预计初步实现:

    简单来说 提取视频的帧 然后处理 在合成
    我们感觉原视频和分割后的视频放一起比较好,但是抽帧分割再合成后的视频和原视频对不上
    感觉视频分割方面还得改,但是还没想好咋弄?

    提取每帧:

    初步效果:

    功能需求:利用视觉分析技术对高分辨率视频进行目标检测和语义分割

    具体:

    基本要求:
    1. 分类和定位。针对10分钟1080P视频内容进行移动目标识别(包括人、机动车、非机动车、建筑、植物等5种以上)
    2. 语义分割。实现对高清视频图像语义分割(对每帧的每个点的类别预测)
    3. 重点实现对建筑物等固定目标的识别和分割
    进阶需求:
    1. 实现移动目标10种以上(其中建筑物必须识别)
    2. 实现实例分割
    3. 性能优化,创新深度学习算法模型

    计算机视觉四大步骤:(分类、定位、检测、分割)

  • 相关阅读:
    第一次博客园作业
    弹性布局/流动式布局
    元素在网页或视口上位置的相关问题求解
    element
    给body设置高度
    盒模型宽高的获取和设置
    选择器
    变量、作用域和内存问题
    js之捕捉冒泡和事件委托
    transition transform animate的使用
  • 原文地址:https://www.cnblogs.com/zzstdruan1707-4/p/12804467.html
Copyright © 2011-2022 走看看