zoukankan      html  css  js  c++  java
  • 2020软件杯赛题分析

    赛题名称:视频全量目标分析和建模

    赛题简介:人工智能结合视觉分析,极大推动各行业视觉应用。人脸识别、车辆测别、车辆智能驾驶等。结合当前高清1080P、2K、4K等视频,利用人工智能进行视觉分析技术,具有广泛得应用场景。

    业务场景:针对10分钟1080P视频,视频内容街景(行车记录仪、电影等拍摄)内容,需要利用视觉分析技术,对高分辨率视频进行视频图像语义分割,赛题要求参赛者给出测试视频数据中每帧的每个点的类别预测。本赛题是为了对街景或高楼的高清视频进行目标检测和语义分割,相比于基于现有的方案进行简单的调参,我们更鼓励参赛者提出创新的深度学习算法模型解决方案。

    基本功能要求:

    场景要求是基于华为AI昇腾平台,重点考核建筑物等固定目标得识别和分割。

    基本要求如下:

    1、视频内容内移动目标识别,包括人、机动车、非机动车、建筑、植物等;

    2、实现对高清视频的图像语义分割,对每帧的每个点的类别预测;

    3、基于华为昇腾AI平台进行开发。

    例如以下实现方式:

    图片1.jpg

    参考资料:基于目标建模的视频图像目标检测研究  https://www.ixueshu.com/document/994906362d7885decca0479d5b18b1b9318947a18e7f9386.html

    视频跟踪中的目标建模及相似性度量研究:http://xueshu.baidu.com/usercenter/paper/show?paperid=ca30c97dd3c6ed4a2e9527f102220322&site=xueshu_se

    python读取视频显示视频和保存视频文件:https://blog.csdn.net/qq_18343569/article/details/50275305

    开发环境及语言:

    华为云 python

    江苏鲲鹏生态创新中心提供AI开发和训练平台,(AI平台会提供基础的开发和训练环境。数据集参考VOCCOCOcityscapes-image-pairsSemantic Segmentation for Self Driving Cars等),开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。

    江苏鲲鹏生态创新中心提供AI开发和训练平台,(视频资源自备,电影或者实际拍摄),开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。

     

     功能需求

    可导入一段10分钟1080P视频

    视频内容内移动目标识别,包括人、机动车、非机动车、建筑、植物等;

    实现对高清视频的图像语义分割,对每帧的每个点的类别预测

    对不同事物进行不同颜色标记并可以剔除

    性能需求

    实现移动目标5种识别以上

    实现移动目标10种识别,其中建筑物必须识别。

    系统良好运行

     

     

  • 相关阅读:
    【转载】面对酱紫的情况,肿么办哇?
    webform 基础
    LINQ 语句实现分页
    LINQ to SQL 语句
    发送邮件&Timer
    treeview递归
    进程&线程
    登录框记住账号
    窗体-对话框,记事本
    日期与地区的三级联动
  • 原文地址:https://www.cnblogs.com/gkl20173667/p/12805025.html
Copyright © 2011-2022 走看看