zoukankan      html  css  js  c++  java
  • 第八讲_图像问答Image Question Answering

    第八讲_图像问答Image Question Answering

    • 课程结构
    • 图像问答的描述
    • 具备一系列AI能力:细分识别,物体检测,动作识别,常识推理,知识库推理.....
    • 先要根据问题,判断什么任务
    • 图像问题与图像描述的关系
    • 研究的难点和挑战
    • 研究方向

    数据集

    • COCO-QA来源MSCOCO
    • VQA(visual question answering)
    • 平衡数据集V1.9-->V2.0
    • Visual7W---Visual Genome的子集

    图像问答模型

    • 模型
    • 基本都是VGG-Net和ResNet,LSTM模型
    • LSTM:三个门和记忆状态
    • 基本模型

    模型增强:注意机制

    • 基本模型

    模型增强:外部知识库

    • 基本模型
    • 属性预测模型
  • 相关阅读:
    C#学习(四)
    C#学习(三)
    sqlserver基本操作
    ado.net(1)
    wpf的学习日志(一)
    C#学习(二)
    三大范式
    存储过程
    事务
    范文模板
  • 原文地址:https://www.cnblogs.com/ranjiewen/p/7604468.html
Copyright © 2011-2022 走看看