zoukankan      html  css  js  c++  java
  • 音乐和人声自动判别小结

          人声的平均识别率在89.31%,音乐的平均识别率在95.95%。相声和故事的结果较差,原因在于测试集中包含的相声现场录制环境较差,环境吵闹,频谱混乱;而讲故事有比较明显的音乐背景伴奏。

    表1   音乐和人声自动分类结果

    正确数目

    数目

    准确率

    电视节目

    59

    66

    0.893939

    故事

    69

    88

    0.784091

    评书

    181

    186

    0.973118

    相声

    73

    96

    0.760417

    有声电台

    41

    44

    0.930233

    1800有声

    96

    101

    0.950495

    合计

    518

    580

    0.893103

    1800音乐

    1614

    1690

    0.95503

    华语舞曲

    54

    54

    1

    R&B

    44

    44

    1

    西方民谣

    80

    80

    1

    华语摇滚

    50

    52

    0.961538

    rap

    104

    108

    0.962963

    合计

    1946

    2028

    0.959566

    合理阈值

    0.5

    表2  两层筛选自动分类结果

    正确数目

    数目

    准确率

    电视节目

    62

    66

    0.939394

    故事

    72

    88

    0.818182

    评书

    182

    186

    0.978495

    相声

    77

    96

    0.802083

    有声电台

    41

    43

    0.953488

    1800有声

    96

    101

    0.950495

    合计

    530

    580

    0.913793

    1800音乐

    1592

    1688

    0.943128

    华语舞曲

    54

    54

    1

    R&B

    43

    44

    0.977273

    西方民谣

    80

    80

    1

    华语摇滚

    49

    52

    0.942308

    rap

    104

    108

    0.962963

    合计

    1922

    2026

    0.948667

    合理阈值

    0.5

  • 相关阅读:
    博客园CSS备份4
    博客园css备份3
    CSS透明滚动条效果
    AHK
    修改网页css的插件stlylebot
    欧陆词典CSS修改
    油猴脚本修改网页默认字体
    博客园上传css,js文件并引用
    CSS添加本地字体文件
    博客园css备份
  • 原文地址:https://www.cnblogs.com/welen/p/4305674.html
Copyright © 2011-2022 走看看