需求
1、运营那边需要统计大量视频文件的播放时长,并汇总记录到excel表中,问我有什么方法搞定
这边搜索了很多统计媒体文件时长的,主要有以下几种
1、使用java获取
2、使用python获取
3、使用mediainfo工具获取
由于自己对java刚懂点基础,要琢磨几天才能写出来,而python代码下载的第三方模块运行时总是报错。一时半会无法解决
最终采用mediainfo工具
1、下载和安装mediainfo工具
这边下载使用的mediainfo工具是1.8版本的

2、简单使用此工具查看一些媒体文件
在安装目录下找到此软件入口(可以发送个快捷方式到桌面,方便以后使用)

可以打开文件或者文件夹

先查看一个电影文件。有一些输出信息

点击下面按钮

可以看到一些定义好的输出格式,选择不同的格式,显示的信息不一样

这里选择树状图,可以看到很多信息

由于这里我只想要文件名和文件的播放时长,因此需要自定义输出信息
选项--参数设置

找到自定义

点击新建,自定义个名字,随便定义

点击OK之后弹出如下

保持第一行内容如下
General : %FileNameExtension%,%PlayTime/String1%
如下,点击OK保存

保持当前自定义的是自己刚刚写的

点击确定
点击左边的查看方式

查看方式选择自定义

可以看到输出信息如下

可以看到第一行左边是文件名,右边是时间
其它信息是多出来的。我们没配置,但是仍然默认多出来了。目前已经做到输出信息最少了,同时我们需要的都在
如果不想看到毫秒等信息。可以编辑输出的信息把string1改成string2

再次查看自定义信息,就没有秒和毫秒了
经过我测试,如果文件没超过一分钟,会显示为分钟和秒
如果文件超过1小时,会显示小时和分钟。

3、使用mediainfo工具查看一批媒体文件
前提是媒体文件都在此文件夹下

视频文件信息都出来了
如果文件比较多,可能要等一小会才会出现。我曾经统计过800个小视频文件。软件卡了5到10分钟才显示

4、对文件输出信息进行处理加工
右键--全选

复制到一个文本里

复制到文本文件里

接下来就是对这些信息进行加工了。只保留文件名和时间
方式1
linux命令特别熟的可以选择使用awk以及grep工具处理
grep General med.txt| awk -F ':[ ]' '{print $2}' |awk -F 'Video' '{print $1}'
上面是把信息放在了med.txt文件里的
先根据General过滤出文件名和时间这行,然后根据规律去掉文件名前面的字符串,然后去掉Video以及之后的字符串

方式2
使用windows版本的awk和grep工具
这里下载了awk工具和grep工具,都是windows版本的


这些命令工具都是从gnu网站下载的
http://gnuwin32.sourceforge.net/packages/gawk.htm
http://gnuwin32.sourceforge.net/packages/grep.htm
因为平时也用到了别的工具,自己都统一放在了下面目录下,同时设置了环境变量,这样就可以在任意目录下使用了

很多windows版本的命令

添加工具目录到环境变量里

添加个mypath
内容如下
C:mytoolscorein;C:mytoolscurl;C:mytoolsgrepin;D:autossh-cygwin;D:sed-4.2.1-binin;C:mytoolsgawkin
然后把mypath假如到系统的path里面

确定之后
进入工具目录下,把mediainfo提取出的信息,保存到med.txt里面

创建个bat文件,里面内容如下
grep General med.txt| awk -F ":[ ]" "{print $2}" |awk -F "Video" "{print $1}" >2.csv

双击运行此bat文件,会出现一个2.csv文件。这就是处理后的文件,使用excel工具打开

这就是我们想要的内容了
