zoukankan      html  css  js  c++  java
  • 抖音代码舞Python3实现

    一、背景说明

    过年被肺炎困在家里实在无聊,早上想着要做什么的时候突然想到抖音上的代码舞(我也不知道叫不叫这名字)挺有意思,就来研究一番。

    首先要知道Python处理图片/音视/视频一般都是pillow/opencv/ffmpeg组合,至于具体代码不知道这也好解决:内事不决问百度,外事不决问谷歌,码事不决问github。

    至于说不是原创这种事情,冠冕堂皇点说这叫开源精神,投机取巧点说叫微创新,真实点说代码这东西别人抄得我抄不得?

    二、项目说明

    项目github地址:https://github.com/PrettyUp/CodeDance

    2.1 项目目录结构说明

    -CodeDance
     |
     |--bak--原项目的备份文件。删除无影响。
     |
     |--video
     |  |
     |  |--test.mp4--项目测试使用的原视频文件
     |  |
     |  |--test-code.mp4--原视频文件生成的代码式视频文件
     |
     |--video_2_code_video.py--实现代码

    2.2 开发环境说明

    操作系统:Windows7(没在Linux上确认是否能成功,但就算要调整的应该也不多)

    Python版本:Python3.7(Python3.5+应该都没有问题)

    依赖库:pip install opencv-python pillow

    依赖应用: ffpmeg(下载直接解压、将bin目录加到PATH环境变量)

    2.3 使用说明

    在config_dict中配置好输入的视频文件路径,直接运行video_2_code_video.py即可。

    至于运行效果演示,博客园上传视频比较麻烦,可自行对比GitHub项目video目录下的两个视频。

    三、实现源代码

    import argparse
    import os
    import cv2
    import subprocess
    from cv2 import VideoWriter_fourcc
    from PIL import Image, ImageFont, ImageDraw
    
    # 命令行输入参数处理
    # aparser = argparse.ArgumentParser()
    # aparser.add_argument('file')
    # aparser.add_argument('-o','--output')
    # aparser.add_argument('-f','--fps',type = float, default = 24)#帧
    # aparser.add_argument('-s','--save',type = bool, nargs='?', default = False, const = True)
    # 是否保留Cache文件,默认不保存
    
    class Video2CodeVideo:
        def __init__(self):
            self.config_dict = {
                # 原视频文件
                "input_file": "video/test.mp4",
                # 中间文件存放目录
                "cache_dir": "cache",
                # 是否保留过程文件。True--保留,False--不保留
                "save_cache_flag": False,
                # 使用使用的字符集
                "ascii_char_list": list("01B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/|()1{}[]?-_+~<>i!lI;:oa+>!:+. "),
            }
    
        # 第一步从函数,将像素转换为字符
        # 调用栈:video_2_txt_jpg -> txt_2_image -> rgb_2_char
        def rgb_2_char(self, r, g, b, alpha=256):
            if alpha == 0:
                return ''
            length = len(self.config_dict["ascii_char_list"])
            gray = int(0.2126 * r + 0.7152 * g + 0.0722 * b)
            unit = (256.0 + 1) / length
            return self.config_dict["ascii_char_list"][int(gray / unit)]
    
        # 第一步从函数,将txt转换为图片
        # 调用栈:video_2_txt_jpg -> txt_2_image -> rgb_2_char
        def txt_2_image(self, file_name):
            im = Image.open(file_name).convert('RGB')
            # gif拆分后的图像,需要转换,否则报错,由于gif分割后保存的是索引颜色
            raw_width = im.width
            raw_height = im.height
            width = int(raw_width / 6)
            height = int(raw_height / 15)
            im = im.resize((width, height), Image.NEAREST)
    
            txt = ""
            colors = []
            for i in range(height):
                for j in range(width):
                    pixel = im.getpixel((j, i))
                    colors.append((pixel[0], pixel[1], pixel[2]))
                    if (len(pixel) == 4):
                        txt += self.rgb_2_char(pixel[0], pixel[1], pixel[2], pixel[3])
                    else:
                        txt += self.rgb_2_char(pixel[0], pixel[1], pixel[2])
                txt += '
    '
                colors.append((255, 255, 255))
    
            im_txt = Image.new("RGB", (raw_width, raw_height), (255, 255, 255))
            dr = ImageDraw.Draw(im_txt)
            # font = ImageFont.truetype(os.path.join("fonts","汉仪楷体简.ttf"),18)
            font = ImageFont.load_default().font
            x = y = 0
            # 获取字体的宽高
            font_w, font_h = font.getsize(txt[1])
            font_h *= 1.37  # 调整后更佳
            # ImageDraw为每个ascii码进行上色
            for i in range(len(txt)):
                if (txt[i] == '
    '):
                    x += font_h
                    y = -font_w
                # self, xy, text, fill = None, font = None, anchor = None,
                # *args, ** kwargs
                dr.text((y, x), txt[i], fill=colors[i])
                # dr.text((y, x), txt[i], font=font, fill=colors[i])
                y += font_w
    
            name = file_name
            # print(name + ' changed')
            im_txt.save(name)
    
    
        # 第一步,将原视频转成字符图片
        # 调用栈:video_2_txt_jpg -> txt_2_image -> rgb_2_char
        def video_2_txt_jpg(self, file_name):
            vc = cv2.VideoCapture(file_name)
            c = 1
            if vc.isOpened():
                r, frame = vc.read()
                if not os.path.exists(self.config_dict["cache_dir"]):
                    os.mkdir(self.config_dict["cache_dir"])
                os.chdir(self.config_dict["cache_dir"])
            else:
                r = False
            while r:
                cv2.imwrite(str(c) + '.jpg', frame)
                self.txt_2_image(str(c) + '.jpg')  # 同时转换为ascii图
                r, frame = vc.read()
                c += 1
            os.chdir('..')
            return vc
    
        # 第二步,将字符图片合成新视频
        def txt_jpg_2_video(self, outfile_name, fps):
            fourcc = VideoWriter_fourcc(*"MJPG")
    
            images = os.listdir(self.config_dict["cache_dir"])
            im = Image.open(self.config_dict["cache_dir"] + '/' + images[0])
            vw = cv2.VideoWriter(outfile_name + '.avi', fourcc, fps, im.size)
    
            os.chdir(self.config_dict["cache_dir"])
            for image in range(len(images)):
                # Image.open(str(image)+'.jpg').convert("RGB").save(str(image)+'.jpg')
                frame = cv2.imread(str(image + 1) + '.jpg')
                vw.write(frame)
                # print(str(image + 1) + '.jpg' + ' finished')
            os.chdir('..')
            vw.release()
    
        # 第三步,从原视频中提取出背景音乐
        def video_extract_mp3(self, file_name):
            outfile_name = file_name.split('.')[0] + '.mp3'
            subprocess.call('ffmpeg -i ' + file_name + ' -f mp3 -y ' + outfile_name, shell=True)
    
        # 第四步,将背景音乐添加到新视频中
        def video_add_mp3(self, file_name, mp3_file):
            outfile_name = file_name.split('.')[0] + '-code.mp4'
            subprocess.call('ffmpeg -i ' + file_name + ' -i ' + mp3_file + ' -strict -2 -f mp4 -y ' + outfile_name, shell=True)
    
        # 第五步,如果没配置保留则清除过程文件
        def clean_cache_while_need(self):
            # 为了清晰+代码比较短,直接写成内部函数
            def remove_cache_dir(path):
                if os.path.exists(path):
                    if os.path.isdir(path):
                        dirs = os.listdir(path)
                        for d in dirs:
                            if os.path.isdir(path + '/' + d):
                                remove_cache_dir(path + '/' + d)
                            elif os.path.isfile(path + '/' + d):
                                os.remove(path + '/' + d)
                        os.rmdir(path)
                        return
                    elif os.path.isfile(path):
                        os.remove(path)
                    return
            # 为了清晰+代码比较短,直接写成内部函数
            def delete_middle_media_file():
                os.remove(self.config_dict["input_file"].split('.')[0] + '.mp3')
                os.remove(self.config_dict["input_file"].split('.')[0] + '.avi')
            # 如果没配置保留则清除过程文件
            if not self.config_dict["save_cache_flag"]:
                remove_cache_dir(self.config_dict["cache_dir"])
                delete_middle_media_file()
    
        # 程序主要逻辑
        def main_logic(self):
            # 第一步,将原视频转成字符图片
            vc = self.video_2_txt_jpg(self.config_dict["input_file"])
            # 获取原视频帧率
            fps = vc.get(cv2.CAP_PROP_FPS)
            # print(fps)
            vc.release()
            # 第二步,将字符图片合成新视频
            self.txt_jpg_2_video(self.config_dict["input_file"].split('.')[0], fps)
            print(self.config_dict["input_file"], self.config_dict["input_file"].split('.')[0] + '.mp3')
            # 第三步,从原视频中提取出背景音乐
            self.video_extract_mp3(self.config_dict["input_file"])
            # 第四步,将背景音乐添加到新视频中
            self.video_add_mp3(self.config_dict["input_file"].split('.')[0] + '.avi', self.config_dict["input_file"].split('.')[0] + '.mp3')
            # 第五步,如果没配置保留则清除过程文件
            self.clean_cache_while_need()
    
    if __name__ == '__main__':
        obj = Video2CodeVideo()
        obj.main_logic()
  • 相关阅读:
    【canvas】--------------处理canvas物理像素模糊问题-------------【劉】
    【js】--------------判断一个对象是否有某个属性-------------【劉】
    【vue】--------------vue+element-ui实现分页效果-------------【劉】
    【html】--------------iframe-------------【劉】
    【劉】---------------单页面和多页面的区别
    【react】--------------flux-------------【劉】
    【vue】--------------vue路由懒加载-------------【劉】
    【git】--------------git基本指令-------------【劉】
    【git】--------------git基本介绍-------------【劉】
    datatable 分组
  • 原文地址:https://www.cnblogs.com/lsdb/p/12234159.html
Copyright © 2011-2022 走看看