时间:2020-12-14 15:31:25 | 栏目:Python代码 | 点击:次
一、简介
这里介绍使用python基于http下载视频或音频。
二、关键点
1、断点续传
视频或音频文件一般比较大,所以通过需要断点续传。方式通过在http的header里添加Range字段,指示接下来需要接收文件的位置。
2、判断结束
这里采用读取response的content-length字段,若当前报文长度小于前次报文长度,或者已接收文件等于当前报文长度,则可以认为视频接收完成。
三、示例代码
import os import requests def do_load_media(url, path): try: headers = { "User-Agent": "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/4.3.2.1000 Chrome/30.0.1599.101 Safari/537.36"} pre_content_length = 0 # 循环接收视频数据 while True: # 若文件已经存在,则断点续传,设置接收来需接收数据的位置 if os.path.exists(path): headers['Range'] = 'bytes=%d-' % os.path.getsize(path) res = requests.get(url, stream=True, headers=headers) content_length = int(res.headers['content-length']) # 若当前报文长度小于前次报文长度,或者已接收文件等于当前报文长度,则可以认为视频接收完成 if content_length < pre_content_length or ( os.path.exists(path) and os.path.getsize(path) == content_length): break pre_content_length = content_length # 写入收到的视频数据 with open(path, 'ab') as file: file.write(res.content) file.flush() print('receive data,file size : %d total size:%d' % (os.path.getsize(path), content_length)) except Exception as e: print(e) def load_media(): url = 'http://k.youku.com/player/getFlvPath/sid/051446875256330ba12be_00/st/flv/fileid/030002080056EECA04F69A03BAF2B1BBADCA22-B1B9-E915-C03B-B0E7B0726C73?K=ae8e9a4d0f294dce282cef20&hd=0&myp=0&ts=377&ypp=0&ctype=30&ev=1&token=3759&oip=826403039&did=9e701e2baea8d466300184129d27d5d8&ep=AqAHzTJcifjAG0w8gO6bow3Mo5jVCyWrke5yFUQ5ZxOD3KGnS9WeSH2XvfdzTgOmgcPdl%2BVjzD29GUC%2BqeDjFxCFXBPHdIgGvhDtKk064s9iV0vxt4B0XNY39jlBH%2BCK' path = r'E:/test.mp4' do_load_media(url, path) pass def main(): load_media() pass if __name__ == '__main__': main()