时间:2020-10-21 11:07:41 | 栏目:Python代码 | 点击:次
进程池
代码演示
方式一
from multiprocessing import Pool def deal_task(n): n -= 1 return n if __name__ == '__main__': n = 10 p = Pool(4) for i in range(4): res = p.apply(deal_task, args=(n,)) #调用apply是一个串行的效果,任务会被进程一个一个的处理,直接得到结果 #前提是执行的任务必须要有返回值 print(res)
方式二
from multiprocessing import Pool def deal_task(n): n -= 1 return n if __name__ == '__main__': n = 10 p = Pool(4) obj_l = [] for i in range(4): #调用apply_async会返回一个对象,主进程会不断扔任务给线程池,让子线程处理 obj = p.apply_async(deal_task, args=(n,)) obj_l.append(obj) #首先函数要有返回值 #调用close目的是防止join期间会有别的任务被添加到任务列表中 #不调用close会报错 p.close() p.join() #join是要让子进程全部处理完之后得到结果统一处理,还有一个非常重要的原因是进程池依附于主进程,主进程结束,进程池消失。进程池的任务没有被处理程序就结束了。 for obj in obj_l: print(obj.get())
方式三
from multiprocessing import Pool import requests def get_page(url): ret = requests.get(url).text return {'url': url, 'ret': ret} def parse_page(ret): with open('ab.txt', 'a') as f: f.write('%s - %s\n' % (ret['url'], len(ret['ret']))) if __name__ == '__main__': urls = [ 'https://www.baidu.com', 'http://www.openstack.org', 'https://www.python.org', 'https://help.github.com/', 'http://www.sina.com.cn/' ] p = Pool() for url in urls: #使用回调函数,当get_page下载完后,主线程调用parse_page自动处理get_page下载的结果,节省了parse_page的时间,该场景用于一个函数为耗时操作并且产生数据,另一个函数是非耗时操作,这样就节省了非耗时操作函数的时间 p.apply_async(get_page, args=(url,), callback=parse_page) p.close() p.join() print('主')
join是要让子进程全部处理完之后得到结果统一处理,还有一个非常重要的原因是进程池依附于主进程,主进程结束,进程池消失。进程池的任务没有被处理程序就结束了。