• 保存到桌面加入收藏设为首页
技术文章

Python多线程采集百度相关搜索关键词工具带exe程序!

时间:2019-05-18 20:15:51   作者:234IT   来源:234IT   阅读:4999   评论:0
内容摘要:Python多线程采集百度相关搜索关键词工具带exe程序!?01020304050607080910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455......
Python多线程采集百度相关搜索关键词工具带exe程序!
 
?
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
#百度相关搜索关键词抓取,读取txt关键词,导出txt关键词
 
# -*- coding=utf-8 -*-
import requests
import re
import time
from multiprocessing.dummy import Pool as ThreadPool
 
 
#百度相关关键词查询
def xgss(url):
    headers = {
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"
    }
    html=requests.get(url,headers=headers).text
    #print(html)
    ze=r'<div id="rs"><div class="tt">相关搜索</div><table cellpadding="0">(.+?)</table></div>'
    xgss=re.findall(ze,html,re.S)
    #print(xgss)
    xgze=r'<th><a href="(.+?)">(.+?)</a></th>'
    sj=re.findall(xgze,str(xgss),re.S)
    #print(sj)
    gjc=''
    for x in sj:
        print(x[1])
        gjc=gjc+x[1]+'\n'
 
    # 导出关键词为txt文本
    with open(".\gjcsj.txt", 'a', encoding='utf-8') as f:
        f.write(gjc)
    print("-----------------------------------")
    return gjc
 
 
print("程序运行,正在导入关键词列表!!!")
print("-----------------------------------")
# 导入要搜索的关键词txt列表
urls = []
data = []
for line in open('.\gjc.txt', "r", encoding='utf-8'):
    data.append(line)
print("导入关键词列表成功!")
print("-----------------------------------")
 
#转换关键词为搜索链接
for keyword in data:
    url = 'https://www.baidu.com/s?wd=' + keyword
    urls.append(url)
 
print("采集百度相关搜索关键词开启!")
print("...................")
#多线程获取相关关键词
try:
    # 开4个 worker,没有参数时默认是 cpu 的核心数
    pool = ThreadPool()
    results = pool.map(xgss, urls)
    pool.close()
    pool.join()
    print("采集百度相关搜索关键词完成,已保存于gjcsj.txt!")
except:
    print("Error: unable to start thread")
 
print("8s后程序自动关闭!!!")
time.sleep(8)


Python多线程采集百度相关搜索关键词工具带exe程序! 

附exe百度云地址:链接: https://pan.baidu.com/s/13WFumzmgOH3yTUGex1rYvA 提取码: djmw 

直接修改关键词文本列表 gjc.txt即可使用!

***********************************本站申明****************************************

234IT官方友情提示:

1、我们的官方网址是:http://www.234it.cn/
2、本站杜绝收费会员制!本站终身免费学习下载分享~
3、请勿轻信任何软件上或教程上收徒或其他服务项目,网络有风险!
4、本站软件需自行检测有无后门或病毒,如有恶意软件请于小编联系进行删除!
5、本站部分内容收集于互联网,如果有侵权内容、不妥之处,请联系我们删除。敬请谅解!

感谢大家一路的支持,有什么好的建议或者意见发至邮箱vipfengzivip@qq.com


免责声明:
234IT所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。


标签:搜索  关键  程序  工具  采集  

本站部分内容收集于互联网,如果有侵权内容、不妥之处,请联系我们删除。敬请谅解!

发邮件至:vipfengzivip@qq.com  

二三四网 ( 浙ICP备14041900号-12)
Powered by OTCMS V3.72