本帖最后由 YXK 于 2019-8-1 19:08 编辑
写码不易........给波分吧!
需要用到的python库
pip install xlrd
pip install selenium
安装webdriver
各大浏览器webdriver地址可参见:https://docs.seleniumhq.org/download/
Firefox:https://github.com/mozilla/geckodriver/releases/
Chrome:https://sites.google.com/a/chromium.org/chromedriver/ 或者
http://chromedriver.storage.googleapis.com/index.html
IE:http://selenium-release.storage.googleapis.com/index.html
注:webdriver需要和对应的浏览器版本以及selenium版本对应下面是源码
功能是读取一个表格里面的值 并以数组的方式返回
[Python] 纯文本查看 复制代码 import xlrd
def getUrl(dizhi):
data = xlrd.open_workbook(dizhi) #文件全路径
table=data.sheet_by_index(0)
nrows = table.nrows
all_url=[]
for i in range(0,nrows):
call_url = table.cell(i, 3).value #取字段3的值
all_url.append(call_url) #加入数组
return all_url
通过以上代码获取到每个微博URL 然后用selenium进行后台截图
[Python] 纯文本查看 复制代码 from xlrdtest import getUrl #引用自写的方法
from selenium import webdriver
from time import sleep
wenjianDizhi = "C:\\Users\\Administrator\\Desktop\\网安工作\\1.xlsx"
allUrl = getUrl(wenjianDizhi)
options = webdriver.ChromeOptions()
options.add_argument('--kiosk')
options.add_argument('--headless')
driver = webdriver.Chrome(chrome_options=options)
driver.set_window_size(1400,900) #设置浏览器宽高
i = 1
for i in range(1,len(allUrl)):
driver.get(str(allUrl[i]))
sleep(5)
picture_url = driver.get_screenshot_as_file('imgs\\%s.png'%i)
if picture_url == True:
print("%s:截图成功!" %allUrl[i])
print("截图全部完成....")
driver.quit() |