python selenium 获取接口数据。

selenium没有直接提供查询的函数,但是可以通过webdriver提供的api查询,使用的函数是network.getresponsebody

webdriver提供的api文档:https://chromedevtools.github.io/devtools-protocol/tot/network/

network.getresponsebody文档说明:

network.getresponsebody的参数是requestid,requestid是webdriver每个请求自动生成的惟一id,拿到requestid就能拿到请求返回的内容。

如何获取requestid?创建webdriver对象时配置信息设置获取performance,即可获取每个请求的日志信息,然后通过对日志信息的检索找到对应的requestid。

获取日志信息的webdriver创建代码(注意,必须传入配置信息才能获取日志信息):

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import desiredcapabilities
import time
 
caps = {
  'browsername': 'chrome',
  'loggingprefs': {
    'browser': 'all',
    'driver': 'all',
    'performance': 'all',
  },
  'goog:chromeoptions': {
    'perfloggingprefs': {
      'enablenetwork': true,
    },
    'w3c': false, 
  },
}
driver = webdriver.chrome(desired_capabilities=caps)
 
driver.get('https://partner.oceanengine.com/union/media/login/')
# 必须等待一定的时间,不然会报错提示获取不到日志信息,因为絮叨等所有请求结束才能获取日志信息
time.sleep(3)
 
request_log = driver.get_log('performance')

打印request_log是一个数组,然后遍历request_log检索需要获取的url对应的requestid,比如需要获取,并且获取接口内容:

for i in range(len(request_log)):
  message = json.loads(request_log[i]['message'])
  message = message['message']['params']
  # .get() 方式获取是了避免字段不存在时报错
  request = message.get('request')
  if(request is none):
    continue
 
  url = request.get('url')
  if(url == "https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json"):
    # 得到requestid
    print(message['requestid'])
    # 通过requestid获取接口内容
    content = driver.execute_cdp_cmd('network.getresponsebody', {'requestid': message['requestid']})
    print(content)
    break

完整代码:

import json
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import desiredcapabilities
import time
 
caps = {
  'browsername': 'chrome',
  'loggingprefs': {
    'browser': 'all',
    'driver': 'all',
    'performance': 'all',
  },
  'goog:chromeoptions': {
    'perfloggingprefs': {
      'enablenetwork': true,
    },
    'w3c': false, 
  },
}
driver = webdriver.chrome(desired_capabilities=caps)
 
driver.get('https://partner.oceanengine.com/union/media/login/')
# 必须等待一定的时间,不然会报错提示获取不到日志信息,因为絮叨等所有请求结束才能获取日志信息
time.sleep(3)
 
request_log = driver.get_log('performance')
print(request_log)
 
for i in range(len(request_log)):
  message = json.loads(request_log[i]['message'])
  message = message['message']['params']
  # .get() 方式获取是了避免字段不存在时报错
  request = message.get('request')
  if(request is none):
    continue
 
  url = request.get('url')
  if(url == "https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json"):
    # 得到requestid
    print(message['requestid'])
    # 通过requestid获取接口内容
    content = driver.execute_cdp_cmd('network.getresponsebody', {'requestid': message['requestid']})
    print(content)
    break

到此这篇关于python selenium 获取接口数据的实现的文章就介绍到这了,更多相关python selenium 获取接口数据内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!