Selenium基础

avatar
作者
筋斗云
阅读量:1

1. selenium简介

用于实现自动化测试的 python 包,使用前需要安装对应浏览器驱动

from time import sleep from selenium import webdriver option = webdriver.ChromeOptions() # 指定chrome存储路径的二进制形式 option.binary_location='D:\Chrome\Google\Chrome\Application\chrome.exe' # 获取谷歌浏览器驱动 driver = webdriver.Chrome(options=option) # 浏览器访问指定网站 driver.get('http://www.baidu.com') # 3秒后浏览器关闭 sleep(3) 

2. 控制组件的各种方式

# 在输入方法之前一定要清空操作 # 输入值为value的方法【文件上传按钮也使用send_keys(path)而不是click】 # ele为定位到的组件 ele.send_keys(value)  # 点击方法 ele.click()  # 清空 ele.clear()  

driver.find_element(s)

# 定位到id值为user的组件,并将'admin'填入 # by另外还能填name,class_name,xpath,css_selector等,返回WebElement单个元素 driver.find_element(by='id',value='user').send_keys('admin') 
from selenium.webdriver.common.by import By # find_elements中有s时,by参数需要传入By.xx属性,结果返回是list,装载多个WebElement元素 # 定位到tag为input的组件,并将'admin'填入第一个input组件中 driver.find_elements(by=By.TAG_NAME,value='input')[0].send_keys('admin') 

超链接LINK_TEXT和PARTIAL_LINK_TEXT

from time import sleep from selenium import webdriver from selenium.webdriver.common.by import By option = webdriver.ChromeOptions() # 指定chrome存储路径的二进制形式 option.binary_location='D:\Chrome\Google\Chrome\Application\chrome.exe' driver = webdriver.Chrome(options=option) # r是告知字符串内无转义字符 url = r'D:\个人\学习资料\黑马程序员\Web自动化\web自动化_day01_课件+笔记+资料+代码\02_其他资料\注册实例.html' # 打开url对应的网页 driver.get(url) # a标签精确匹配,定位到超链接内容为'注册A网页'的地方 # ele = driver.find_elements(by=By.LINK_TEXT,value='注册A网页') # a标签模糊匹配,定位到所有超链接内容包含'注册'的地方 ele = driver.find_elements(by=By.PARTIAL_LINK_TEXT,value='注册') # 选择第二个定位到的超链接并点击 ele[1].click() # 线程暂停3秒 sleep(3) # 浏览器关闭 driver.quit() 

2.1 XPath定位

XPath是xml path的简称。在html页面中,各组件都有自己的层级结构,通过类似路径的方式定位到组件

如何在Chrome中查找和验证XPath

  1. 通过绝对路径进行定位,以 /html 开头

    image-20231031154057079
  2. 通过相对路径进行定位,以为 // 开头【后续分隔依然是/】

    image-20231031154840149
  3. 路径 + 属性 + 逻辑 进行定位

    image-20231031155804262
    # 对应的实现代码 ele = driver.find_elements(by=By.XPATH,                 value="//p[@id='login_user']/input[@name='user-test' and @class='login']") 
  4. 通过 xpath 内置方法定位

    # 定位到所有标签中文本内容为xxx的元素 //*[text()='xxx'] # 定位到属性中含有xxx的元素【这里的attribute是泛指,可以是id,name等】 //*[contains(@attribute,'xxx')] # 属性以xxx开头的元素 //*[starts-with(@attribute,'xxx')] 

2.2 css选择器

CSS 是一种标记语言,用于控制元素的显示样式,在 css 标记语言中找元素使用 css 选择器,极力推荐使用,查找元素的效率比 Xpath 高,语法比 Xpath 更简单

  1. id 选择器(前提:元素是必须有 id 属性)

    // 定位到id值为user的元素 #user 
    # 将name属性为user的第一个元素赋值为admin ele = driver.find_elements(by=By.CSS_SELECTOR,value="[name='user']") ele[0].send_keys('admin') 
  2. class 选择器(前提:元素是必须有 class 属性)

    // 定位到class值为group的元素 .group 
  3. 元素选择器

    // 定位到input标签的元素 input 
  4. 属性选择器

    // 定位到name属性为admin的元素【任意属性都可以使用这种方法进行定位】 [name='admin'] // input标签中type属性以p字母开头的元素 input[type^='p'] // input标签中type属性以p字母结束的元素 input[type$='p'] // input标签中type属性包含p字母的元素 input[type*='p'] 
  5. 层级选择器

    // 定位到严格在p下一层的input元素 p>input // 定位到p下方的input【只要在下方即可】 p input 

3. 浏览器常用API

# 最大化浏览器 driver.maximize_window()  # 设置浏览器大小 单位像素 driver.set_window_size(w, h)  # 设置浏览器位置 driver.set_window_position(x, y)  # 后退操作 driver.back()  # 前进操作 driver.forward() # 刷新操作 driver.refresh()  # 关闭当前主窗口(主窗口:默认启动哪个界面,就是主窗口) driver.close()  # 关闭由driver对象启动的所有窗口 driver.quit()  # 获取当前页面title信息 driver.title  # 获取当前页面url信息 drive.current_url  
  • driver.title 和 driver.current_url 没有括号,一般为判断上步操作是否执行成功

  • driver.maximize_window() 一般为我的前置代码,在获取 driver 后,直接编写最大化浏览器

  • driver.close() 与 driver.quit() 区别

    如果当前只有 1 个窗口,close 与 quit 没有任何区别

    • close():关闭当前主窗口
    • quit():关闭由 driver 对象启动的所有窗口

4. 元素信息操作API

获取各组件属性值相关API,如获取id,name等属性

# 获取元素文本 ele.text #获取元素大小   ele.size # 获取元素id属性值 ele.get_attribute("id") # 判断元素是否可见 ele.is_displayed() # 判断元素是否可用 ele.is_enabled() # 判断元素是否被选中 ele.is_selected() 
  • text 和 size 调用时 无括号
  • get_attribute 一般应用场景:判断一组元素是否为想要的元素或者判断元素属性值是否正确
  • is_displayed、is_enabled、is_selected,在特殊应用场景中使用

5. 鼠标操作API

通过鼠标操作API模拟测试鼠标的各种效果

双击 # 鼠标事件对应的方法在哪个类中ActionChains类中 from selenium.webdriver.common.action_chains import ActionChains action = ActionChains(driver) # 所有操作均需经过perform()方法才能展示效果,当需要模拟多步操作时将perform()放在最后执行 # 右击 action.context_click(ele).perform() # 双击 action.double_click(ele).perform() # 拖拽【source是需要拖拽的组件,target是目标位置组件】 action.drag_and_drop(source,target).perform() # 根据偏移量拖拽 action.drag_and_drop_by_offset(source,xoffset,yoffset) # 悬停 action.move_to_element(ele).perform() 

6. 键盘操作API

from selenium.webdriver.common.keys import Keys # 删除键 ele.send_keys(Keys.BACK_SPACE) # 空格键 ele.send_keys(Keys. SPACE) # 制表键 ele.send_keys (Keys.TAB) # 回退键 ele.send_keys(Keys.ESCAPE) # 回车键 ele.send_keys(Keys.ENTER) # 全选 ele.send_keys(Keys.CONTROL , 'a') # 复制 ele.send_keys(Keys.CONTROL , 'c') 

7. 元素等待

由于电脑配置或网络原因,在查找元素时,元素代码未在第一时间内被加载出来,而抛出未找到元素异常。元素在第一次未找到时,元素等待设置的时长被激活,如果在设置的有效时长内找到元素,继续执行代码,

7.1 隐式等待

设置后对所有组件都会等待

# 找不到组件时等待10秒 driver.implicitly_wait(10) 

7.2 显示等待

只等待指定组件

from selenium.webdriver.support.wait import WebDriverWait # 每隔0.5秒尝试寻找一次id值为d的组件,共持续10秒 wait_rule = WebDriverWait(driver,timeout=10,poll_frequency=0.5) # until()参数为匿名函数,其中x是创建等待规则时传入的driver类 # 按照wait_rule的规则寻找id为user的组件 ele = wait_rule.until(lambda x:x.find_element_by_id("#user")) # 设置组件值 ele.send_keys("admin") 

8. 下拉框API

操作下拉框对应API,用 css 选择器配合 click 也可达到同样效果,使用 Select 则不需要使用 click

from selenium.webdriver.support.select import Select # ele是下拉框对应的标签<select>,定位至select标签 s = Select(ele) # 通过下标定位【从1开始】 s.select_by_index()  # 通过value属性定位 s.select_by_value()  # 通过下拉框文本定位 s.select_by_visible_text()  

9. 弹窗处理

如果页面由弹出框【alert 警告框,confirm 确认框,prompt 提示框】,不处理,接下来的操作将不生效。

无论以上哪个对话框,都可以使用取消、同意,因为调用的是后台的事件,与页面显示按钮数量无关

# 获取对话框对象,统一转换为此对象处理 al = driver.switch_to.alert # 获取对话框文本 al.text  # 对话框确认按钮 al.accept()  # 对话框取消按钮 al.dismiss()  

10. 滚动条

在 web 自动化中有些特殊场景,如:滚动条拉倒最底层,指定按钮才可用,Selenium 中没有提供直接操作滚动条的API,但是可以通过执行 JS 语句完成此项工作

# 0是左边距【水平滚动条】,10000是上边距【垂直滚动条】,越界时拉到底 # 此处js作用是将滚动条垂直拉到底 js = "window.scrollTo(0,10000)" # 执行js方法 driver.execute_script(js) 

11. 同一页面内窗口切换

常用的 frame 表单有两种:frame、iframe

# 使用css语法可以定位至对于frame位置【可以使用name、id、iframe元素】 driver.switch_to.frame("id\name\element") # 操作完毕后需要切换为主目录才能再次操作其余frame driver.switch_to.default_content() 

12. 多窗口切换

多个浏览器窗口间切换

# 获取当前主窗口句柄 driver.current_window_handle  # 获取当前由driver启动所有窗口句柄 driver.window_handles # 切换至最开启的窗口 driver.switch_to.window(driver.window_handles[-1])  

13. 截图

# 截图并保存至指定位置【png格式】 driver.get_screenshot_as_file(imgepath) # 使用时间戳对事件命名 driver.get_screenshot_as_file("../image/%s.png"%(time.strftime("%Y_%m_%d %H_%M_%S"))) 

14. 验证码

验证码通常是为了放置恶意请求,因此程序不好直接控制,在测试环境下,通常对于验证码有如下策略

  1. 去掉验证码(项目在测试环境、公司自己的项目)

  2. 设置万能验证码(测试环境或线上环境,公司自己项目)

  3. 使用验证码识别技术 (由于现在的验证码千奇百怪,导致识别率太低)

  4. 使用cookie解决【推荐】

    部分网站是动态生成的cookie则无法使用这种方法

    • cookie 由服务器生成,标识一次对话的状态(登录的状态)
    • 浏览器自动记录 cookie,在下一条请求时将 cookie 信息自动附加请求
# 获取所有的cookie driver.get_cookies()  # 设置cookie driver.add_cookies(字典)  

15. PO模式

PO(Page Object),页面对象,将自动化涉及的页面或模块封装成对象,其主要有以下两个好处:

  1. 代码复用性
  2. 便于维护(脚本层和业务分类),如果元素信息变化了也不用修改脚本

PO 模式通常会将代码分为以下几个部分:

  • Base 层

    存放所有页面公共方法,如定位到某个元素的方法

  • Page 层

    基于页面或模块单独封装当前页面要操作的对象,是具体的业务操作,如输入用户名密码

  • Script 层

    脚本层 + UnitTest,获取浏览器对象,调用 Page 层的方法进行操作

案例:使用 PO 模式测试网站登录功能

image-20240315151022422image-20240315151440813

base.py

from selenium.webdriver.support.wait import WebDriverWait class Base:     # 在获取浏览器对象后才有后续一系列操作     def __init__(self,driver):         self.driver = driver     # 切换浏览器窗口     def base_switch_win(self,index=-1):         # -1代表最新打开的窗口,0为主窗口         self.driver.switch_to.window(self.driver.window_handles[index])     # 查找元素【loc为(By.xxx,查询目标)】     def base_find(self,loc,timeout=10,frequency=0.5):         # 显式等待10秒,每隔0.5秒问询一次         return WebDriverWait(self.driver,timeout,frequency).until(lambda x:x.find_element(*loc))     # 输入方法     def base_input(self,loc,value):         ele = self.base_find(loc)         ele.clear()         ele.send_keys(value)     # 点击方法     def base_click(self,loc):         self.base_find(loc).click()     # 获取文本值     def base_text(self,loc):         ele = self.base_find(loc)         return ele.text 

page_login.py

from ..base.base import Base from selenium.webdriver.common.by import By # 参数定位方式 keywords = By.CSS_SELECTOR,'#keywords' password = By.CSS_SELECTOR,'#password' login = By.CSS_SELECTOR,'#login-btn' nickname = By.CSS_SELECTOR,'.a-link1'  class Page(Base):     # 切换到最新的窗口     def page_switch(self,index):         self.base_switch_win(index)     # 输入用户名     def page_insert_keywords(self,value):         self.base_input(keywords,value)     # 输入密码     def page_insert_password(self,value):         self.base_input(password, value)     # 点击登录按钮     def page_click_login(self):         self.base_click(login)     # 获取登录成功后的用户名     def page_get_nickname(self):         return self.base_text(nickname)     # 封装登录业务     def page_login(self,username,pwd):         self.page_insert_keywords(username)         self.page_insert_password(pwd)         self.page_click_login() 

test01_login.py

import time import unittest from selenium import webdriver from ..page.page_login import Page from parameterized import parameterized class TestLogin(unittest.TestCase):     # 每个方法执行前的操作     def setUp(self) -> None:         option = webdriver.ChromeOptions()         # 设置浏览器启动地址         option.binary_location = 'D:\Chrome\Google\Chrome\Application\chrome.exe'         # 获取浏览器实例对象driver         self.driver = webdriver.Chrome(options=option)         # 最大化窗口         self.driver.maximize_window()         # 打开浏览器         self.driver.get('http://xxxxx')         # 获取登录页面示例对象         self.login = Page(self.driver)     # 每个方法执行后的操作     def tearDown(self) -> None:         self.driver.quit()     # 参数化管理数据     @parameterized.expand((('123xxxxx','a1xxxxxxx'),))     def test001_login(self,keywords,password):         # 执行登录操作         self.login.page_login(keywords,password)         # 休眠一段时间等待新页面跳出         time.sleep(5)         # 切换浏览器窗口         self.login.page_switch(index=-1)         # 获取关键信息         name = self.login.page_get_nickname()         # 断言         self.assertEqual(keywords,name) 
image-20240315153206684

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!