[关闭]
@mwumli 2015-11-19T14:38:14.000000Z 字数 5093 阅读 13121

使用 Selenium with Python 进行 web 自动化测试

测试


配置使用环境

  1. 安装 python

    • python 官方站点
    • 记得把配置 python 安装目录以及安装目录下的 scripts 目录到 PATH 环境变量下
  2. python 的基础包工具 -- setuptools

  3. 安装 pip

  4. 安装 selenium : pip install -U selenium

  5. 下载相应的浏览器驱动, Firefox 是默认的
    本文以 chrome 为主
    ChromeDriver 官方下载地址 : 所有版本的 ChromeDriver
    下载完成放到 python 安装目录

文档参考

  1. 简明 Python 教程
  2. Python教程 - 廖雪峰
  3. 官方文档 : Selenium with Python
  4. webdriver实用指南ruby版本
  5. webdriver实用指南java版本
  6. webdriver实用指南python版本

一份简单的测试 demo

关于 360 haosou.com 的测试 :

  1. #coding=utf-8
  2. from selenium import webdriver
  3. import os
  4. import time
  5. # set little time stop and big time stop for viewing changes
  6. little_time_stop = 1
  7. big_time_stop = 2
  8. # 默认广告条数
  9. ads_num_require = 8
  10. # 请求连接
  11. req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
  12. # 打开浏览器
  13. print "Opening chrome ..."
  14. browser = webdriver.Chrome()
  15. # 开始请求
  16. print "Visit %s ..." %(req_url)
  17. browser.get(req_url)
  18. # 获取所有的广告
  19. print "Get all advertisement ..."
  20. all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
  21. # 当前广告条数
  22. ads_num_current = len(all_ads_li)
  23. print "Has been got %d ads" %(ads_num_current)
  24. # 如果广告条数与默认不符
  25. if ads_num_current < ads_num_require:
  26. print "The number of ads is not enough ( current : %d require: %d)" %(ads_num_current,ads_num_require)
  27. # exit()
  28. # 获取顶部连接
  29. i = 0
  30. for ads_li in all_ads_li:
  31. time.sleep(big_time_stop)
  32. i = i+1
  33. print "ads %d :" %i
  34. try:
  35. main = ads_li.find_element_by_css_selector('h3 a')
  36. except:
  37. print "\tError: ads %d cann't find" %(i)
  38. else:
  39. print "\tReady: visit ads %d" %(i)
  40. main.click()
  41. print "\tSucess: visit ads %d" %(i)
  42. time.sleep(little_time_stop)
  43. try:
  44. img_link = ads_li.find_element_by_class_name('e_biyi_img')
  45. except:
  46. print "\tError : no img in ads %d " %(i)
  47. else:
  48. print "\tReady : visit img_link %d" %(i)
  49. img_link.click()
  50. print "\tSuccess : visit img_link %d" %(i)
  51. time.sleep(little_time_stop)
  52. try:
  53. child_div = ads_li.find_element_by_class_name('e_biyi_childLink');
  54. except:
  55. print "\tError : no child link in ads %d" %(i)
  56. else:
  57. try:
  58. child_links = child_div.find_elements_by_css_selector('a')
  59. except:
  60. print "\tError : find child_links error"
  61. else:
  62. num_links = len(child_links)
  63. print "\tSuccess : there are %d child_links" %(num_links)
  64. j = 0
  65. for child_a in child_links:
  66. j = j + 1
  67. print "\t\tReady : visit child link %d in ads %d" %(j, i)
  68. child_a.click()
  69. print "\t\tSuccess : visit child link %d in ads %d" %(j, i)
  70. time.sleep(little_time_stop)
  71. print "End and thanks for your using!"
  72. # 下面代码选择取消注释
  73. # 延时
  74. # time.sleep(5)
  75. # 关闭当前窗口
  76. # browser.close()
  77. # 关闭所有已经打开的窗口
  78. # browser.quit()

待改进

  1. 应该使用自动填充内容到搜索输入框, 然后通过点击 好搜一下 去搜索
    • 360 haosou 的每次搜索有一个随机生成的参数 psid, 不知道有什么特别的作用
      不过为了测试的准确性,应该避免这样请求
    • 换成输入搜索内容, 这样更方便使用
  2. 应该在每一步访问后, 等待下一步执行询问
    自动访问这样毕竟太快了,虽然有日志在控制台输出, 但是有些效果需要看 UI

定位操作

以下是所有定位操作的 API :

  1. # 返回一个匹配元素, 即一个 WebElement 元素
  2. find_element_by_id()
  3. find_element_by_name()
  4. find_element_by_class_name()
  5. find_element_by_tag_name()
  6. find_element_by_link_text()
  7. find_element_by_partial_link_text()
  8. find_element_by_xpath()
  9. find_element_by_css_selector()
  10. # 返回一个列表, 包含所有匹配的元素, 即一个 WebElement 列表
  11. find_elements_by_id()
  12. find_elements_by_name()
  13. find_elements_by_class_name()
  14. find_elements_by_tag_name()
  15. find_elements_by_link_text()
  16. find_elements_by_partial_link_text()
  17. find_elements_by_xpath()
  18. find_elements_by_css_selector()

关于 API 的具体介绍, 请参考 :
module-selenium.webdriver.chrome.webdriver

使用的时候需注意下面几点 :

  1. python selenium 提供了两种对象 : WebDriverWebElement
    这两种对象都可以使用这些 API
  2. 这些 API 一旦执行失败(即查找不到), 就会抛出异常
    因此必须使用 try: .. except: ... 机制避免错误的行为影响程序继续进行
  3. WebDriver 调用以上 API 进行全局定位
    WebElement 调用以上 API 可以进行层级定位, 即 查找当前元素的子元素

WebDriver 的使用

开始的时候必须要有初始化一个 WebDriver 实例, 即下面的 browser 用来对浏览器进行控制以及页面的访问

  1. # 请求连接
  2. req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
  3. # 打开浏览器
  4. print "Opening chrome ..."
  5. browser = webdriver.Chrome()
  6. # 开始请求
  7. print "Visit %s ..." %(req_url)
  8. browser.get(req_url)

接着, 就可以使用异常 API 进行当前页面的全局查找, 比如 :

  1. # 获取所有的广告
  2. print "Get all advertisement ..."
  3. all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')

WebElement 的使用

  1. 使用 browser.find_element_by_xx() 得到的是一个 WebElement 实例
    使用获得的实例调用上面的 API 即可进行层级查找

  2. 使用 browser.find_elements_by_xx() 的到的是一个元素是 WebElement 实例的 list
    通过对 list 的遍历, 即可对各个实例进行相应的操作

WebDriver 的一些常用操作

  1. browser.curren_url : 获取当前加载页面的 URL
  2. browser.close() : 关闭当前窗口, 如果当前窗口是最后一个窗口, 浏览器将关闭
  3. browser.quit() : 关闭所有窗口并停止 ChromeDriver 的执行
  4. browser.add_cookie(cookie_dict) : 为当前会话添加 cookie
    browser.get_cookie(name) : 得到执行 cookie
    browser.get_cookies() : 得到所有的 cookie

    driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’, ‘secure’:True})
    
  5. browser.delete_all_cookies() : 删除当前会话的所有cookie
    browser.delete_cookie(name) : 删除指定 cookie

  6. browser.back() : 相当于浏览器的后退历史记录
  7. browser.forward() : 相当于浏览器的前进历史记录
  8. browser.execute_script(script, *args) : 同步执行 js 脚本
    browser.execute_async_script(script, *args) : 异步执行 js 脚本
  9. browser.get(url) : 在当前窗口加载 url
  10. browser.refresh() : 刷新当前页面
  11. browser.current_window_handle : 当前窗口的 handle, 相当于一个指针一样的东西, 用来指向当前窗口
  12. browser.window_handles : 当前浏览器中的已经打开的所有窗口, 是一个 list
  13. browser.switch_to_window(window_handle) : 切换 window_handle 指向的窗口
  14. browser.title : 当前页面的 title
  15. browser.name : 当前浏览器的名字

具体参照 : module-selenium.webdriver.remote.webdriver

WebElement 的一些常用操作

  1. webEle.clear() : 清楚元素的内容, 假如这个元素是一个文本元素
  2. webEle.click() : 点击当前元素
  3. webEle,is_displayed() : 当前元素是否可见
  4. webEle.is_enabled() : 当前元素是否禁止, 比如经常会禁用一些元素的点击
  5. webEle.is_selected() : 当前元素是否选中, 文本输入框的内容
  6. webEle.send_keys(*value) : 向当前元素模拟键盘事件
  7. webEle.submit() : 提交表单
  8. webEle.tag_name : 当前元素的标签名
  9. webEle.text : 当前元素的内容
  10. webEle.get_attribute(name) : 获取当前元素执行属性的值

具体参照 : module-selenium.webdriver.remote.webelement

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注