当前位置:首页 » Python技术

selenium + python之元素定位(三)

2014-03-04 11:10 本站整理 浏览(19285)

selenium + python之元素定位(三),有需要的朋友可以参考下。


seleniumweb各元素的操作首先就要先定位元素,定位元素的方法主要有以下几种:



  • 通过id定位元素:find_element_by_id("id_vaule")
  • 通过name定位元素:find_element_by_name("name_vaule")
  • 通过tag_name定位元素:find_element_by_tag_name("tag_name_vaule")
  • 通过class_name定位元素:find_element_by_class_name("class_name")
  • 通过css定位元素:find_element_by_css_selector();css定位是比较灵活的
  • 通过xpath定位元素:find_element_by_xpath("xpath")
  • 通过link定位:find_element_by_link_text("text_vaule")或者find_element_by_partial_link_text()

以百度首页为例:下面是百度输入框的html代码,可以通过firebug或者谷歌的审查元素或得


<input type="text"name="wd" id="kw1" maxlength="100"style="width:474px;"


autocomplete="off">


1.通过id定位,则百度的输入框即可表示为:find_element_by_id("kw1")


2.通过name定位则可以表示为:find_element_by_name("wd")


3.通过tag_name定位:input其实就是tag_name(标签名),同样也可以表示成:


find_element_by_tag_name("input")


下面是百度一下按钮的html


<span class="btn_wr">


<inputtype="submit" value="百度一下"
id="su1" class="btn" onmousedown=


"this.className='btnbtn_h'" onmouseout="this.className='btn'">


</span>


4.通过class_name定位,百度一下按钮则可以表示成find_element_by_class_name("btn_wr")


5.通过css定位,这个比较灵活,想要完全弄懂,花费的时间是


比较多的,个人觉得没有必要


百度输入框


<input


type="text" name="wd"id="kw1" maxlength="100"style="width:474px;"autocomplete="off">



  • 如取id,百度输入框则可以表示为:find_element_by_css_selector("a[id=\"kw1\"]")
  • 如取name,又可以表示为:find_element_by_css_selector("a[name=\"wd\"]")
  • <aonclick="queryTab(this);"mon="col=502&pn=0"title="web"href="http://www.baidu.com/">网页</a>
  • 还可以用title,如百度的网页链接可以表示为find_element_by_css_selector("a[title=\"web\"]")

<aclass="RecycleBinxz"href="javascript:void(0);">



  • 也同样可以用class,上面的代码有可以用find_element_by_css_selector("a.RecycleBin")

6.通过XPath定位


首先我们要了解XPath是上面东西,XPath是一种在XML


文档中定位元素的语言。因为HTML可以看做XML的一种实现,


所以selenium用户可是使用这种强大语言在web应用中定


位元素,详情请阅读:


什么是XPathhttp://www.w3.org/TR/xpath/
XPath基础教程:http://www.w3schools.com/xpath/default.asp


selenium中被误解的XPath


http://magustest.com/blog/category/webdriver/


xpath:attributer(属性)


driver.find_element_by_xpath("//input[@id='kw1']")


表示input标签下id =kw1的元素



xpath:idRelative(id相关性)


driver.find_element_by_xpath("//div[@id='fm']/form/span/input")


表示在/form/span/input层级标签下有个div标签的id=fm的元素



driver.find_element_by_xpath("//tr[@id='check']/td[2]")


表示id为'check'的tr,定闪他里面的第2个td



xpath:position(位置)


driver.find_element_by_xpath("//input")


driver.find_element_by_xpath("//tr[7]/td[2]")


表示第7个tr里面的第2个td



xpath: href(水平参考)


driver.find_element_by_xpath("//a[contains(text(),'网页')]")


表示在a标签下有个文本(text)包含(contains)'网页' 的元素



xpath:link


driver.find_element_by_xpath("//a[@href='http://www.baidu.com/']")


表示有个叫a的标签,他有个链接href='http://www.baidu.com/的元素


7.通过link定位


有时候不是一个输入框也不是一个按钮,而是一个文字链接,我们可以通过link


#coding=utf-8



fromseleniumimportwebdriver


importtime


df = webdriver.Firefox() #选择firefox浏览器


df.get("http://www.baidu.com") #打开百度网页


time.sleep(2) #暂停2秒,不是毫秒


df.find_element_by_link_text("贴 吧").click() #点击贴吧链接


time.sleep(2)


df.quit() #关闭浏览器



PartialLinkText定位


通过部分链接定位,这个有时候也会用到,我还没有想到很好的用处。拿上面的例子,我可以只用链接的一部分文字进行匹配:


browser.find_element_by_partial_link_text("贴").click()



通过find_element_by_partial_link_text()函数,我只用了“贴”字,脚本一样找到了"贴吧"的链接