python网页自动化脚本学习Python selenium自动化网页抓取器-268辅助卡盟网

python网页自动化脚本学习Python selenium自动化网页抓取器

直接入正题---Python selenium自动控制浏览器对网页的数据进行抓取，其中包含按钮点击、跳转页面、搜索框的输入、页面的价值数据存储、mongodb自动id标识等等等。

1、首先介绍一下 Python selenium ---自动化测试工具，用来控制浏览器来对网页的操作，在爬虫中与BeautifulSoup结合那就是天衣无缝，除去国外的一些变态的验证网页python网页自动化脚本，对于图片验证码我有自己写的破解图片验证码的源代码，成功率在85%。

详情请咨询QQ群--607021567（这不算广告，群里有好多Python的资源分享，还有大数据的一些知识【hadoop】）

2、beautifulsoup就不需要详细的介绍了，直接上网址:：（BeautifulSoup的官方文档）

3、关于mongodb的自动id的生成。mongodb中所有的存储数据都是有固定的id的，但是mongodb的id对于人类来讲是复杂的，对于机器来讲是小菜一碟的辅助论坛，所以在存入数据的同时，我习惯用新id来对每一条数据的负责！

在Python中使用mongodb的话需要引进模块 from pymongo import MongoClient,ASCENDING, DESCENDING ，该模块就是你的责任！

接下来开始讲程序，直接上实例（一步一步来）：

引入模块：

from selenium import webdriver
from bs4 import BeautifulSoup
import requests
from pymongo import MongoClient,ASCENDING, DESCENDING
import time
import re

其中的每一个模块都会说已经解释过了，其中的re、requests都是之前就有提过的，他们都是核心缺一不可！

首先，我举一个小例子，淘宝的自动模拟搜索功能（源码）：

先说一下selenium 的定位方法

find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector

源码：


from selenium import webdriver
from bs4 import BeautifulSoup
import requests
from pymongo import MongoClient,ASCENDING, DESCENDING
import time
import re
def TaoBao():
 try:
  Taobaourl = 'https://www.taobao.com/'
  driver = webdriver.Chrome()
  driver.get(Taobaourl)
  time.sleep(5)#通常这里需要停顿，不然你的程序很有可能被检测到是Spider
  text='Strong Man'#输入的内容
  driver.find_element_by_xpath('//input[@class="search-combobox-input"]').send_keys(text).click()
  driver.find_element_by_xpath('//button[@class="btn-search tb-bg"]').click()
  driver.quit()
 except Exception,e:
  print e
if __name__ == '__main__':
 TaoBao()

268辅助卡盟网

python网页自动化脚本学习Python selenium自动化网页抓取器

卡盟推荐

相关资讯

《龙武》评测：2.5D武侠网游巨作游戏

【永城人论坛】2016年10月21日（周四）

象棋是中国最经典的休闲游戏现在正式登陆android平台啦

网页游戏观察HTML5游戏引擎公司白鹭时代市场营销中心副总裁张翔张翔

企业网站获客选择SEO优化手段的原因主要是什么？

相关教程

光辉女郎辅助出装顺序（光辉女郎最强出装教学）

天龙八部开脚本封号天龙怀旧服：四天封禁账号16330个，网友直呼“牛批”！

电子辅助评标系统江苏省政务办发文要求推广应用常州市“智能辅助评标”

传奇脱机脚本编辑器哪里有牧雁辅助传奇挂机脚本编辑器

小黑辅助梦貂蝉阴阳师中如何才能养出一个合格的小黑？