Skip to content

rtfghd/IP_POOL

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

IP 代理池

开启代理池

直接执行run.py文件

python run.py

服务启动后,等待代理池运行几分钟,采集并检测IP稳定后再使用。
获取代理 IP 有三个接口,分别是:

  • http://localhost:5000/random 随机获取一个可用代理
  • http://localhost:5000/all 获取所有可用代理
  • http://localhost:5000/count 获取可用代理的总数

使用方法

以python的requests为例

import requests

def get_proxy():
    proxy = requests.get('http://localhost:5000/random').text
    return proxy
    
def test():
    r = requests.get('http://www.baidu.com',timeout=10,proxies={'http':'http://'+get_proxy()})

软件环境

  • python 3.6x
  • redis

第三方库

  • Flask==0.12
  • requests==2.20.0
  • redis==3.0.1
  • aiohttp==3.5.4
  • lxml==3.7.2
  • beautifulsoup4==4.8.0

新增代理

crawler.py文件下的Crawler类中,新增名称以crawl_开头的方法来采集对应网站的IP即可。

About

python + flask + redis 搭建IP代理池

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages