Proxyknife Manual 1.5
Proxyknife Manual 1.5 目录 GNU Proxyknife-1.5 手册 1 什么是GNU Proxyknife? 2 功能列表 3 运行环境 4 快速使用 5 最简配置说明 6 配置举例 7 高级配置 8 参数解释 9 辅助脚本 10 列表格式 11 输出格式 12 开发方向 GNU GENERAL PUBLIC LICENSE Preamble Appendix: How to Apply These Terms to Your New Programs Appendix A Copying This Manual A.1 GNU Free Documentation License A.1.1 ADDENDUM: How to use this License for your documents 2 Contact 索引 下一个: 功能列表 , 上层: (dir) GNU Proxyknife-1.5 手册 本手册描述GNU Proxyknife(version 1.5)的编译,安装和使用. 最近更新:6 November 2006 Copyright © 2005-2006 Jia Wang. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License". 功能列表 : Proxyknife是什么? 它能做什么? 运行环境 : 运行它需要什么条件? 快速使用 : 快速开始请看这里,附基本配置举例. 高级配置 : 详述高级配置参数. 命令参数 : 命令行参数的说明. 辅助脚本 : 格式化列表,排序等. 列表格式 : 代理列表文件内容的格式. 输出格式 : 验证结果说明 开发方向 : 将来要加入的功能. 文档版权 : 本文档的版权说明(GFDL). Copying : Proxyknife代码版权(GPL). 联系方式 : 报告Bugs方式,主页等. 索引 : 重要内容索引. 下一个: 运行环境 , 上一个: Top , 上层: Top 1 什么是GNU Proxyknife? GNU Proxyknife(customizable proxy hunter)是一个多线程代理验证工具. 它从文件读入代理列表或者从网页下载代理列表,按照配置规则验证并输出用来判断代理性能的数据. 像代理猎手等工具一样,它可以把局域网用户从每天乏味的手动选择代理的劳动中解脱出来. 同其他工具最大的不同是:几乎全部的验证细节都可以设置. 从而可以灵活的选择自己想要的代理.并适于嵌入脚本. 2 功能列表 Featurelist 全功能命令行参数.所有配置(包括配置文件名)都可以通过命令行参数定制. 便于嵌入脚本. 验证免费http代理,支持两种验证方式: (注:免费是指无需用户名密码和支付任何费用的代理) HTTP_CONNECT 支持CONNECT的http代理可以代理telnet,ssh等大多数TCP请求 这种代理对请求目标端口的限制很小,不介入协议细节. HTTP_GET 通常的http代理,通常也支持对ftp/gopher等服务的代理访问. 开放的服务类型由代理服务器本身的设置决定. 这种代理能够最大利用服务器的缓存,多用户时速度会快一些. 验证免费socks5代理,当前只支持一种验证方式: SOCKS5_CONNECT 支持connect命令的socks5代理. socks5的connect功能同http代理的connect功能相似. 如前所述,这种代理可以用做tcp通道,能够代理建立在TCP层上的请求. 验证免费socks4代理,当前只支持一种方式: SOCKS4_CONNECT 支持connect命令的socks4代理. socks4的connect功能同socks5的相似. 可选直接连结testproxy进行验证和 通过一级http或socks5代理验证二级http代理, 支持两种类型的一级http或socks5代理(socks4代理的支持仍在测试中): 需要用户名密码的(对于http代理,支持basic auth;对于socks5代理,支持用户名密码认证) 无需用户名密码的 多线程 多延时输出 详细的验证结果输出到文件和屏幕. 附带脚本可对验证结果排序. 可随时按ctrl c中断,验证结果不会丢失. 按行读入代理列表->验证->继续,不是一次读入全部列表到内存(下载模式例外). 所以Proxyknife可以在不影响 其他进程的同时处理很大的代理列表文件. 超强定制 user_agent(浏览器伪装),checksite(验证目标),key(验证关键字)等都可以设置. 比如说,可验证连指定网站速度最快的代理. 可选输出日志到指定文件或屏幕.日志中包括详细的验证信息. 可以通过设置回应速度和接收速度过滤掉速度慢的代理. 可指定代理列表文件和验证结果文件. 可以从标准输入读入代理列表. 也可以从网页(当一级代理设定时,经过一级代理)读入代理列表,目前只测试过两个网站. 发送no-cache头,如果代理服务器因此不缓存,那么得到的延时信息就可以更准确些. 可以打开调试,显示验证细节. 下一个: 快速使用 , 上一个: 功能列表 , 上层: Top 3 运行环境 Requirements cpu i386,alpha,sparc. 其他的CPU没有测试过. 操作系统 在当前最新版本的GNU/Linux(gentoo,debian,fedora core)和SunOS,OSF1下测试通过. 编译要求 需要libpthread. 大多数发行版的GLIBC已经内置这个库. 编译器只测试了gcc. 网络 满足如下任一条件即可: 1.可以直接连结免费代理 2.或可以通过支持CONNECT的一级http或socks5代理连结免费代理. 权限 普通用户也可以安装使用. 下一个: 高级配置 , 上一个: 运行环境 , 上层: Top 4 快速使用 步骤 解压并进入工作目录: tar zxvf proxyknife-1.5.tar.gz cd proxyknife-1.5 编译安装.输入: ./configure make make install 在当前目录建立配置文件(proxyknife会在当前目录寻找proxyknife.conf和proxylist) cp doc/proxyknife.conf.example proxyknife.conf proxyknife会搜索./proxyknife.conf,然后搜索~/.proxyknife.conf, 最后检查安装目录下的etc/proxyknife.conf. 它会在找到第一个文件后停止搜索,并把找到的文件作为有效配置文件. 对于配置文件: '#'开始的行为注释行,特别的,'#!'开始的行后面的行是必须修改的,请 根据注释行修改. 特别的, '#! if' 开始的行只在if后面的条件满足时是必须的. 5 最简配置说明 mytype 一级代理类型. 如果是无需认证的http代理填1,如果是无需认证的socks5代理填2, 如果是basic认证的http代理填11,如果是username/password认证的socks5代理填12. 如果不需要经过代理填21. myhost 一级代理ip或者主机名 myport 一级代理端口 myuser 仅当mytype=11或12时此项有效. mypass 同上. 假设一级代理的用户名为abc,密码为guest,则myuser和mypass应该这样设置: myuser=abc mypass=guest httptestmethod 对http免费代理的验证方式. 目前支持HTTP_CONNECT(1)和HTTP_GET(0). 如果想找CONNECT代理,填: httptestmethod=1 socks5testmethod 对socks5免费代理的验证方式. 目前只支持SOCKS5_CONNECT(2). 所以不要改变缺省设置: socks5testmethod=2 socks4testmethod 目前只支持对connect(SOCKS4_CONNECT,5)型socks4代理的验证. 所以不需要 改变缺省设置. socks4testmethod=5 logfilename 指定日志文件的输出位置.如果喜欢在屏幕上看到详细的输出: logfilename=. 如果不想在屏幕上看到这些细节,那么输出到文件: logfilename=./proxyknife.log 把代理列表文件改名为proxylist放在当前目录下(程序内带有一个): cp doc/example/proxylist . 同proxyknife.conf一同放在当前目录下. 最后在bash下输入 proxyknife ^C中断 每发现一个免费代理都会输出在屏幕并同时保存在当前目录下的文件proxyout中. 6 配置举例 假设你有一个基于username/password认证的socks5代理: 代理域名是,端口是1080,用户名是abc,密码是def. 如果你想通过它验证支持connect的http代理和socks5代理,配置文件可以这样写: #一定要个性化的部分 mytype=12 myport=1080 myuser=abc mypass=def httptestmethod=1 #当前版本可以不改但不能注释掉的部分 socks5testmethod=2 socks4testmethod=5 #不要改且不能注释掉的部分. threads=50 checksite= key=2006 Google user_agent=User-Agent: MSIE 6.0 myconreplysize=256 testconreplysize=256 testtagreplysize=65535 rcvtimeo=10 sndtimeo=5 logfilename=proxyknife.log 假设你有一个不需要认证的http代理,域名,端口8080. 你希望通过它验证普通http免费代理和支持connect的socks5免费代理, 你的设置应该是这样的: #必须个性化的部分 mytype=1 myport=8080 httptestmethod=0 #当前版本不要改动且不能注释掉的部分 socks5testmethod=2 socks4testmethod=5 #可以不改动但不能注释或者删除的部分 threads=50 checksite= key=2006 Google user_agent=User-Agent: MSIE 6.0 myconreplysize=256 testconreplysize=256 testtagreplysize=65535 rcvtimeo=10 sndtimeo=5 logfilename=proxyknife.conf 除了proxyknifein、proxyknifeout可选外,其他设置行和注释行 (如myuser=...mypass=...)都将被忽略. 下一个: 命令参数 , 上一个: 快速使用 , 上层: Top 7 高级配置 请先阅读参阅 快速使用 .了结'#!' '#! if'开始行的意义. 可能必须设置的 变量的说明也在那里. 有效的配置行格式为: 变量名=值 注意变量顶格,值后无多余空格,字符串值不需要用引号括起来. 不支持"变量名=值#..."型注释. 高级变量的说明: threads 线程数,设置太高会影响其他进程. myconreplysize 用于接收发往一级代理myproxy的CONNECT请求的缓冲区大小. 为一些怪异代理准备,不推荐改动. testconreplysize 用于接收发往二级代理testproxy的CONNECT请求的缓冲区大小. 验证CONNECT代理时启用.同样不推荐改动. testtagreplysize 接受测试目标返回数据的缓冲区大小,程序从这里寻找成功访问目标应该返回的关键字. user_agent 用于伪装浏览器的特征字串. rcvtimeo 接收超时,单位秒 sndtimeo 发送超时,单位秒(注意,此参数也会影响connect) logfilename 日志文件名,proxyknife会重定向标准错误输出到日志文件. 如果不想在程序内重 定向stderr,设置"logfilename=."即可.注意, "."后面只能是换行,换行符前不能 有任何其他字符. proxyknifeintype 代理列表的类型,影响对proxyknifein设置的解释. 0表示文件模式,1表示下载模式. 缺省是文件模式. proxyknifein 带有完整路径的代理列表文件名. proxyknife从这个文件读入代理列表进行验证. 如果想通过标准输入读入(比如说通过管道),设置proxyknifein为"-". 下载模式下,proxyknifein解释为下载网址. 目前只有两个网站支持,参数值可以是 ""或"",其他网站没有测试过. 如果不设置proxyknifein,文件模式下Proxyknife会读当前目录下的proxylist, 下载模式下Proxyknife会从 下载代理列表. 目前代理列表的下载不经过myproxy进行,直接连接代理网站. proxyknifeout 带有完整路径的输出文件名. proxyknife会把通过验证的代理连同验证结果输出到这个 文件. 如果不设置proxyknife会输出到当前目录下的proxyout文件. debug 调试开关. 设置为1打开调试输出. 设置为0关闭调试. 缺省是0. 除高级变量和可能必须设置的变量外,配置文件中出现的其他变量名 都会被丢弃. 下一个: 辅助脚本 , 上一个: 高级配置 , 上层: Top 8 参数解释 命令行输入 ./proxyknife --help 可以看到命令行参数同配置变量的对应关系,不再解释. 其中-f,-V是命令行参数特有的功能. -f 用来指定配置文件 (不在当前路径下时请用绝对路径). -V 显示版本信息. Proxyknife 1.5, 可定制的代理验证程序. 用法: proxyknife [选项]... 特殊选项: -V, --version 显示 Proxyknife 的版本号然后退出. --help 显示帮助信息. 下面除'-d'外,其他选项都需要参数! 命令行独有的选项: -f 参数是配置文件 同配置对应的选项: -d debug, 输出调试信息. 无参数. -t threads, 线程数. -g user_agent 验证时希望模拟的浏览器类型. -m mytype, myproxy(一级代理)的代理类型. -p myport, myproxy的端口号. -h myhost, myproxy的ip或域名. -u myuser, myproxy的用户名. -s mypass, myproxy的密码. -c checksite, 用来判断代理性能的目标网站.缺省使用google英文. -k key, 查找返回信息中的key. 用来判断代理是否可用. -r rcvtimeo, 网络接收延迟,单位秒. 可过滤慢速代理. -n sndtimeo, 网络发送延迟,单位秒. -S myconreplysize -T testconreplysize -G testtagreplysize -H httptestmethod -5 socks5testmethod -4 socks4testmethod -l logfilename -I proxyknifeintype, 代理列表的类型(本地文件或网址) -i proxyknifein, 代理列表文件或下载地址. '-'表示标准输入 -o proxyknifeout, 含有验证结果(通过验证的代理及其延时)的输出文件. 下一个: 列表格式 , 上一个: 命令参数 , 上层: Top 9 辅助脚本 scripts目录下两个脚本分别用于格式化代理列表和排序 creatlist 这个脚本会保留所有形如ip:port@proto.*的ip:port@proto部分. 其他行均被删除. 删除重复行. 脚本先把全部字母改为大写.随后的操作是: 找到: 检查port是否是数字 找到@ 检查proto是否是SOCKS5或HTTP之一 只要一个条件不满足,该行就会被删除. 最终结果被sort 和 uniq处理以删除重复行. 使用方法: ./createlist 输入文件 输出文件 举例: ./createlist p proxylist sortlist 对proxyout排序,使用方法: ./sortlist 下一个: 输出格式 , 上一个: 辅助脚本 , 上层: Top 10 列表格式 代理列表的每行必须是如下格式: ip:端口@协议.* 或 ip:端口 ip部分必须是ipv4地址(暂时去掉了对域名的支持). 端口没什么说的了,1-65535范围内的数字. 当前版本协议字串只能为HTTP、http、socks5、SOCKS5、socks4或SOCKS4. 协议后面的所有字符都将被忽略. 如果没有@字符,同前面不同的是,端口后不能出现任何其他字符. 例子: 下一个: 开发方向 , 上一个: 列表格式 , 上层: Top 11 输出格式 当前版本输出的是延时信息. 验证方式 输出格式 时间方向–> HTTP_GET host:port@HTTP estab pget end HTTP_CONNECT host:port@HTTPC estab pcon get end SOCKS5_CONNECT host:port@SOCKS5 estab pcon get end 验证流程图. 关于图中的符号,请见如下表格: 符号 说明 – 发起数据,左边为发起时间(如ta) <- 数据到达,左边为数据到达时刻(如tb). 图: Proxyknife -- (myproxy) --- testproxy -- target(checksite) ta ----------------> estab = tb - ta tb <---------------- tc ------------------------------> pcon = td - tc HTTP_CONNECT ,SOCKS5_CONNECT or SOCKS4_CONNECT. td <------------------------------ te ------------------------------> (p)get = tf - te get:HTTP_CONNECT,SOCKS5_CONNECT,SOCKS4_CONNECT, pget:HTTP_GET tf <------------------------------ tg ------------------------------> end = th - tg th <------------------------------ 参数 解释 estab 从proxyknife向myproxy(或直接连结testproxy)发出连结testproxy的请求到 收到连结成功消息的时间. pcon 从proxyknife向testproxy发出连结target的请求到 收到连结成功消息的时间. 