IP代理本身以及背后的工作原理了解有多少

jj 2022-11-12

说到代理IP,你可能知道它可以用来切换IP,做相应的抓取项目。但是你对IP代理本身以及背后的工作原理了解多少呢?让我们一起进入代理IP的学习。
 
第一,代理IP的类型
 
IP可以分为四种类型。透明代理IP、匿名代理IP、高度匿名代理IP以及另一种易混淆的代理IP经常被听到。从最基本的安全层面来说,它们的顺序应该是:高隐蔽性>混沌性>匿名性>透明性。
 
第二,代理原则
 
代理的类型主要取决于代理服务器的配置。的不同配置将形成不同类型的代理。在配置中,REMOTE_ADDR、HTTP_VIA、HTTP_X_FORWARDED_FOR这三个变量是决定性因素。
 
1)远程_ADDR
 
REMOTE_ADDR代表客户端的IP,但其值不是由客户端提供,而是由服务器根据客户端的IP指定的。
 
如果使用浏览器直接访问某个网站,该网站的web服务器(Nginx、Apache等。)会将REMOTE_ADDR设置为客户端的IP地址。
 
如果我们为浏览器设置了代理,我们访问目标网站的请求会先经过代理服务器,然后代理服务器会将请求转换到目标网站。然后网站的web代理服务器将REMOTE_ADDR设置为代理服务器的IP。
 
2)X-forward-For(XFF)
 
X-Forwarded-For是一个HTTP扩展头,用来表示HTTP请求者的真实IP。当客户端使用代理时,Web代理服务器不知道客户端的真实IP地址。为了避免这种情况,代理服务器通常会添加一个X-Forwarded-For标头,并将客户端的IP添加到该标头中。
 
X-Forwarded-请求标头的格式如下:
 
X-Forwarded-For:客户端,代理1,代理2
 
Client代表客户端的IP地址;1是离服务器最远的设备的IP;2是第二代理2设备的IP;从格式中可以看出,从客户端到服务器可以有多个代理。
 
如果一个HTTP请求经过三个代理,代理1、代理2、代理3,IP分别是IP1、IP2、IP3,用户的真实IP是IP0,那么根据XFF标准,服务器最终会收到如下信息:
 
X-Forwarded-For:IP0、IP1、IP2
 
3代理直接连接到服务器,它会将IP2添加到XFF,表示它正在帮助代理2转发请求。列表中没有IP3,所以可以通过RemoteAddress字段在服务器上获取IP3。我们知道HTTP连接是基于TCP连接的。HTTP协议中没有IP的概念。RemoteAddress来自TCP连接,即与服务器建立TCP连接的设备的IP。在本例中,它是IP3。
 
3)HTTP_VIA
 
Via是HTTP协议中的一个头,记录了HTTP请求通过的代理和网关。代理服务器后,添加代理服务器的信息。
 
第三,代理选择
 
普通匿名代理IP可以隐藏客户端的真实IP,但是也会改变我们的请求信息。服务器可能认为我们使用了代理。但是在使用这个代理的时候,被访问的网站虽然无法知道客户端的IP地址,但是仍然可以知道你在使用代理。当然,一些可以检测IP的网页还是可以找到客户端的IP的。
 
对于高度匿名的代理,请添加不改变客户端请求的链接描述,以便服务器看起来像一个真实的客户端浏览器在访问它。这个时候客户端的真实IP是隐藏的,服务器不会认为我们用了代理。
 
精灵ip代理是国内专业行业的优质代理ip软件提供商。支持Windows客户端和Android客户端,一键连接全国200多个城市的优质节点。百万ip可任意选择,ip带宽可达4 -60Mbps。还支持30分钟免费试用!

扫一扫,咨询微信客服