Na luta cada vez mais intensa entre crawlers e anti-crawlers, os sistemas de detecção de risco das principais websites e aplicativos estão se tornando cada vez mais robustos, sendo um dos métodos a proibição de IPs. Para resolver o problema da proibição de IPs, uma maneira eficaz é configurar um proxy. Após a configuração do proxy, o crawler pode usar o IP do proxy para disfarçar seu verdadeiro endereço IP, conseguindo assim superar as limitações impostas pelos sistemas anti-crawlers. No entanto, a qualidade dos proxies varia bastante. Por exemplo, a maioria dos proxies gratuitos disponíveis no mercado são praticamente inutilizáveis ou já estão bloqueados, enquanto alguns proxies pagos comuns também foram adicionados às listas negras de risco de várias websites e aplicativos. Portanto, atualmente, há cada vez menos proxies de alta qualidade disponíveis para a coleta de dados. Os principais tipos de proxies de qualidade no mercado atualmente são proxies dedicados, proxies ADSL e proxies móveis celulares. Este serviço de proxy é baseado em uma rede móvel celular (4G, 5G) e oferece um serviço de proxy rotativo. Este documento irá apresentar o método de solicitação e uso deste serviço.Documentation Index
Fetch the complete documentation index at: https://docs.xhuoapi.ai/llms.txt
Use this file to discover all available pages before exploring further.
Proxy Móvel Celular
O proxy móvel celular é, na verdade, um serviço de proxy construído com base em dados móveis, onde todos os IPs de proxy são IPs reais de celulares. Este tipo de proxy é relativamente pouco utilizado na área de crawlers, portanto, a probabilidade de ser bloqueado é menor, tornando este tipo de proxy muito eficaz para a coleta de dados de websites e aplicativos com forte controle de risco. Este serviço de proxy é construído sobre uma grande piscina de celulares controlados em massa, onde todo o tráfego é retransmitido através de dados móveis genuínos, suportando quase todos os pedidos de dados de websites e aplicativos disponíveis no mercado, com qualidade de proxy extremamente alta, capaz de reduzir significativamente a probabilidade de controle de risco.Método de Solicitação
Para usar o serviço de proxy celular, você pode primeiro ir à 「página de solicitação」 para fazer a solicitação, onde a primeira solicitação tem um crédito gratuito de 1 ponto.
Se você ainda não estiver logado, será redirecionado automaticamente para a página de login. Após fazer o login, você pode continuar com a solicitação.
Método de Uso
Após a solicitação, você pode verificar o resultado da sua solicitação no 「painel de controle」, como mostrado na imagem:
Clique em 「Credenciais」 para visualizar o nome de usuário e a senha para usar o serviço de proxy celular, separados por dois pontos, onde o nome de usuário tem 8 caracteres e a senha tem 32 caracteres, como mostrado na imagem:
Este proxy móvel celular é um proxy rotativo, portanto, ao usá-lo, você só precisa configurar um endereço de proxy fixo e uma porta. O endereço e a porta do proxy são cellular.proxy.xhuoapi.ai e 30000, respectivamente. Este proxy é compatível com os protocolos HTTP/HTTPS/SOCKS e pode ser usado para solicitar websites que utilizam os protocolos HTTP e HTTPS.
Teste de Comando
Com o nome de usuário e a senha do proxy, a maneira mais conveniente de testar é através do comando curl. Se ainda não estiver instalado, consulte https://curl.se/ para instalação. Supondo que o nome de usuário e a senha do proxy atual sejam1f78266a:eff0896726224fa2a99fe82dd1f07562, podemos usar o seguinte comando curl para testar:
-x do curl para especificar o endereço do proxy. O protocolo do proxy é, por padrão, HTTP/HTTPS, e a URL solicitada é https://ipinfo.io, que pode retornar o IP real que fez a solicitação e a localização do IP.
Nota: O nome de usuário e a senha acima podem ser inválidos, substitua-os pelo seu nome de usuário e senha.O resultado da execução é o seguinte:
Integração de Código
Abaixo, como exemplo, mostramos como configurar o proxy rotativo celular usando Python:@, e depois o endereço e a porta do proxy.
Em seguida, declaramos uma variável proxies, configurando dois pares chave-valor, onde os nomes das chaves são http e https, e seus valores são ambos proxy, representando que para websites que utilizam os protocolos HTTP e HTTPS, a solicitação será feita usando o proxy definido na variável proxy.
Depois, definimos um loop de três vezes para testar o proxy, onde a URL solicitada é https://ipinfo.io, que pode retornar o IP real que fez a solicitação e a localização do IP.
O resultado da execução é o seguinte:

