Google criou barreiras para evitar uso de meta-buscadores
:google: Maldito seja o Google.
Assim como fez com o Invidious, o Google agora está indo atrás de meta-buscadores como o SearxNG usado pelo Bolhinha Buscador.
Agora fazem uma série de exigências e análises para dificultar o uso por meta-buscadores, como desafios JavaScript, análise de risco (que pode resultar num CAPTCHA), análise de ambiente e exigência de cookies.
Os desenvolvedores do SearxNG estão avaliando como resolver isso, mas no momento nenhum meta-buscador é capaz de retornar resultados do Google a menos que usem algum patch experimental.
Considerando que a ideia do Google agora não é mais mostrar resultados relevantes e sim anúncios e resumos de lero-lero, usar meta-buscadores vai contra o modelo de negócios desta bilionária empresa estrangeira.
O Google chega ao ponto de mostrar resultados irrelevantes para você fazer uma nova busca e ver mais anúncios.
@cadusilva @tecnologia I don’t really care anyways about Google since I don’t enable Google on my SearXNG. And even if I needed to enable Google, I would just use Startpage or Mullvadleta. But nowadays, Startpage has very low uptime so I can’t use it. And Mullvadleta is also shutting down soon. It’s times like this that I feel proud that I’m not much dependent on Google
@[email protected] @[email protected]
Foge um pouco do assunto principal o que vou falar, mas os resultados de buscadores estão cada vez piores. Não sei qual está pior: o “Modo IA” dos buscadores (descobri que até o Yandex tem uma IA agora) ou o modo “clássico”. Ambos têm retornado resultados nada a ver com o que se pesquisa.
Às vezes uso o SearXNG, mas geralmente uso o DuckDuckGo ou, no caso de coisas mais referentes ao Brasil, o Google, mesmo, diretamente. E daí me pego indo pra página 2, 3, 4… a fim de tentar caçar um resultado relevante ao que solicitei.
Adentrando mais o tema desse fio, ver o fio levou-me, por curiosidade, a fazer um teste rápido tanto no Bing quanto no Yandex.
Meu teste envolveu usar o operador “site:” pra pesquisar na URL. Pesquisei por “site:*.ai” que foi o que veio na cabeça de pesquisar, ou seja, sites cujo domínio tenha o TLD “.ai” (geralmente sites relacionados a IA, mas não necessariamente).
Pra começar: ambos já trouxeram um CAPTCHA. Mesmo o Bing, onde estava logado com uma conta minha da Microsoft. “Resolvendo” o CAPTCHA (que não trouxe desafios de imagem ou de texto), os resultados que vieram, em ambos, não seguiam o solicitado.
O Bing, dos dois, foi o pior, com os resultados sendo óbvias propagandas de uma plataforma de streaming famosa: os resultados do Bing eram literamente todos uma página de perguntas e respostas (???) no site de tal plataforma.
Já o Yandex até trouxe algo mais ou menos referente ao pesquisado, mas ignorou o operador “site:” (pra ser justo, talvez o Yandex não trabalhe com esses tipos de operadores de pesquisa) e a pesquisa acabou sendo entendida pelo Yandex como “site ai”, o que obviamente retornou só coisas sobre IA.
Fugindo novamente um pouco do assunto principal para uma visão mais sistêmica, percebo que, do jeito que a tecnologia têm rumado, vai ter captcha pra poder resolver captcha, e anúncio pra ver anúncio. Ah, o último já tem, principalmente no Youtube… Tá surreal.

Daqui a pouco só com exame de íris pra poder fazer uma simples busca…
@guilhermegnzaga Sam Altman já está nessa (WorldID) :smart_guy:
Não tem como usar um motor de busca que usa os resultados do Google? Acho que o Ecosia e Mullvad recuperam os resultados do Google.
Edit: acabei de ver o seu comentário falando do Mullvad, respondido!
@veroandi habilitei o Mullvad mas ele tá se comportando como o Google, então deve ter sido afetado.
@veroandi não há suporte ao Ecosia no SearxNG.
@veroandi um membro da equipe do SearxNG respondeu isso, inclusive:
“Thanks for the PR. We are not going to default to mullvadleta engine as it has a significantly more sensitive ratelimit than Google engine.”
Vi agora aqui: https://github.com/searxng/searxng/pull/5387#issuecomment-3473779040
E acabei de ver que eles vão matar o Leta no fim do mês, já era:





