Scraper em inglês significada raspador, e scraping por sua vez, raspagem. Assim, web scraping nada mais é, numa tradução livre, “raspagem na web“
Para que serve?
Essa coleta de dados estruturados de forma automatizada ou a extração de dados na rede mundial, é utilizada por empresas ou pessoas físicas para a pesquisa de preços, produtos e notícias, por exemplo.
Com certeza diversas pessoas que estão lendo este artigo já se passaram por scraping, todavia, de forma infinitamente menor daquela realizada na chamada web scraping, considerando a forma “artesanal” com que foi executada, enquanto a outra, automatizada, é infinitamente potencializada, uma vez que o seu funcionamento ocorre pelo rastreador da web “web crawler“, também chamado de “aranha”, que por Inteligência Artificial (IA) procura e indexa conteúdos.
Qual a relação web scraping com o Direito? Há alguma violação da LGPD?
Além de questões ligadas a informações de usuários da rede, outras questões do direito digital são ligadas ao assunto, inclusive, no que tange a duas grandes varejistas brasileiras do e-commerce, que litigam sob alegações de concorrência desleal e violação marcária, inclusive com pedido de abstenção ao uso de reproduções e imitações, como títulos e palavras-chave, para disponibilização de anúncios patrocinados em ferramentas de busca como Google e outras assemelhadas.
Como dito, a web scraping é a coleta de dados estruturados de forma automatizada da web.
A utilização do web scraping na inteligência de preço é a maior dentre outras possíveis (pesquisas de produtos ou notícias, por exemplo), em que os dados coletados podem ser utilizados para monitoramento de concorrente e de tendência de mercado consumidor, assim como monitoramento do preço de determinado produto no mercado de uma forma geral, quando existir vários revendedores e distribuidores deste produto.
A pesquisa de mercado pode ser importante ainda na oferta de informações para investidores e mercado acionário, se o fornecedor do produto estiver listado em bolsa de valores, inclusive, com fonte de dados para a integração da Companhia com a opinião pública.
Paulo Henrique de Souza Freitas