Na Universidade do Minho acaba de ser criado um telescópio que promete intercetar até 99,8% do spam que circula na internet.
Até há bem pouco tempo os telescópios eram conhecidos por deixarem ver de perto as estrelas. Hoje, também há quem use telescópios para conhecer melhor as pessoas que nos enviam emails. Na Universidade do Minho, o centro Algoritmi pegou neste mesmo conceito e juntoulhe duas funcionalidades que prometem eficácia de 99,8% na deteção do spam e criou o SPAM Telescope Miner. Esta tecnologia tem potencial comercial. Se houver alguém interessado estamos recetivos a ver que tipo de solução pode ser criada, atenta Paulo Cortez investigador do Centro Algoritmi e professor no Departamento de Sistemas de Informação da Universidade do Minho.
A ideia de desenvolver um telescópio do SPAM surgiu em 2006, durante uma visita de Paulo Cortez ao colega Miguel Rio, que se encontrava radicado em Londres. Num pub típico, com alguma cerveja à mistura, o investigador minhoto e Miguel Rio chegam à conclusão de que é possível desenvolver novas ferramentas de combate ao Spam sem criar filtros que acabam por classificar como publicidade abusiva emails que são legítimos.
Garantido o apoio financeiro da Fundação para Ciência e Tecnologia (FCT) e a parceria com a University College de Londres, o centro Algortmi deu início ao projeto com a criação de 12 perfis fictícios. Propositadamente, os investigadores do Centro Algoritmi não enviaram qualquer email nem fizeram divulgação dos endereços fictícios. Deste modo, ficámos a saber que todos os mails recebidos nessa altura eram enviados por spammers, que usavam programas que permitem descobrir números de IP de endereços de email, acrescenta Paulo Cortez.
Mais tarde os investigadores do Centro Algoritmi procederam à transposição para um telescópio de deteção de spam. Para isso, deram início à divulgação dos endereços no mercado português e nos EUA, com a publicação de comentários em sites e blogues famosos e o desenvolvimento de páginas web fictícias, com endereços colocados em locais que só uma aplicação usada por spammers podia descobrir. Em paralelo, esses endereços foram inscritos em newsletters que não são consideradas spam. Por fim, foram usadas listas negras de spammers que estão em atividade.
Com esta divulgação, ficaram criadas as condições para o desenvolvimento de duas variantes de técnicas que já existem e que passaram, assim, a distinguir com maior eficácia spammers e remetentes que não estão classificados como spammers.
Paulo Cortez recorda que o combate ao Spam tem recorrido a três abordagens: uma que prevê a criação de novos protocolos que podem exigir o pagamento para o envio de emails; uma segunda que implica a criação de listas negras com os remetentes suspeitos e exige a colaboração dos internautas; e por fim, uma terceira, que exige a filtragem por conteúdos. O protótipo criado pelo Centro Algoritmi apenas adotou as duas últimas abordagens, com o objetivo de produzir duas variantes mais eficazes.
À medida que iam recebendo emails tanto de spammers como de remetentes legítimos, os investigadores portugueses puderam obter dados sobre a latitude, a longitude e o sistema operativo usado pelos remetentes, bem como o número de máquinas e routers por onde passaram as mensagens antes de chegarem aos destinatários.
Com este dados, a equipa liderada por Paulo Cortez ficou em condições de criar indicadores de rede, que podem revelarse determinantes para a deteção automática de spammers. Um spammer pode mudar facilmente as palavras e os termos usados numa mensagem para não ser detetado por um filtro de spam... mas dificilmente consegue mudar as características de rede», lembra Paulo Cortez.
Através dos indicadores de rede, os investigadores descobriram que alguns dos mais produtivos spammers operam a partir da Turquia e da Rússia e geralmente usam sistemas operativos Windows, porque costumam recorrer a máquinas cujos proprietários desconhecem estar infetadas com vírus. Em contrapartida, os emails legítimos têm maior dispersão geográfica e, devido às quotas de mercado no segmento dos servidores, geralmente, são enviados por máquinas que correm Linux.
Às características de rede, foi ainda adicionada uma estratégia simbiótica, que implicou o desenvolvimento de algoritmos que aumentam a capacidade para distinguir spam de não spam ao longo do tempo. Estes algoritmos podem depois ser partilhados por vários utilizador (sob anonimato) aumentando ainda mais a eficiência dos filtros nos vários quadrantes do Spam.
Paulo Cortez recorda que a partilha de listas negras tem a vantagem de evitar ataques de spammers que recorrem a vários termos valiosos para um utilizador, a fim de bloquear a receção de mensagens úteis e, assim, levar à desativação dos filtros. A estratégia simbiótica pode evitar que outros utilizadores sofram estes ataques localizados, acrescenta o investigador da Universidade do Minho.
O apoio da FCT terminou em dezembro de 2010 com o desenvolvimento do SPAM Telescope Miner, mas Paulo Cortez admite que o protótipo pode evoluir, com a realização de teses de mestrado, que permitam explorar novas ideias. Este trabalho também pode ser útil para detetar spam em redes sociais ou criar filtros de conteúdos para crianças, ou eventualmente detetar spam que é enviado através de imagens.
www.uminho.pt