Pentágono lança suas vistas sobre sítios web de
relacionamento social
por Paul Marks
"Sou continuamente abalado e fico estarrecido com os pormenores que as
pessoas postam voluntariamente online acerca de si mesmas". É o
que diz Jon Callas, responsável chefe de segurança na PGP, um
fabricante de software de encriptação com sede em Silicon Valley.
Ele está longe de ser o único a perceber que os sítios
web de relacionamento social que estão em rápido crescimento,
como MySpace e Friendster, são o sonho dos bisbilhoteiros.
A
New Scientist
descobriu que a National Security Agency (NSA) do Pentágono, que se
especializa em escutas secretas e decifração de códigos,
está a financiar investigações da massa colhida de
informação que as pessoas postam acerca de si próprias nas
redes sociais. E estas poderia aproveitar avanços na tecnologia
Internet especialmente a "web semântica" que está
para vir, promovida pela W3C, a organização dos padrões da
web para combinar dados de sítios web de relacionamento social
com pormenores tais como actividades bancárias, compras e registos de
propriedade, permitindo à NSA construir extensos e vastos perfis
pessoais de indivíduos.
Os americanos ainda estão abalados com as revelações do
mês passado de que a NSA tem estado a armazenar chamadas
telefónicas desde os ataques terroristas do 11 de Setembro de 2001. O
Congressional Research Service, que aconselha os legisladores dos EUA, diz que
as companhias telefónicas que entregaram registos de chamadas podem ter
actuado ilegalmente. Contudo, a Casa Branca insiste em que a ameaça
terrorista torna ultrapassada a legislação existente sobre
escutas e está a pressionar o Congresso a não investigar a
acção da NSA.
Enquanto isso, a NSA prossegue seus planos para explorar a web, uma vez que
registos telefónicos têm um âmbito limitado. Eles podem ser
utilizados para construir um quadro muito básico da rede de contactos de
alguém, um processo chamado às vezes de "conectando os
pontos". Ajuntamentos
(clusters)
de pessoas em grupos altamente conectados tornam-se aparentes, assim como as
pessoas com poucas conexões que parecem ser as intermediárias
entre tais grupos. A ideia é ver quantas ligações ou
"graus" separam pessoas de, digamos, um membro de uma
organização na lista negra.
Ao acrescentar dados de redes sociais online às suas análises
telefónicas, a NSA poderia conectar pessoas a níveis mais
profundos, através de actividades partilhadas, tais como tomar
lições de voo. Tipicamente, os sítios online de
relacionamento social pedem aos membros para dar pormenores dos seus
círculos de amigos imediatos e extensos, cujos blogs podem ser seguidos.
As pessoas muitas vezes listam outras facetas da sua personalidade, incluindo
preferências políticas, sexuais, de entretenimento e esportivas.
Algumas vão muito mais longe, e umas poucas perderam os seus empregos
por descreverem publicamente suas façanhas quanto à bebida e
ingestão de drogas. Pessoas jovens têm sido excluídas de
colégios religiosos ortodoxos em que estão inscritas por
revelarem online serem gays.
"Você deveria assumir sempre que qualquer coisa que escreva online
é agrafada ao seu curriculum. As pessoas não percebem que
actualmente serão "Googladas" só por obter uma
entrevista para emprego", afirma Callas.
Outros dados que a NSA poderia combinar com pormenores de relacionamento social
incluem informação sobre compras, onde vamos (disponível a
partir de registos de telemóveis, os quais mencionam a
estação de base de onde partiu uma chamada) e quais as grandes
transações financeiras que fazemos, tais como comprar uma casa.
É certo que agora isto é difícil de fazer porque a web de
hoje está recheada de dados em formatos incompatíveis. Aqui
entra a web semântica, a qual pretende aplanar estas incompatibilidades
nos próximos anos através de uma estrutura comum de dados chamada
Resource Description Framework (RDF). A W3C tem esperança de que um dia
todo sítio web venha a utilizar a RDF para dar a cada tipo de dado uma
única, predefinida e não ambígua "tag".
"A RDF transforma a web numa espécie de folha de cálculo
universal que é lisível tanto por computadores como por
pessoas", diz David de Roure da Universidade de Southampton, no Reino
Unido, que é conselheiro da W3C. "Isto significa que você
será capaz de perguntar a um sítio web questões que antes
não podia, ou efectuar cálculos com os dados que contem".
Num registo de saúde, por exemplo, um ataque de coração
terá a mesma "tag" semântica da sua
descrição mais técnica, como enfarte do miocárdio.
Anteriormente teriam parecido como condições médicas
separadas. Cada peça de dado numérico, tal como a taxa de
inflação ou o número de pessoas mortas nas estradas,
também terá uma "tag".
As vantagens para os cientistas, por exemplo, poderiam ser enormes: eles
terão acesso sem precedentes aos conjuntos de dados experimentais de
outros e serão capazes de efectuar suas próprias análises
sobre eles. Investigar produtos tais como férias tornar-se-á
mais fácil pois preços e disponibilidades de dados terão
"tags" inteligentes, permitindo investigações poderosas
através de centenas de sítios.
Quanto à desvantagem, esta facilidade de uso também
tornará fácil a bisbilhotice da vida das pessoas. Nenhum plano
para garimpar redes sociais através da web semântica foi anunciado
pela NSA, mas o seu interessa na tecnologia é evidente numa nota de
rodapé acerca do financiamento a um documento de
investigação apresentado na conferência WWW2006, da W3C, em
Edinburgh, Reino Unido, em Maio último.
Aquele documento, intitulado
Semantic Analytics on Social Networks
, de uma
equipe de investigação dirigida por Amit Sheth da Universidade da
Georgia, em Athens, e Anupam Joshi, da Universidade de Maryland, em Baltimore,
revela como dados de redes sociais online e outras bases de dados podem ser
combinados para revelar factos acerca de pessoas. A nota de rodapé diz
que o trabalho foi parcialmente financiado por uma organização
chamada ARDA.
O que é a ARDA? É uma acrónimo para
Advanced Research Development Activity
. Segundo um relatório intitulado Data Mining and
Homeland Security, publicado pelo Congressional Research Service, o papel da
ARDA é gastar dinheiro da NSA em investigações que podem
"resolver alguns dos problemas mais críticos enfrentados pela
comunidade de inteligência dos EUA". O principal dentre os
objectivos da ARDA é fazer com que adquiram sentido as quantidades
maciças de dados coleccionados pela NSA algumas das suas fontes
crescem ao ritmo de 4 milhões de gigabytes por mês.
As redes sociais online, sempre em crescimento, são parte do fluxo de
informação da Internet que poderia ser garimpada: alguns dos
sítios de topo, como MySpace, têm agora mais de 80 milhões
de membros (ver gráfico).
A investigação financiada pela ARDA foi concebida para verificar
se a web semântica poderia ser utilizada facilmente para conectar
pessoas. A equipe de investigação escolheu tratar de um assunto
caro aos seus corações académicos: detectar conflitos de
interesses em avaliações
(peer review)
de trabalhos científicos. Os amigos não podem avaliar
documentos de investigação uns dos outros, nem
tão pouco pessoas que anteriormente tenham sido autoras conjuntas de
trabalhos da outra.
Assim, a equipe desenvolveu software que combinava dados das "tags"
RDF da rede social online Friend of a Friend (
www.foaf-project.org
), onde as
pessoas simplesmente informam quem está no seu círculo de amigos,
e uma base de dados bibliográfica comercial semanticamente etiquetada
(tagged)
chamada DBLP, a qual lista os autores de documentos sobre ciência
computacional.
Joshi afirma que o seu sistema descobriu conflitos entre revisores potenciais e
autores que apresentavam documentos a uma conferência sobre Internet.
"Ele certamente torna mais fácil a descoberta de relacionamentos
entre pessoas", afirma Joshi. "Ele levantou conflitos mais
ténues [não óbvios] que antes não teriam sido
vistos".
A tecnologia funcionará exactamente da mesma forma para a agência
de
inteligência e de segurança nacional e para assuntos financeiros,
tais como a detecção de informações privilegiadas
em proveito próprio
(insider trading),
afirmam os autores. Ligar "quem conhece quem" com compras ou
registos bancários poderia destacar grupos terroristas, lavadores de
dinheiro ou grupos na lista negra, afirma Sheth.
A NSA recentemente mudou o nome da ARDA para Disruptive Technology Office. O
interesse do DTO nas análises de redes sociais online reflecte a
controversa iniciativa Total Information Awareness (TIA) do Pentágono
após o 11 de Setembro. Aquele programa, destinado a coleccionar,
rastrear e analisar rastros de dados online, foi suspenso em 2002 após um
furor público acerca da privacidade. Mas em Setembro de 2003 elementos
do TIA foram incorporados no programa classificado do Pentágono, o
Defense Appropriations Act.
Grupos de privacidade preocupam-se em que o "perfilamento automatizado de
inteligência" possa manchar reputações de pessoas ou
mesmo levar a abusos na justiça especialmente porque os dados das
redes de sítios de relacionamento social podem ser inexactos, não
verdadeiros ou incompletos, adverte De Roure.
Mas Tim Finin, colega de Joshi, pensa que a difusão de tal tecnologia
é imparável. "A informação está a
ficar mais fácil de unir, fundir e extrair inferências. Há
dinheiro a ser feito e controle a ser obtido ao fazer isso. E não vejo
o que possa travá-la", afirma ele.
Callas pensa que as pessoas têm de se tornar conscientes de quanta
informação acerca de si mesmas deveriam divulgar em sítios
web públicos. Isto pode parecer óbvio, diz ele, mas ser discreto
é uma parte importante da manutenção da privacidade.
É tempo, talvez, de pressionar a tecla "delete".
10/Junho/2006
Artigos relacionados:
Software poderia acrescentar significado a links 'wiki',
http://www.newscientist.com/article.ns?id=dn9295
, 07/Junho/2006
Entrevista: Seis cliques de separação,
http://www.newscientist.com/article.ns?id=mg19025481.700
,
26/Abril/2006
Campanha da Electronic Frontier Foundation contra escutas,
https://secure.eff.org/
Disruptive Technologies Office, Wikipedia,
http://en.wikipedia.org/wiki/Disruptive_Technologies_Office
MySpace,
http://www.myspace.com/
O original encontra-se em
http://www.newscientist.com/
Este artigo encontra-se em
http://resistir.info/
.
|