Modelo de Propagação de Informações em
Redes Sociais
Leandro Lamarca Nunes
Janeiro de 2013
Modelo de Propagação de Informações em Redes Sociais
Leandro Lamarca Nunes
Orientador:
Prof. Allbens Atman Picardi Faria
Janeiro de 2013
Dissertação de Mestrado, submetida ao Programa de PósGraduação em Modelagem Matemática e Computacional
do CEFET-MG como parte dos requisitos exigidos para a
obtenção do tı́tulo de Mestre em Modelagem Matemática e
Computacional.
Sumário
1
Introdução
1
2
Conceitos Básicos
3
2.1
Redes e Grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2
Modelo de Penna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
3
4
Navegação em redes complexas: Revisão Bibliográfica
8
3.1
Introdução
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
3.2
Redes Sociais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
3.3
Notı́cias Sociais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4
Competição entre memes(ideias) em um mundo de atenção limitada . . . . 15
3.5
Contágio da informação: um estudo empı́rico da divulgação de notı́cias nas
R
R
redes sociais DIGG
e TWITTER
. . . . . . . . . . . . . . . . . . . . . 24
Modelo Proposto
4.1
5
32
Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Conclusões e Perspectivas
45
A Anexo
A.1 Percolação
46
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
A.2 Leis de Escala e Potência . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
i
A.3 Passeio Aleatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
A.4 Autômatos Celulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
A.5 Geradores de números aleatórios . . . . . . . . . . . . . . . . . . . . . . . . 52
ii
Resumo
A literatura recente tem apresentado evidências de que o estudo da navegação em redes
complexas é útil para entender a dinâmica e topologia destas redes. Duas das principais
abordagens usualmente consideradas são a navegação de caminhantes aleatórios e a navegação de caminhantes dirigida. A navegação acontece em redes simples, que possuem sua
forma e tamanho definidos, ou em redes complexas, cujos nós são interligados aleatoriamente, como por exemplo em redes neurais e rede de dados(internet). O interesse em redes
advém por representarem os sistemas encontrados no mundo real. O entendimento da
dinâmica de disseminação de informação em redes complexas, que traduzem da melhor
forma para o mundo real as redes sociais, tem despertado uma busca intensa no intuito de
entender como as ferramentas de internet, atualmente disponı́veis, se comportam. Neste
trabalho, pretende-se estudar a navegação de informações e seus impactos em redes de
mundo pequeno. A atenção desse esta na utilização das redes que mais se assemelham as
redes sociais do mundo real, através de uma abordagem que utiliza um modelo inspirado
de percolação com múltiplos alcances e autômatos celulares.
Palavras-chave: navegação, redes complexas, redes sociais, autômatos celulares.
Abstract
Recent literature has shown evidences that navigation in complex networks study is useful
for understanding the dynamics and topology of these networks. Two among the major
approaches are the navegation of random walkers and the directed walkers. The navigation
happens in simple networks, which have defined its shape and size, or in complex networks,
which nodes are randomly interconnected, such as neural networks and data network
(internet). The interest in studying these networks is because they represent systems
that can be found in the real world. Understanding the spread of information dynamics
in complex networks, which translate as best to the real world, social networks, has raised
an intensive search in order to understand how internet tools, currently available, behave.
The purpose of this study is to assess the navigation of information and its impacts
considering small world networks. The focus of this study is on the use of networks that
more closely resemble the real-world social networks, through an approach that uses a
model inspired in percolation with multiples scope and cellular automatas.
Keywords: navigation, complex networks, social networks, cellular automatas.
Objetivos
- Estudo da navegação da informação em redes complexas.
- Revisão bibliográfica sobre o processo de disseminação da informação.
- Proposição de um modelo de propagação de informações em redes sociais.
Capı́tulo 1
Introdução
Nos últimos anos, uma atenção renovada tem sido dada às redes complexas através de
estudos oriundos da matemática e da fı́sica aplicados a toda sociedade, contribuindo para
o entendimento do papel dessas redes na estrutura social.
O surgimento das redes sociais e de seu crescimento tem despertado grande interesse
por diversos setores. Um ponto em comum dentre os diversos tipos de rede social é o
compartilhamento de informações e interesses em busca de objetivos comuns. O intenso
processo cotidiano de formação das redes sociais reflete um processo de fortalecimento da
sociedade civil e de grupos sociais.
As redes sociais tem por sua natureza reunir pessoas que compartilham de interesses
comuns que podem se manifestar de diferentes formas. Dentre elas, podemos listar as
redes de comunidade que, geralmente, tem como finalidade reunir os interesses comuns
de moradores de uma mesma região; as redes de profissionais, mais conhecidas como
‘networking’, tem como objetivo fortalecer a rede de contatos de um profissional, visando
futuros ganhos no mundo empresarial, e por fim, as redes sociais online que mantém uma
estrutura capaz de construir redes sociais através de usuários cadastrados, permitindo
compartilhar interesses e/ou atividades, através de mensagens, jogos e outras possibilidades.
R
As redes sociais online, mais conhecidas atualmente como redes de relacionamentos (DIGG
,
R
R
R
TWITTER , FACEBOOK ) e as redes profissionais (LINKEDIN ,) permitem analisar
a forma como os indivı́duos desenvolvem suas atividades e alcançam seus objetivos.
O constante crescimento dessas redes e a quantidade imensa de informação gerada e
veı́culada nelas, motivou o estudo sobre a capacidade que cada indivı́duo tem de absorção.
Sendo assim, o entendimento da disseminação da informação nessas redes e de seu impacto
na sociedade tem motivado diversos estudos contemporâneos em parte apresentados por
Vespignani [37].
De acordo com os autores Barabàsi, Albert, Jeong apud Boccara, a World Wide Web
1
(WWW) é uma rede complexa em constante crescimento de sua estrutura fı́sica, cuja
ordem é maior que um bilhão de nós, sendo atualmente a fonte mais utilizada na busca
de informação [1, 2].
Estes autores ainda afirmam que o crescimento citado é totalmente desregulamentado, ou
seja, qualquer indivı́duo ou instituição é livre para criar sites com um número ilimitado de
documentos e ligações. Por conseguinte, os vértices dessa rede são documentos HTML,
chamados de páginas Web, e as conexões são os endereços de internet apontando de
um documento para outro. Apesar de seu enorme tamanho, os autores descobriram
que a WWW é um grafo altamente interligado, ou seja, dois documentos escolhidos
aleatoriamente estão, em média, a 19 cliques de distância um do outro. Na mesma
linha, estes autores afirmam que a distância média entre quaisquer dois documentos é
dada por 0, 35 + 2, 06 log N , onde N é o número total de documentos. “Esta dependência
logarı́tmica mostra que um agente “inteligente” deve ser capaz de encontrar em um curto
espaço de tempo as informações que está procurando, navegando na web”[1, 2].
A Internet e os mundos virtuais são redes para navegar e explorar diariamente e a
literatura atual mostra evidências de que o estudo da navegação é útil para a compreensão
das propriedades das redes complexas. Uma contribuição importante de Cajueiro [4] é o
conceito de navegação em redes, que implica em um agente ter que se mover dentro de
uma rede partindo de um ponto de origem a um de destino. Este movimento consiste em
alcançar um nó da rede complexa através da navegação entre os elos que os unem [4].
Neste trabalho iremos apresentar um capı́tulo de conceitos básicos que une todas as
ferramentas necessárias que serão utilizadas em nosso modelo. Em sequência, passaremos
por uma revisão bibliográfica que aborda conceitos imprescindı́veis para o entendimento
das redes sociais e seus mecanismos. E por fim, iniciaremos a apresentação do nosso
modelo matemático que tem por caracterı́stica identificar os resultados de simulações da
disseminação da informação em uma rede de mundo pequeno através de uma abordagem
inspirada em percolação com múltiplos e autômatos celulares. Em anexo, descrevemos
alguns conceitos importantes que foram estudados e puderam, de forma segundaria,
inspirar a criação do modelo.
2
Capı́tulo 2
Conceitos Básicos
2.1
Redes e Grafos
Grafos
Os grafos podem ser utilizados para a representação abstrata das redes complexas. Nas
redes, os nós e as arestas possuem propriedades baseadas no sistema que está sendo
investigado e pode-se entender as redes como grafos aplicados ao sistema real em estudo.
Um grafo G(V, A) é uma estrutura composta por dois conjuntos V e A tal que V é um
conjunto finito não-vazio e A é um conjunto de pares não-ordenados de elementos de V .
Os elementos de V são chamados de vértices e |V | = n é a ordem do grafo com n vértices.
Os elementos de A são chamados de arestas.
Uma definição de grafos pode ser apresentada [5], onde V é um conjunto discreto e A
uma famı́lia, cujos elementos são definidos em função dos elementos de V . Se as arestas
de A forem definidas como pares ordenados de vértices, dizemos que a aresta diverge de
vi e converge para vj .
Pode-se visualizar um grafo através de uma representação como visto na figura 2.1, onde
os vértices são pontos distintos do plano e as arestas são linhas unindo dois vértices.
Redes Complexas
O termo redes complexas refere-se a um grafo que apresenta uma estrutura topográfica
não trivial, composta por um conjunto de vértices (nós) que são interligados por meio de
arestas[1].
No final de 1967, Stanley Milgram [6] realizou um experimento simples para mostrar
3
Figura 2.1: Exemplos de diferentes possı́veis representações de um grafo G(V, A) a partir de um mesmo
conjunto de vértices e arestas[5].
que, apesar do grande número de pessoas que viviam nos Estados Unidos e do número
relativamente pequeno de conhecidos de uma pessoa, duas pessoas escolhidas ao acaso
poderiam estar ligadas. No entanto, o fato de que duas pessoas escolhidas aleatoriamente
estão conectadas por apenas uma pequena cadeia de conhecidos, o referido fenômeno
tem sido verificado em diversas redes sociais. Exemplos incluem redes neurais, teias
alimentares, redes metabólicas, redes de energia, redes de distribuição , sistemas de autoestrada, rotas aéreas, a Internet, e a WWW[10].
De acordo com Mendes [7] e Rocha [8], a Teoria das Redes Complexas, ou Teoria das
Redes, possui um caráter interdisciplinar. Ademais, Rodrigues [9] afirma que: ‘Sistemas
complexos são formados por muitos elementos capazes de interagir entre si e com o meio
ambiente’. Rocha [8] ainda coloca que o sistema evolui rapidamente, mas, uma série de
problemas envolvendo redes complexas ainda necessitam ser estudados, principalmente
sistemas envolvendo acoplamento e interação entre diversas redes complexas.
Esses elementos de redes complexas podem ser pessoas, proteı́nas, computadores, aeroportos, entre outras coisas. As ligações, entretanto, dependem da caracterı́stica que se quer
estudar e refletem propriedades intrı́nsecas dos elementos considerados, por exemplo:
pessoas podem estar ligadas por conexões de amizade ou devido ao compartilhamento de
alguma opinião, enquanto aeroportos estarão ligados se possuem rotas que os conectam. A
Teoria das Redes Sociais pode ser vista como uma extensão da Teoria das Redes aplicada
a fenômenos sociais.
Descrevemos anteriormente sobre a natureza de uma rede complexa, vamos agora descrever
diferentes modelos e suas especificidades. A rede conhecida como aleatória é atribuı́da
a Erdös & Rényi, a de Mundo Pequeno (Small-world em inglês), que possui alto grau
de agrupamento e baixa distância média entre os vértices como pode ser vista em um
exemplar na figura 2.2, foi inicialmente proposta por Watts e Strogatz em 1998 [10].
4
Figura 2.2: Exemplo de um diagrama de uma rede social.Representação do ponto de maior grau de
R
centralidade em cor branca. LINKEDIN
, rede de usuários que procura fortalecer sua rede de contatos
visando futuros ganhos pessoais ou profissionais fazendo parte de grupos com maior afinidade.
Retirado de http://pt.wikipedia.org/ wiki/ Rede_social
Modelo de Redes Aleatórias
Os matemáticos Paul Erdos e Alfred Rényi [1, 10, 11, 12, 13] escreveram vários trabalhos
sobre a teoria dos grafos, dentre os quais se destaca a teorização sobre ‘grafos aleatórios’.
Objetivando mostrar como as redes sociais se formariam demonstraram, por exemplo,
que bastava uma conexão entre cada um dos convidados de uma festa para que todos
estivessem conectados ao final dela. Erdos e Rényi ainda atentaram para outro fato:
quanto mais elos eram adicionados, maior a probabilidade de serem gerados aglomera-dos,
ou seja, grupos de nós mais conectados. Uma festa, portanto, poderia ser um conjunto
de aglomerados (grupos de pessoas) que de tempos em tempos estabeleciam relações
com outros grupos. Entretanto, como esses nós se conectariam?Eles acreditavam que o
processo de formação dos grafos era randômico, no sentido de que esses nós se agregavam
aleatoriamente. Dessa premissa, Erdos e Rényi concluı́ram que todos os nós, em uma
determinada rede, teriam mais ou menos a mesma quantidade de conexões ou, no mı́nimo,
igual chance de receber novos elos, formando assim uma rede aleatória.
5
Modelos de Rede de Mundo Pequeno
Observando as redes sociais como interdependentes umas das outras, é plausı́vel perceber
que todas as pessoas estariam interligadas umas às outras em algum nı́vel. Stanley
Milgram, nos anos 60, realizou um experimento para observar os graus de separação
entre as pessoas numa rede de relacionamento [1, 10, 11, 12, 13, 14]. Ele enviou uma
determinada quantidade de cartas a vários indivı́duos, de forma aleatória, solicitando que
tentassem enviar a um destinatário especı́fico. Caso não conhecessem o destinatário, as
pessoas eram solicitadas então, a enviar as cartas para alguém que acreditassem estar
mais perto dele. Milgram descobriu que, das cartas que chegaram a seu destino final,
a maioria havia passado apenas por um pequeno número de pessoas. Isso indicaria que
todas estariam a poucos graus de separação de relacionamento umas das outras, ou seja,
cada um em seu “mundo pequeno”.
Outra importante contribuição foi dada por Mark Granovetter [15] que criou os conceitos
de laços fracos e de laços fortes. Para ele, os laços fracos seriam muito mais importantes
que os laços fortes na manutenção da rede social, pois conectariam pessoas de grupos
sociais diversos, dando aos grupos (aglomerados) caracterı́sticas de rede. Granovetter [15]
mostrou também que pessoas que compartilhavam laços fortes (de amigos próximos, por
exemplo) em geral participavam de um mesmo cı́rculo social (de um mesmo grupo que
seria altamente conectado). Já aquelas pessoas com quem se tinha um laço mais fraco
eram justamente importantes porque conectariam a vários grupos sociais. Sem elas, os
vários aglomerados existiriam como ilhas isoladas e não como rede.
A partir do experimento de Milgram [6] e das teorias de Granovetter, Duncan Watts e de
seu orientador, Steven Strogatz [10, 11], descobriu-se que as redes sociais apresentavam
padrões altamente conectados, tendendo a formar pequenas quantidades de conexões
entre cada indivı́duo. Um modelo semelhante ao de Erdös e Rényi, onde os laços eram
estabelecidos entre as pessoas mais próximas e alguns laços estabelecidos de modo aleatório
entre alguns nós transformavam a rede num mundo pequeno [10, 11]. O modelo de Watts
e Strogatz mostra uma rede mais próxima da realidade das redes sociais: cada um de nós
tem amigos e conhecidos em vários lugares do mundo, que por sua vez tem outros amigos
e conhecidos. Em larga escala, essas conexões mostram a existência de poucos graus de
separação entre as pessoas no planeta. Além disso, eles mostraram que bastavam poucas
ligações entre vários aglomerados para se formar um mundo pequeno numa grande rede
[13].
2.2
Modelo de Penna
O modelo de Penna é baseado na teoria da seleção natural de Darwin para a evolução
das espécies e na teoria do acúmulo de mutações para explicar o envelhecimento biológico.
Desde sua publicação em 1995, esse modelo vem sendo utilizado com sucesso na compreensão
de muitos fenômenos evolucionários observados na natureza, tais como a senescência
6
Figura 2.3: Tipos de rede: rede regular, rede de mundo pequeno e rede aleatória. Seguem os modelos
de reconexão aleatória de Watts-Strogatz, o qual realiza uma transição entre um anel regular e uma rede
aleatória conforme a variação da probabilidade p de uma aresta ter várias conexões. Imagem retirada
de[10].
catastrófica do salmão, a autoorganização da menopausa, as vantagens da reprodução
sexuada, etc. Diversas aplicações do modelo de Penna podem ser encontradas em [31, 32,
33, 34].
Na versão sexuada do modelo Penna, o genoma de cada indivı́duo é representado usando
uma ‘estratégia de cadeia de bits’[35] por duas tiras de 32 bits cada, que são lidas
em paralelo. Elas contêm a informação de quando os sintomas de uma dada doença
hereditária vão aparecer, sendo por isto chamadas de ‘genoma cronológico’. Cada uma
das tiras contém a herança genética de um dos pais, sendo as doenças representadas pelo
valor 1.
Se um dado indivı́duo possui dois bits iguais a 1, por exemplo, na terceira posição de
ambas as tiras (homozigoto), isto indica que aquele indivı́duo vai começar a sofrer dos
sintomas de uma doença no terceiro perı́odo de sua vida. Assim, cada indivı́duo pode viver
no máximo por 32 perı́odos. Se o indivı́duo for heterozigoto numa dada posição, ele só
ficará doente se, naquela posição, o bit 1 for dominante. No inı́cio da simulação,define-se
quantas posições serão dominantes e sorteia-se aleatoriamente quais serão elas.
Estas posições são as mesmas para todos os genomas e são mantidas fixas durante todo o
processo de evolução da população. Um passo computacional significa ler mais um bit do
genoma de todos os indivı́duos. Se em qualquer passo, o número de doenças acumuladas
num dado genoma atinge um limite determinado, aquele indivı́duo morre.
7
Capı́tulo 3
Navegação em redes complexas: Revisão
Bibliográfica
3.1
Introdução
A literatura recente tem apresentado evidências de que o estudo da navegação em redes
complexas é útil para entender sua dinâmica e topologia. Duas principais abordagens são
usualmente consideradas: navegação de caminhantes aleatórios e navegação de caminhantes
dirigida.
A abordagem dos autores Cajueiro e Andrade [3] supõe que um viajante tem um caminho
ótimo a fim de minimizar o custo do passeio. Se isso acontecer, surgem dois regimes
extremos: um denominado navegação de caminhantes dirigidos e outro de caminhantes
aleatórios. Os autores tentam caracterizar o ponto crı́tico da transição de um regime para
outro em função da conectividade e o tamanho da rede. Além disso, mostram que esta
abordagem pode ser usada para generalizar vários conceitos apresentados na literatura
sobre a navega-ção aleatória e a navegação direta.
Finalmente, defende-se que investigar os regimes extremos de navegação de caminhantes
aleatórios e de caminhantes dirigidos não é suficiente para avaliar corretamente as caracterı́sticas de navegação em redes complexas.
O conceito de navegação implica em um agente ter que se mover dentro de uma rede
partindo de um ponto de origem até um ponto de destino. No método do caminhante
aleatório, o caminhante é colocado em uma posição definida e caminha pelos nós vizinhos
fazendo sua escolha aleatoriamente, podendo usar ı́ndices probabilı́sticos em suas transições
de acordo com a dinâmica da rede em questão.
Na navegação dirigida, o agente toma o caminho mais curto para a posição alvo perguntando
aos nós vizinhos qual o custo menor para o próximo passo. Essa estratégia permite
8
alcançar o ponto alvo com o mı́nimo de saltos possı́veis.
Diversas situações foram consideradas em ambos os métodos. Na navegação dirigida foi
estudada a situação do caminhante não conseguir obter informações completas de seus
nós vizinhos, sendo trazida a consequência de um aumento da distância percorrida ao
ponto alvo em comparação ao caminho mais curto.
Recentemente foi considerado o tópico de navegação ótima em redes complexas, sendo
que o caminhante pode ‘pagar’ por uma informação correta obtida nos nós vizinhos ou
até mesmo seguir por um caminho aleatório. Desde que duas constantes de custo sejam
associadas a trajetória a ser seguida - a distância e o custo da informação - o agente pode
otimizar a navegação pela mı́nimo custo do caminho até o ponto alvo.
Entretanto, o aprendizado surge como um fenômeno importante no assunto de navegação.
Investiga-se agora como um agente pode usar o processo de aprendizado para aprender e
escolher qual o caminho mais curto para rumo ao alvo numa rede complexa. Durante o
processo de aprendizagem o agente conseguirá obter o caminho mais curto para atingir o
alvo se adicionar o custo para obter qualquer informação desnecessária.
3.2
Redes Sociais
Vivemos em um mundo cada vez mais interligado de tecno-sistemas sociais, em que dentro
das infraestruturas compostas por diferentes camadas tecnológicas estão a interoperabilidade dentro do componente social que impulsiona o uso e seu desenvolvimento [37].
Exemplos são fornecidos pela Internet, WWW, tecnologias de comunicação WIFI, transporte, infraestruturas e mobilidade [37].
A natureza multiescalar e complexa dessas redes são caracterı́sticas fundamentais na sua
compreensão e gestão. A acessibilidade de dados e os avanços na teoria e na modelagem
de redes complexas estão fornecendo um sistema integrado que nos aproxima de alcançar
o poder preditivo do verdadeiro comportamento dos tecno-sistemas sociais [37].
A interação do homem em redes sociais são modelados através de redes em que os nós
representam indivı́duos interagindo e as ligações são potenciais interações entre eles [41].
Modelos de Mobilidade Ecológica e Epidemiológica dependem de redes de metapopulações
que consistem em populações inteiras interligadas por virtude dos intercâmbios entre
grupos de indivı́duos [42]. Um grande grupo de trabalhos tem mostrado que a maioria
das redes do mundo real apresentam auto organização dinâmica (isto é, tornam-se mais
complexas ao longo do tempo, sem a intervenção de forças de fora) e são estatisticamente
muito heterogêneas; essas são caracterı́sticas tı́picas de sistemas complexos [43, 44, 45].
O principal desafio encontrado nas redes complexas, por conseguinte, está na sua intercone9
xão (redes de redes) e em sua natureza multiescalar. As várias distribuições estatı́sticas
que caracterizam estas redes (incluindo as probabilidades de conexão por nó e as intensidades
dos elos de ligação) são geralmente distorcidas com peso maior na cauda, variando ao longo
de ordens de grandeza [46].
A Figura 3.1 mostra três redes que exemplificam a mobilidade humana em diferentes
escalas, desde viagens aéreas que cruzam continentes até a mobilidade celular entre torres
de telefonia. Idealmente, para fazer previsões sobre os processos movidos pela mobilidade
humana, precisamos integrar esses dados com suas amplas granularidades em uma rede
enorme. Um exemplo simples é fornecido pela descrição em grande escala de uma epidemia
se espalhando. A propagação da epidemia da peste negra no século 14 (o BlackDeath)
[47] foi principalmente um fenômeno de difusão espacial.
Figura 3.1: Propriedades de multiescala de redes de mobilidade. À esquerda, relatamos a probabilidade
de distribuição P (s) para o tráfego aéreo, medida como o número de viagens por indivı́duos, por qualquer
ligação dada, de três redes diferentes: (A) rede aérea da companhia U.S. Continental, (B) rede de
comutação (deslocamentos intermunicipais) dos Estados Unidos,e (C) a mobilidade entre as células de
torre de telefonia móvel em uma grande área urbana.
Em todos os casos, as distribuições são altamente desiguais e com duração de três a sete
ordens de magnitude. À direita, a ilustração continental de rede da companhia aérea
dos EUA (D) e a rede de comutação (E) entre os setores censitários principais. A escala
de cores de amarelo ao vermelho escuro identifica a magnitude do fluxo de tráfego em
escala logarı́tmica, a rede da companhia aérea é feita principalmente por ligações de longo
alcance, em comparação com um grid como ordenação da rede de comutação. O fluxo
médio diário do deslocamento na rede é de uma ordem de magnitude maior do que a da
10
rede de linhas aéreas. Como previsto em 1933 [48], o impacto em larga escala geográfica
das doenças infecciosas como a epidemia de SARS [49] ou a epidemia da gripe suı́na sobre
as populações no mundo moderno é, devido principalmente, a viagens comerciais. Uma
epidemia que começa no Sudeste Asiático vai chegar rapidamente à América do Norte
e Europa (3.2). Esta imagem, por conseguinte, não pode ser simplesmente descrita em
termos de fenômenos difusivos, mas sim, deve incorporar a estrutura espacial da moderna
rede de transporte. Por exemplo, é a natureza de cauda pesada da rede de tráfego aéreo
que explica por que as restrições de viagem por si só são ineficazes em conter uma epidemia
global, a menos que a taxa de mobilidade global seja reduzida, pelo menos, por uma ordem
de grandeza [50, 51, 52]. Outro aspecto crucial de pensamento moderno de avaliar a rede
é a dinâmica de auto-organização que dá origem a padrões de grande escala de infraestruturas independentes de planejamento humano e engenharia do sistema. Os exemplos
de uma dinâmica auto-organizada de sistema podem ser a Internet, infra-estruturas de
comunicação , sistemas de transporte, redes de abastecimento e redes de distribuição de
energia. Como consequn̂cia, se poderia esperar, geralmente das redes rodoviárias um
elevado grau de regularidade. No entanto, a experiência cotidiana sugere que este não é
o caso, especialmente em cidades que têm crescido durante um longo perı́odo de tempo.
No entanto, o maior desafio na criação de uma descrição holı́stica de redes de multi-escala é
a necessidade de, simultaneamente, lidar com múltiplas escalas de tempos e comprimentos.
Figura 3.2: Árvore de invasão de epidemia obtida a partir das simulações de uma pandemia originária,
em Hanói, Vietnã. Os nós identificam 3200 populações em todo o mundo, e as ligações dirigidas indicam
o caminho ao longo do qual a epidemia mudou de uma população para a outra. O mapa de cores do
vermelho escuro ao azul escuro é de acordo com a ordem temporal da invasão da epidemia. Simulações
obtidas de uma epidemia mundial e seu modelo de mobilidade [53].
11
Blogues
Os blogues, sites que são atualizados regularmente, desempenham um papel significativo
na disseminação de informação. Cada atualização permite que os leitores possam fazer
comentários, bem como enlaces diretos para blogues dos próprios leitores.
A interação entre os blogues pode ser vista como uma rede de nós hiper-ligados chamada
“blogosfera”.
Devido a sua natureza rápida e acessı́vel, o surgimento de blogues criou um poderoso
fenômeno social influenciando muitas vezes os meios de comunicação de opinião pública
[54], e indústria de marketing.
A modelagem de blogues e redes sociais tem atraı́do um grande interesse de pesquisa sobre
a aprendizagem de modelos em redes [55].
Figura 3.3: Representação gráfica da (a)“blogosfera”. Os quadrados representam blogues e os cı́rculos
posts. Cada post pertence a um bloque e pode conter hiperligações para outros recursos na web. Uma
rede de blogues (b) com ligações entre blogues e (c) uma rede de posts com ligações entre as postagens
dos blogues.
Exemplos notáveis são os projetos Transim e Episims [56], nos quais os modelos baseados
em agentes, incluindo milhões de indivı́duos, são utilizados para simular a dinâmica e
tráfego de cidades inteiras e a propagação de agentes biológicos, respectivamente.
Por exemplo, em diversas redes como as de condução de energia, a falha de um único nó
ou linha pode desencadear um efeito dominó (‘falha em cascata’), em que a sobrecarga
induzida pela redistribuição do fluxo pode gerar uma insuficiência global da rede. Tirando
partido da heterogeneidade do fluxo realizado nos enlaces de redes de multiescala, AE
Motter [57] propôs um mecanismo de defesa adaptativo com base na remoção de um certo
número de nós para induzir falhas intencionais.
Embora este mecanismo pode parecer contra-intuitivo, a falha intencional de nós adequadamente escolhidos pode não amplificar o processo em cascata, e, pelo contrário, é capaz de
mitigar o dano final. Um aspecto interessante e eticamente desafiador é o de prever e gerir
12
o desdobramento de eventos catastróficos em redes tecno-sociais e a adaptação do sistema
de previsões quando são disponibilizados ao público. Comportamentos sociais reagem e
adaptam-se ao conhecimento das previsões [37].
Enfrentar esses problemas envolve enfrentar três grandes desafios cientı́ficos. O primeiro é
a coleta de dados em grande escala da disseminação de informações e as reações sociais que
ocorrem durante os perı́odos de crise [37]. O segundo desafio é a formulação de modelos
formais que tornem possı́vel quantificar o efeito da percepção de risco dos indivı́duos
na estrutura de rede. O terceiro desafio diz respeito à implantação de monitoramento
computacional de infra-estruturas capazes de coletar informação para alimentar os modelos
em tempo real [37].
Influência Social da Tecnologia
A influência social descreve as maneiras pelas quais as pessoas afetam crenças, sentimentos
e comportamentos uns dos outros. Tem sido, tradicionalmente, no domı́nio da psicologia
social, com foco principal em micro-processos de nı́vel entre os indivı́duos [58], mas
também através de estudo proeminente social, por exemplo, do comportamento de pastoreio
em economia [59], a saúde das bolhas especulativas nos mercados financeiros [60], o
comportamento eleitoral [61] e interpessoal [62].
A influência social desempenha um papel especialmente importante em mercados culturais [63] para produtos como livros e música e, geralmente, permeia qualquer área da vida
onde as atitudes e gostos dos indivı́duos são influenciados por outros.
Muitas vezes, é útil distinguir entre fontes locais e globais de influência, que tipicamente
são identificadas com o ambiente interpessoal de um indivı́duo e os meios de comunicação
de massa, respectivamente [64]. A influência social geral surge a partir de uma mistura de
influências locais e globais, que podem surgir a partir de sinais diferentes. O fato de estes
dois processos operarem em escalas muito diferentes coloca desafios consideráveis para o
estudo empı́rico da influência social.
Enquanto uma dada rede social pode ser utilizada como um substituto para a comunicação
dos sinais comportamentais, um indivı́duo deve, idealmente, ter acesso a uma rede que
representa com precisão o potencial de comunicação de canais para um sinal dado local,
e destes canais podem variar entre os comportamentos diferentes. Adicionalmente, os
indivı́duos são muitas vezes seletivos quanto às informações que escolhem para divulgar
a seus amigos, resultando no sinal local ser necessariamente incompleto, parcial, ou
deturpado [65] .
13
3.3
Notı́cias Sociais
A mı́dia social tornou-se um canal importante para as pessoas partilharem informações.
R
R
R
No DIGG
, no TWITTER
e no FACEBOOK
, entre outros, os usuários postam
notı́cias ou endereços de notı́cias, as discutem e expressam suas opiniões em tempo real.
Muitas vezes, esses sites são responsáveis pela divulgação em primeira mão de notı́cias
importantes. Depois que a tentativa terrorista de explodir uma companhia americana
R
falhou na época do natal de 2009, o TWITTER
foi a primeira fonte a anunciar as
novas medidas de segurança aéreas para vôos internacionais [66]. Além da divulgação
de notı́cias, esses sites estão sendo usados como instrumento para organizar as pessoas.
Exemplo disso foi o que aconteceu no Irã em junho de 2009, quando o movimento de
R
oposição ao governo usou o TWITTER
na mobilização do público, na organização de
protestos e para manter a população informada sobre os últimos acontecimentos sendo de
importância vital na ausência de fontes oficiais confiáveis de informação .
R
DIGG
é um conhecido site de notı́cias sociais com 3 milhões de usuários registrados. O
R
DIGG permite ao usuário submeter endereços e avaliar as notı́cias por meio de votos.
R
A cada minuto, acontecem novas adesões. O DIGG
coloca em sua página inicial em
torno de cem notı́cias por dia. Apesar do mecanismo preciso de promoção ser mantido
em segredo, tudo indica que que se leva em consideração o número e a avaliação que uma
R
notı́cia recebe. O sucesso do DIGG
é amplamente baseado no que é postado na página
inicial que é criada pela decisão coletiva por muitos de seus usuários.
R
TWITTER
é um site de uma rede social bastante conhecido que permite aos usuários
registrados postarem e lerem mensagens de texto curtas (de no máximo 140 caracteres)
podendo conter endereços de Internet. Um usuário pode também ‘retuitar’ ou comentar o
que o outro postou normalmente utilizando ‘RT @x’, onde x é o nome do usuário. Postar
R
um link no TWITTER
, analogicamente falando, é o mesmo que submeter uma notı́cia
R
R
no DIGG e retuitar uma mensagem pode ser o mesmo que votar nela. Como o DIGG
,
R
o TWITTER permite ao usuário considerar como ‘amigo’ os usuários cujas mensagens
R
R
eles querem seguir. Um ‘seguidor’ no TWITTER
equivale a ser um ‘fã’ no DIGG
.
Estudiosos tem reconhecido o potencial destes e de outros sites de redes sociais para
investigaçãorefletindo o movimento atual de utilizar ricos conjuntos de dados de grande
escala sobre o comportamento humano e comunicação devido ao atual interesse popular
em redes sociais [73] [74].
14
3.4
Competição entre memes(ideias) em um mundo
de atenção limitada
A adoção maciça da mı́dia social tem aumentado a competição entre as ideias por nossa
atenção finita. Os autores Weng, Flammini,Vespignani e Menczer [75] recorreram a um
parcimonioso modelo baseado em agentes para investigar se essa competição é capaz de
afetar a popularidade de diferentes memes, a diversidades das informações a que estamos
expostos e o gradual desaparecimento de nosso interesse coletivo por assuntos especı́ficos.
Os agentes compartilham mensagens numa rede social, mas são capazes de prestar atenção
somente a uma parcela das informações que recebem. Surpreendentemente, os autores
conseguiram explicar a maciça heterogeneidade que se observa na popularidade e persistências dos memes como sendo decorrente de uma combinação da competição em torno da
nossa atenção limitada com a estrutura da rede social, sem que seja necessário presumir
valores intrı́nsecos diversos entre as ideias [75].
As ideias possuem o formidável potencial de impactar a opinião pública, a cultura, a
polı́tica e os lucros [76]. O advento da mı́dia social [77] tem reduzido o custo da produção
e difusão de informações reforçando o alcance potencial de cada ideia ou meme [78].
Entretanto, a abundância de informações a que estamos expostos através das redes sociais
online e outros sistemas sócio-técnicos está ultrapassando nossa capacidade de consumı́las. As ideias são obrigadas a competir pela nossa escassa atenção individual ou coletiva.
Consequentemente, a dinâmica da informação é determinada mais do que nunca pela
economia da atenção, teorizada inicialmente por Simon [79]. Os processos que apontam
a popularidade em nosso mundo onde a atenção é limitada permanecem, ainda, pouco
explorados [88, 89]. A disponibilidade de dados da mı́dia social tem criado, nos últimos
tempos, oportunidades sem precedentes de investigar fenômenos humanos e sociais numa
escala global [90, 91].
Nesse contexto, um dos problemas mais desafiadores é o estudo da dinâmica da competição
entre as ideias, informações, conhecimentos e boatos. Entender esse problema é crucial em
contextos dos mais diversos, desde o do marketing viral até o da aceleração das descobertas
cientı́ficas. Aspectos da competição pela atenção limitada têm sido estudados recorrendo a
notı́cias, filmes e assuntos postados em blogs e na mı́dia social [85, 86, 88]. A popularidade
das notı́cias diminui com o número de notı́cias que competem entre si e que são divulgadas
simultaneamente [83, 92, 93].
Entretanto, mesmo nos ambientes simplificados das plataformas da mı́dia social, é difı́cil
separar os efeitos da atenção limitada de boa parte dos fatores coexistentes, como a
estrutura da rede social subjacente [82, 88], a atividade dos usuários e o tamanho de seu
potencial público [93], os diferentes graus de influência dos propagadores de informações
[94], a qualidade intrı́nseca das informações que eles espalham[95], as persistência dos
assuntos [96, 97]e o mimetismo social [98]. Para agravar essas dificuldades, as redes sociais
15
que abrigam os processos de difusão de informações não são sistemas fechados; fatores
exógenos, como a exposição à mı́dia tradicional e sua divulgação dos acontecimentos
pelo mundo, desempenham papel importante na popularidade e na duração de assuntos
especı́ficos [85, 100]. Outro exemplo de nossa atenção limitada é o limite cognitivo do
número de relações sociais estáveis que somos capazes de manter, conforme postulado por
R
Dunbar [101] e recentemente corroborado por uma análise de dados do TWITTER
[99].
Um modelo baseado em agentes para estudar o papel da atenção limitada de usuários
especı́ficos no processo de difusão e, em particular, se a competição por nossa atenção finita
pode afetar a popularidade, diversidade e duração dos memes. Se bem que a competição
entre ideias tenha sido implicitamente presumida como um fator subjacente, por exemplo,
ao declı́nio no interesse por notı́cias e filmes [107, 83, 85]. De modo particular, os autores
mostraram um modelo simples de competição numa rede social, sem outras considerações
sobre o mérito dos memes, interesses de usuários ou fatores exógenos explı́citos, que é capaz
de contabilizar a maciça heterogeneidade da popularidade e persistência dos memes, como
pode ser visto na Figura 3.4.
Figura 3.4: Usuários do Twitter e arestas dirigidas representam mensagens retuitadas que carregam
o meme. (a) #Japão mostra como as notı́cias sobre o terremoto de março em 2011 foram propagadas.
(b) #GOP representa o Partido Republicano dos EUA e memes polı́ticos propagados, mostra uma forte
polarização entre pessoas com pontos de vista opostos. (c) #Egito Memes relacionados com a “Primavera
Árabe” e, em particular, os levantes em 2011 e (d) #Sı́ria exibição de usuários hub com caracterı́sticas e
conexões fortes. Imagem retirada de [75].
16
Interesses dos Usuários
Mencionou-se como uma possibilidade que o interesse por assuntos especı́ficos afeta o
comporta-mento dos usuários na mı́dia social[102, 103]. Este é um ingrediente potencialmente
importante num modelo de difusão de memes, na medida em que um meme interessante
pode apresentar uma vantagem competitiva. Por isso, a intenção de pesquisar se os
interesses dos usuários, inferidos a partir de seu comportamento anterior, ajudam a prever
o seu comportamento no futuro, como pode ser visto na Figura 3.5.
Figura 3.5: Relação entre a probabilidade de uma mensagem ser ‘retuitada’ e sua semelhança com os
interesses do usuário. Imagem retirada de [75].
Regularidades Empı́ricas
Na Figura 3.6 podem ser observadas várias regularidades nos dados empı́ricos. Em
primeiro lugar, foi considerada a duração do meme, definida como o número máximo de
unidades de tempo consecutivas em que são observados posts sobre o meme; a popularidade
do meme, definida como o número de usuários por dia que tuı́tam sobre o meme, medido
dentro de um perı́odo especı́fico; e a atividade do usuário, definida como o número de
mensagens por dia postadas por um usuário, também medido dentro de um perı́odo
especı́fico. Esses três valores apresentam, todos eles, distribuições com caudas pesadas
(3.6(a,b,c)). O excelente colapso das curvas demonstra que as distribuições são robustas,
mesmo quando medidas dentro de unidades de tempo diferentes ou observadas dentro
de perı́odos diferentes. Alguns usuários demonstram uma atenção bem difusa, ao passo
que outros são bastante focados (Fig. 3.6(d)). Essa distribuição também é robusta com
17
relação a perı́odos diferentes.
Figura 3.6: Regularidades empı́ricas em dados do Twitter. (a) Distribuição de probabilidade do tempo
de vida de uma hora usando meme (cı́rculos vermelhos), dia (quadrados azuis) e semana (triângulos
verdes) como unidades de tempo. As unidades são convertidas em horas. Uma vez que as distribuições
são bem aproximadas por uma lei de potência, pode-se alinhar as curvas reescalando o eixo y por λα , em
que λ é a razão entre as unidades de tempo (por exemplo, λ = 24 dias reescalado em horas) e α ∼
= 2, 5
onde é o expoente da lei potência. Isto demonstra que a forma da distribuição de tempo de vida não
é um fator escolhido para definir o tempo de vida. (b) Distribuição de probabilidade cumulativa da
popularidade de um meme, medida pelo número total de utilizadores por dia que leram o meme. Esta e
as seguintes medidas foram realizadas diariamente (cı́rculos vermelhos preechidos), semanal (quadrados
azuis preechidos) e mensais (triângulos verdes preechidos). (c) Distribuição de probabilidades acumuladas
da atividade do usuário, medida pelo número de mensagens por dia enviadas por um usuário. (d)
Distribuição de probabilidade de amplitude de atenção do utilizador (entropia), com base nos memes
tuitados por um utilizador. Note-se que quanto maior for o número de posts produzido, menor os valores
não-zero gravados para usuários que se concentram em um pequeno conjunto de memes. Isso explica
porque as distribuições para perı́odos maiores de tempo tendem ainda mais para a esquerda. Imagem
retirada de [75].
Todas essas constatações empı́ricas apontam para comportamentos extremamente heterogêneos. Alguns memes gozam de grande sucesso (são populares e persistentes), ao passo
que a grande maioria se extingue rapidamente. Uma pequena fração de memes responde,
portanto, pela grande maioria dos posts. Do mesmo modo, uma pequena fração de
usuários responde pela maior parte do tráfego. Essas heterogeneidades podem, a princı́pio,
ser atribuı́das a causas variadas. As amplas distribuições no que se refere à popularidade
dos memes podem resultar da diversidade do valor intrı́nseco de alguns memes, com os
memes mais ‘importantes’ atraindo mais atenção afirmam os autores Weng, Flammini,
Vespignani e Menczer [75]. Memes de maior duração poderiam ser respaldados exogenamen18
te pela mı́dia tradicional e por eventos do mundo real. A atividade dos usuários e a
amplitude das distribuições de atenção poderiam ser um reflexo de diferenças comportamentais inatas. Qual seria então um conjunto mı́nimo de premissas necessário para interpretar
esses dados empı́ricos? Uma forma de encaminhar essa questão é partir de um modelo
minimalista de propagação de informações que não pressuponha nenhuma das externalidades apontadas acima. Em particular, até que ponto as caracterı́sticas estatı́sticas dos
memes e usuários podem ser explicadas pela capacidade de atenção limitada dos usuários,
aliada com a heterogeneidade de suas conexões sociais? Indagam os autores Weng,
Flammini, Vespignani e Menczer.
Descrição do Modelo
O modelo básico pressupõe uma rede de agentes. Um agente mantém uma lista de
posts em ordem cronológica, cada qual sobre um meme especı́fico. Posts diversos podem
tratar do mesmo meme. Os usuários prestam atenção apenas a esses memes. De forma
assı́ncrona e com probabilidade uniforme, cada agente pode gerar um post sobre um novo
meme ou encaminhar alguns dos posts da lista, transmitindo os respectivos memes a
agentes vizinhos. Por sua vez, os vizinhos prestam atenção a um meme recém-recebido,
colocando-o no topo de suas listas. Para que seja levada em conta a constatação de que
o comportamento no passado influencia quais memes o usuário irá difundir no futuro,
um mecanismo de memória que permite aos agentes desenvolverem interesses e foco
endógenos (ou interesses endógenos e foco) foi incluı́do. Por fim, a atenção limitada
foi modelada, permitindo que posts sobrevivam na lista ou memória de um agente por
um tempo limitado. Quando um post cai no esquecimento, o meme a ele associado passa
a ser menos representado. O meme é esquecido quando o último post que traz consigo
aquele meme desaparece da lista ou da memória do usuário.
A Figura 3.7 ilustra o modelo de retuı́tagem. Os agentes interagem numa rede social
direcionada de amigos/seguidores. Cada nó de usuários é dotado de uma tela onde são
registrados os memes recebidos, além de uma memória com registros dos memes postados.
Uma ligação entre um amigo e um seguidor indica que os memes de um amigo podem
ser lidos na tela do seguidor (#x e #y na Fig. 3.7(a) aparecem na tela da Fig.3.7(b)).
Em cada etapa, um agente é selecionado aleatoriamente para postar memes para agentes
vizinhos. O agente pode postar um novo meme com probabilidade pn (#z na Fig. 3.7(b)).
O meme postado aparece imediatamente no topo da memória. Do contrário, o agente lê
os posts sobre os memes existentes na tela. Cada post pode atrair a atenção do usuário
com uma probabilidade pr (o usuário presta atenção a #x, #y na Fig. 3.7(c)). A seguir,
o agente retuı́ta o post (#x na Fig. 3.7(c)) com probabilidade 1 pm ou tuı́ta sobre um
meme escolhido da memória (#v disparado por #y na Fig. 3.7(c)) com probabilidade pm .
Todos os post da memória possuem as mesmas oportunidades de serem selecionados, por
isso, os memes que aparecem com mais frequência na memória têm maior probabilidade de
serem propagados (a memória possui dois posts sobre #v na Fig. 3.7(d)). Para modelar
19
Figura 3.7: Ilustração do modelo de difusão meme. Cada utilizador tem uma memória e uma tela
com tamanho limitado. (a) Memes são propagadas ao longo de ligações dos seguidores. (b) Os memes
recebidos por um utilizador aparece na tela. Com probabilidade pn , os usuários postam um novo meme,
que é armazenado na memória. (c) Caso contrário, com probabilidade 1 − pn , o usuário verifica a
tela. Cada x meme na tela chama a atenção do usuário com pr probabilidade. Em seguida, com pm
probabilidade de um meme aleatório da memória acionado ou x reenviada com probabilidade 1 − pm .
(d) Todos os memes postados pelo usuário também são armazenadas em memória. Imagem retirada de
[75].
a atenção limitada dos usuários, tanto a tela como a memória possuem capacidade finita,
que é o tempo durante o qual um post permanece na tela ou memória de um agente.
Para todos os agentes, os posts são removidos após uma unidade de tempo, o que simula
uma unidade de tempo real, correspondente a Nu etapas, onde Nu é o número de agentes.
Se as pessoas utilizam o sistema uma vez por semana, em média, a unidade de tempo
corresponde a uma semana.
Resultados da Simulação
O modelo apresenta três parâmetros: pn regula a quantidade de novidades que entram no
sistema (número de avalanches), pr determina a atividade geral de retuı́tagem (tamanho
das avalanches) e pm representa o foco individual (diversidade de interesses dos usuários).
Todos os três foram diretamente estimados a partir de dados empı́ricos.
Para obter uma rede de dimensões administráveis preservando a estrutura da rede social
20
real, foi feita a amostragem de um grafo direcionado de 105 nós da rede de seguidores
R
do TWITTER
. Os nós correspondem a um subconjunto de usuários que geraram os
posts incluı́dos nos dados empı́ricos. Para avaliar as previsões do modelo, os autores
compararam essas previsões com dados empı́ricos que incluem somente os retuı́tes do
mesmo subconjunto de usuários. Para estudar o papel desempenhado pela estrutura da
rede no processo de difusão de memes, também foi feita a simulação do modelo numa rede
randômica Erdos-Renyi (ER) com o mesmo número de nós e enlaces. Como mostra a Fig.
3.8, o modelo captura as principais caracterı́sticas das distribuições empı́ricas de duração e
popularidade dos memes, atividade dos usuários e amplitude da atenção dos usuários. As
distribuições geradas por meio da rede ER revelam que, em geral, a heterogeneidade das
quantidades observadas se reduz substancialmente quando os memes se espalham numa
rede randômica.
Considere, por exemplo, a popularidade dos memes (Fig. 3.8(b)); a rede social real
apresenta ampla (sem escala, não indicada) distribuição de graus com um número compatı́vel de usuários de hubs que possuem um grande número de seguidores. Os memes
espalhados por esses usuários têm probabilidade de alcançar maior popularidade. A
diferença observada na distribuição da amplitude de atenção dos usuários, para valores
baixos e altos de atuação dos usuários na rede (Fig. 3.8(d)), pode ser explicada pela
heterogeneidade no número de amigos. Os usuários com poucos amigos apresentam baixa
amplitude de atenção, enquanto os usuário com muitos amigos ficam expostos a vários
memes e podem, por esse motivo, apresentar maior atuação.
O segundo ingrediente fundamental do modelo apresentado pelos autores é a competição
entre os memes pela atenção limitada dos usuários. Para avaliar o papel dessa competição
no processo de difusão de memes foram simuladas variações do modelo com competição
mais forte ou mais fraca. Isso foi realizado ajustando-se o comprimento tw da janela de
tempo na qual os posts são conservados na tela ou na memória do agente. Uma janela de
tempo mais curta (tw < 1) gera menos atenção e, consequentemente, maior competição
enquanto uma janela de tempo mais longa (tw > 1) permite que se dê atenção a mais
memes, reduzindo-se a competição. Como se pode observar na Figura 3.9, uma competição
mais forte (tw = 0.1) deixa de reproduzir o grande número observado de memes de longa
duração (Fig. 3.9(a)). Por outro lado, uma competição mais fraca (tw = 5) não redunda
em memes extremamente populares (Fig. 3.9(b)), nem em usuários extremamente ativos
(Fig. 3.9(c)).
Também simularam em seu modelo, sem levar em conta os interesses dos usuários, fazendo
o ajuste de pm = 0. A diferença mais notável neste caso é a ausência de indivı́duos
altamente focados. Os usuários não têm lembrança de seu comportamento anterior, sendo
capazes de prestar atenção somente aos memes de seus amigos.
Consequentemente, o modelo deixa de contabilizar os indivı́duos de baixa entropia (não
apresentados, mas semelhantes ao caso da rede randômica da Fig. 3.8(d)).
21
Figura 3.8: Validação do modelo por comparação de simulações com dados empı́ricos. Para estudar o
papel desempenhado pelo estrutura de rede no processo de difusão meme, foi realizada a simulação do
modelo na amostra de rede (linha preta sólida) e uma rede aleatória (linha tracejada vermelha). Ambas
as redes têm 105 nós e cerca de 33106 arestas. (a) A definição do tempo de vida usa a semana como
unidade de tempo. (b, c, d) Dados da popularidade do Meme, a atividade do usuário, e tempo de atenção
do usuário são baseados em medidas semanais. Imagem retirada de [75].
Discussão
As presentes observações demonstram que a combinação de estrutura de rede social
com competição pela atenção finita dos usuários constitui condição suficiente para a
emergência de uma ampla diversidade no que se refere à popularidade e duração dos
memes e à atividade dos usuários. Trata-se de um resultado significativo: podem-se levar
em conta as, frequentemente, registradas distribuições com cauda pesada de popularidade
e duração dos assuntos [82, 87, 89, 102] sem a presunção de fatores exógenos como o apelo
intrı́nseco dos memes, a influência dos usuários ou os eventos externos. A única fonte de
heterogeneidade nesse modelo é a social rede. Os usuários diferem quanto ao tamanho de
seu público, mas não quanto à qualidade de suas mensagens. Esse modelo se inspira na
longa tradição que representa a difusão de informações como um processo epidêmico no
qual a infecção é transmitida através dos laços da rede social subjacente [82, 87, 107].
No contexto da mı́dia social, vários autores pesquisaram a evolução temporal da popularidade. Wu e Huberman [83] estudaram o declı́nio da popularidade das notı́cias. Demonstraram
que os padrões temporais da atenção coletiva são adequadamente descritos por um processo
22
Figura 3.9: Avaliação do modelo de simulação por comparação com os dados empı́ricos. Para estudar
o papel de meme concorrência, simular o modelo na rede seguidor amostrados com diferentes nı́veis de
concorrência. As mensagens são removidas da tela e memória após unidades de tempo tw . Foi comparado
o modelo padrão (tw 51, linha preta sólida) contra as verses com menos concorrência (tw 55, ponto-linha
tracejada magenta) e mais concorrência (tw 50, 1, linha tracejada vermelha). (a) A definição do tempo
de vida usa a semana como unidade de tempo. (b, c, d) A popularidade de um meme, a atividade do
usuário e os dados de entropia do usuário são baseados em medidas semanais. Imagem retirada de [75].
23
multiaplicativo com um único fator de novidade. Embora o declı́nio de popularidade seja
atribuı́do à competição pela atenção, o mecanismo subjacente não é modelado explicitamen
-te. Hogg e Lerman [83] propuseram um modelo estocástico para prever a popularidade
de uma notı́cia com base no interesse intrı́nseco da notı́cia e nos ı́ndices que indicam
se os usuários chegaram até ela diretamente ou por meio dos amigos. Esses modelos
descrevem a popularidade de uma única informação e são, portanto, inadequados para
captar a competição pela nossa atenção coletiva entre várias epidemias de informação
simultâneas. Ainda que modelos epidemiológicos recentes tenham começado a considerar
a difusão simultânea de cepas concorrentes [109, 110], o modelo é a primeira tentativa
de lidar com um número virtualmente ilimitado de novas ‘epidemias’ que são injetadas
continuamente no sistema.
Desde o trabalho seminal de Simon [79], a economia da atenção passou a ser uma noção
imensamente popular, ainda que tenha sido sempre presumida mas não testada. Esse
modelo representa uma primeira tentativa de focalizar explicitamente os mecanismos de
competição e avaliar os efeitos quantitativos de se tornar a atenção mais escassa ou mais
abundante.
Os resultados não constituem prova de que caracterı́sticas exógenas, como os valores
intrı́nsecos dos memes, não tem nenhuma influência na determinação de sua popularidade.
Contudo, mostram que no plano estatı́stico não é necessário invocar explicações externas
para as dinâmicas gerais dos memes que foram observadas. Isso impõe uma ampla revisão
de vários conceitos bastante usados na modelagem e caracterização do processo de difusão
de memes e abre o caminho para diferentes metodologias de análise da competição entre
ideias e estratégias de otimização supressão de sua propagação [75].
3.5
Contágio da informação: um estudo empı́rico da
R
divulgação de notı́cias nas redes sociais DIGG
R
e TWITTER
Os autores Kristina Lerman e Rumi Ghosh afirmam que cientistas sociais já detectaram
a importância das redes sociais na divulgação da informação [15] e da inovação [111].
Modernas tecnologias de comunicação como o já conhecido correio eletrônico e mais
recentemente a mı́dia social tem reforçado o papel das redes na área de marketing [112][113],
na divulgação de informação [114], na ‘procura’ [115] e na perı́cia de descobertas [117].
O novo DARPA Network Challenge [118] testou com sucesso a capacidade maciça de
mobilização de equipes através das redes sociais online para solucionar problemas reais
que potencialmente poderi-am melhorar a agilidade do desempenho e a coordenação de
esforços no momento de um desastre [116].
Além de fazer com que as redes sociais tenham um duplo sentido, os sites de mı́dia social
24
permitiram que os pesquisadores tivessem acesso a uma quantidade enorme de dados para
que uma análise empı́rica pudesse ser realizada. Esses conjuntos de dados são uma fonte
importante de evidências para o estudo da estrutura das redes sociais [119], das dinâmicas
do indivı́duo [120] e do comportamento em grupo [121], propriedades global da divulgação
das mensagens de correio eletrônico [122, 123], postagens em blogs [124] e identificação de
blogs que são considerados formadores de opinião [114, 125]. Na maioria desses estudos,
entretanto, a estrutura de base da rede não era visı́vel e teve que ser inferida a partir do
fluxo de informação de um indivı́duo para o outro. Isso criou um grande desafio para a
compreensão de como a estrutura da rede afeta a dinâmica da divulgação de informação,
salientam Lerman e Ghosh [116].
Compreender essa questão é especialmente importante para a eficácia do uso da mı́dia
social e dos sistemas de ponto a ponto, que comumente agregam outras atividades ou
contribuições feitas por várias pessoas com o objetivo de identificar tendências. A maioria
desses sites também dão visibilidade as atividades dos enlaces das pessoas nas redes sociais.
Uma vez que as pessoas criam laços com outras pessoas que tem algo em comum com elas
ou com pessoas cujas contribuições elas acham interessantes, a dinâmica de informação de
uma rede social pode ser diferente da dinâmica de uma população em geral. Separando
as atividades de uma rede interna das atividades de uma rede externa permite, entre
outras coisas, melhor estimar a qualidade inerente das contribuições [126] ou prever suas
atividades futuras [127, 128].
R
R
Lerman e Ghosh apontaram os sites de notı́cias DIGG
e TWITTER
como uma
oportunidade única de poder estudar as dinâmicas de divulgação de informação nas redes
sociais. Ambos os sites se tornaram fontes importantes de informação oportuna para as
R
pessoas. O agregador de notı́cias sociais DIGG
permite aos usuários submeter endereços
de internet para notı́cias recém divulgadas e permite que os usuários votem nas notı́cias
R
submetidas pelos outros. No TWITTER
, os usuários tuitam pequenas mensagens de
texto que normalmente contém endereços de internet para acessar as últimas notı́cias e
comentários ou retuitam messagens dos outros. Ambos os sites permitem que os usuários
explicitamente criem conexões com outros usuários que eles querem seguir. Outro traço
comum e importante desses sites é a transparência dos dados e o fornecimento de acesso
a dados detalhados sobre as notı́cias e sobre as atividades do usuário [116].
Um estudo empı́rico foi apresentado sobre o papel das redes sociais na divulgação de
R
R
informação pelo DIGG
e pelo TWITTER
. Para esse estudo, foram coletados dados
R
R
sobre notı́cias populares no DIGG e no TWITTER
que incluı́am informação sobre
quem votou ou retuitou a notı́cia e quando isso aconteceu. Esses conjuntos de dados
permitiram caracterizar empiricamente as dinâmicas individuais, a estrutura da rede e
mapear a disseminação do interesse em notı́cias através da rede. Primeiro, empiricamente
a estrutura das redes sociais em ambos os sites foi caracterizada. Enquanto que o número
de fãs que um usuário possui em cada site demonstra uma extensa distribuição a rede
R
R
social DIGG
é mais densa e mais interconectada que o TWITTER
, assim julgada
25
pelo número recı́proco de enlaces e do coeficiente de aglomeração da rede.
Em seguida, apresentaram a evolução do número de votos que as notı́cias recebem, além
de perceberem que a interface do usuário afeta a dinâmica dos votos sendo que a evolução
R
das notı́cias do DIGG
acontece em dois estágios diferentes. Apesar disso, o número de
votos acumulados pelas notı́cias em ambos os sites satura depois de um perı́odo de mais
ou menos um dia em um valor que reflete a popularidade delas.
Também foi observada como a informação é divulgada através da rede social medindo de
que maneira o número de participantes de redes internas vota as notı́cias recebidas, como
por exemplo, os votos dos fãs da pessoa que submeteu a notı́cia ou os votos anteriores e
como mudam com o tempo. Assim, concluı́ram que a estrutura da rede afeta a dinâmica
de divulgação de informação atingindo os pontos de convergência mais rápido em uma
R
R
rede mais densa como a do DIGG
do que a do TWITTER
. Entretanto, as notı́cias
R
do TWITTER tem mais alcance quando disseminadas a julgar pelo número total de
votos recebidos pelos integrantes das redes internas.
Dinâmicas da votação
A Figura 3.11(a) mostra a evolução do número de votos recebidos em três notı́cias
R
divulgadas pelo DIGG
sobre o perı́odo de agitação que seguiu as eleições no Irã em
junho de 2009. Enquanto os detalhes das dinâmicas se diferenciam, as caracterı́sticas
R
gerais da evolução dos votos são compartilhadas por todas as notı́cias do DIGG
e
podem ser descritas por um modelo estocástico de voto social [129]. Ainda na fila, as
notı́cias que serão publicadas acumulam votos em uma velocidade menor. O ponto onde
a curva muda abruptamente corresponde à promoção (dessa notı́cia) para a página inicial.
Após a promoção a notı́cia é vista por um grande número de pessoas e o número de votos
aumenta em uma velocidade maior. Com o ‘envelhecimento’ da notı́cia, o acúmulo de
novos votos diminui [130] e, finalmente, satura. A Figura 3.11(b) mostra a evolução do
número de vezes que uma notı́cia sobre o mesmo tópico foi ‘retuitada’. O número de
‘retuites’ aumenta lentamente até a saturação. O perı́odo de saturação de uma notı́cia é
de mais ou menos um dia quando o número de votos/‘retuites’ satura em ambos os sites.
Distribuição da popularidade
O número total de vezes que uma notı́cia foi votada e ’retuitada’ indica a popularidade
R
R
entre os usuários do DIGG
e do TWITTER
respectivamente. A distribuição da
popularidade da notı́cia em ambos os sites, Figura 3.11, mostra a desigualdade da popularidade [63] com relativamente poucas notı́cias se tornando muito populares ganhando
milhares de votos, enquanto muitas são bem menos populares recebendo menos de 500
R
R
votos no DIGG
e 400 no TWITTER
. Esses valores são bem descritos por uma
26
distribuição logarı́tmica normal (apresentada em destaque na figura).
A distribuição logarı́tmica normal da popularidade de uma notı́cia é tı́pica das distribuições
de cauda pesada associada com produção social e consumo de conteúdo. Em uma distribuição cauda pesada, um pequeno, mas não insignificante número de itens, gera, de forma não
convencional, uma grande quantidade de atividade. Essas distribuições foram observadas
R
em diferentes contextos, incluindo o ato de votar no DIGG
[130] e Essembly [131]
R
edições de artigos no WIKIPEDIA [132] e downloads de músicas [63]. Compreender a
origem de tais distribuições é o próximo desafio na criação de um modelo de atividade do
usuário nos sites de mı́dia social para esses autores.
Dinâmicas de votação nas redes
R
No momento da submissão de uma notı́cia no DIGG
, uma lista das próximas notı́cias
fica visı́vel para os fãs dos que submetem através da interface dos amigos. Na medida que
os usuários votam na notı́cia, essa fica visı́vel para seus fãs via a interface dos amigos.
Analogamente à disseminação de uma doença contagiosa [133], o interesse em uma notı́cia
cascateia pela rede social. Quando a notı́cia é promovida para a página inicial, ela se
torna visı́vel para os que não são fãs, apesar dos usuários poderem selecionar as notı́cias
R
que os amigos gostaram através da fita verde na identificação da notı́cia no DIGG
.
R
Similarmente, um novo post no TWITTER fica visı́vel para os seguidores daquele que
o submeteu e cada usuário que retuitou essa notı́cia a difunde para seus seguidores.
Apesar de agregadores como ‘Tweetmeme’ tentarem identificar notı́cias populares no
R
R
TWITTER
da maneira como o DIGG
faz, não existe evidência que eles promovem
a visibilidade delas para os que não são fãs.
Os autores puderam traçar a cascata de interesse que uma notı́cia desperta através da
R
‘base’ da rede social do DIGG
verificando se um novo voto veio de um fã (seguidor)
de alguém que votou anteriormente, incluindo quem submeteu a notı́cia. Tais votos são
R
R
chamados de voto dos fãs, independentemente se estão no DIGG
ou no TWITTER
.
Assim sendo, a cascata (contágio da informação) começa com a submissão de notı́cias
e cresce à medida que a notı́cia acumula os votos dos fãs. Pesquisadores já estudaram
cascatas de informação em e-mails [122, 123] e em posts nos blogs [114, 124] com o objetivo
de obter pistas da estrutura da rede, de identificar interferências que influenciam ou de
prever a popularidade de um conteúdo[128]. Caracterizar as cascatas de informação faz-se
necessário para a criação de um modelo da dinâmica de informação nas redes.
Dinâmicas e distribuição dos votos dos fãs
A linha pontilhada na Fig.3.11 mostra como o número de votos dos fãs recebido para
cada notı́cia cresce com o tempo. A evolução deles é similar a de todos os votos e o
27
Figura 3.10: Distribuição da atividade do usuário. (a) Número de fãs ativos por usuário vs o número
R
de usuários com muitos fãs no DIGG
. A distribuição mostra a atividade de votação, ou seja, o número
de votos por número de usuário vs número dos usuários que lançam muitos votos. (b) O número de
R
seguidores ativos por usuário nos dados do TWITTER
vs o número de usuários com muitos seguidores.
Apresentação da distribuição da atividade de retuitagem. Imagem retirada de [116].
crescimento satura no perı́odo de mais ou menos um dia. O valor no qual o crescimento
satura demonstra o alcance da notı́cia ou como amplamente ela penetra na rede social. A
R
Fig.3.13 mostra a distribuição do tamanho das cascatas geradas pelas notı́cias do DIGG
R
e do TWITTER
. Essas distribuições são marcadas diferentemente da distribuição da
popularidade de uma notı́cia conforme mostra a Figura 3.12. Embora a distribuição
R
da cascata da rede das notı́cias do DIGG
, Figura 3.13(a) ser um pouco assimétrica, é
melhor descrita por uma média e o desvio padrão igual a 104.27 e 32,31 votos respectivamente, e não a distribuição de lognormal na figura3.12(a). Notavelmente, nenhuma notı́cia
deixou de gerar uma cascata, ou seja, nenhuma notı́cia deixou de receber votos dos fãs.
O fluxo na Figura 3.13(a) mostra as distribuições de votos de somente um fã de um
usuário. Também pode ser descrito como uma função normal com uma média em torno de
50 votos. Uma pequena fração de notı́cias, menos que 400, não recebeu nenhum voto dos
fãs das pessoas que as submeteram. Isso indica que usuários ativos que são fãs daqueles
que submetem são também fãs dos outros que votam, em outras palavras, que a rede
R
social dos usuários ativos do DIGG
é densa e altamente interligada. Essa observação é
fundamentada por descobertas de um coeficiente de aglomerização relativamente alto da
R
rede social do DIGG
.
R
é mostrada na
A distribuição do tamanho da cascata das notı́cias do TWITTER
Figura 3.13(b). Tudo indica que elas são normalmente distribuı́das, apesar de um número
substancial de notı́cias não serem disseminadas na rede. Essa distribuição é maior que a
R
distribuição das notı́cias do DIGG
indicando que uma notı́cia se espalha mais na rede
R
do TWITTER . A distribuição do número de votos elencados pelos seguidores de quem
submeteu, conforme mostrado no fluxo da Figura 3.13(b), é marcadamente diferente do
R
DIGG
. A grande maioria das notı́cias não recebe votos dos seguidores de quem as
submeteu, indicando que os seguidores de quem as submeteu e outros seguidores de quem
28
votou estão desconectados. Essa observação é fundamentada pela descoberta de que a
R
rede social TWITTER
é escassamente interconectada.
R
R
. (a) Número total de votos (diggs) e os
e TWITTER
Figura 3.11: Dinâmica de notı́cias no DIGG
R
votos recebidos das notı́cias pelos fãs no DIGG . (b) Número total de vezes que uma notı́cia foi votada
(‘retuitada’) e o número de votos (‘retuites’) de seguidores desde a primeira postagem vs tempo. Imagem
retirada de [116].
Trabalhos relacionados
Vários pesquisadores estudaram as dinâmicas do fluxo de informações nas redes, entretanto,
trabalhos empı́ricos produziram resultados conflitantes. Foram examinados padrões de
e-mail enviados dentro de uma organização e descobriu-se que a corrente de e-mails
enviados chega ao fim inesperadamente após ter vencido um pequeno número de etapas.
Os autores discutem que, ao contrário da propagação de um vı́rus em uma rede social,
quando é esperado que muitos indivı́duos sejam atingidos, o fluxo de informação desacelera
devido a queda de similaridade entre indivı́duos em uma mesma rede social. Os autores
também mediram a semelhança pela distância em uma hierarquia organizacional entre
dois indivı́duos de uma mesma organização, no caso, com o um número de fronteiras
separando dois pontos de conexão em um gráfico [122].
Semelhantemente, em um estudo de larga escala sobre a eficiência da recomendação de um
produto através do boca-a-boca,Leskovec, Adamic e Huberman descobriram que a maioria
das sugestões de correntes numa rede termina depois de um ou de dois passos. Entretanto
os autores perceberam sensibilidade nas recomendações de preço e de categoria de produto,
deixando sem resposta a questão sobre se as redes sociais são uma ferramenta eficiente na
divulgação de informação, preferencialmente na compra de produtos [134]. Além do mais,
o alcance da informação propagada parece não depender da semelhança entre os usuários.
R
No DIGG
, onde os usuários são altamente interconectados, uma notı́cia não alcança
R
tantos fãs como alcança no TWITTER
, onde os usuários são menos conectados.
29
Figura 3.12: Distribuição de popularidade da notı́cia. (a) Distribuição do número total de votos
R
recebidos por notı́cias no DIGG
com o ajuste da curva mostrando log-normal. (b) Distribuição do
número total de vezes que as notı́cias foram retuitadas com o ajuste da curva mostrando log-normal.
Imagem retirada de [116].
Figura 3.13: Distribuição de tamanhos de cascatas de notı́cias. (a) Histograma da distribuição do
R
número total de votos recebidos pelo DIGG
. A inserção mostra a distribuição do número de votos de
fãs do noticiador. (b) Histograma da distribuição do número total de retuites de seguidores. A inserção
mostra a distribuição do número de retuites de uma notı́cia pelos seguidores do noticiador. Imagem
retirada de [116].
Wu et al. [123] estudaram os padrões de envio de dois e-mails bem conhecidos de corrente.
Ao contrário de suas expectativas, a corrente de envios produziu longas e estreitas árvores,
ao invés de largas e espessas. Nesses estudos, entretanto, a estrutura de base de uma rede
social não estava diretamente visı́vel e teve que ser inferida através da observação de
novas inscrições no encaminhamento de e-mails. Esse método oferece não só uma visão
parcial da rede e não identifica todas as fronteiras entre indivı́duos que participaram da
corrente do e-mail. Se um indivı́duo já encaminhou uma mensagem, ele não a encaminhará
novamente e uma fronteira entre esse indivı́duo e remetente não será vista.
Um número de pesquisadores estudou o fluxo de informação e de influência na blogosfera
e no mundo virtual. Gruhl et al.[114] traçaram a divulgação de tópicos através dos
blogs e usaram um modelo de divulgação de epidemias nas redes [133] com o objetivo de
caracterizar a divulgação de tópicos através da blogosfera. Leskovec et al.[124] definiram
30
uma cascata de informação como um gráfico de hyperlinks entre os blogues de postagem.
Uma cascata de informação começa com um ‘iniciador’ de cascatas com outras postagens
de outros blogs juntando-se a ela conectando-se com o iniciador ou outros membros da
cascata. Leskovec et al.[124] descobriram que os tamanhos da distribuição da cascata
seguem uma lei de potência. Bakshy traçou a propagação da influência em um jogo em
rede de diversos atores e descobriu que, semelhante as descobertas com notı́cias sociais,
a influência propaga facilmente nas redes sociais em mundos virtuais. Isso proporciona
uma confirmação independente da importância das redes sociais nas dinâmicas do fluxo
de informação [135].
31
Capı́tulo 4
Modelo Proposto
4.1
Objetivo Geral
O objetivo desse capı́tulo é apresentar um modelo de redes sociais de internet que seja
capaz de reproduzir as propriedades estatı́sticas observadas na redes reais. Neste trabalho,
criamos através da linguagem computacional C + +, um sistema orientado ao objeto
capaz de, em primeiro lugar, criar redes regulares, aleatórias e de mundo pequeno. O
microcomputador utilizado para originar as redes tinham as seguintes caracterı́sticas:
Intel Pentium Dual Core 2.2 GHz, possuindo 2 GB de memória RAM, um HD de 120 GB
e com sistema operacional Linux Ubuntu 10.04 LTS.
Como descrito no capı́tulo de conceitos básicos, utilizamos diversas ferramentas para
construir o modelo. As redes foram criadas de acordo com a topologia existente, sendo
a primeira rede, a rede regular quadrada. Esta foi desenhada com a premissa de um
nó ter sempre quatro vizinhos conectados como pode ser visto na Figura 4.1(a). Por
diante, seguimos no desenvolvimento para a criação das redes aleatórias conservativas e
não conservativas. Como parte final da preparação do ambiente, criamos a rede de mundo
pequeno. Essa última desenhada reutilizando parte do código desenvolvido para as redes
aleatórias.
Após a preparação do ambiente, decidimos focar o desenvolvimento do trabalho nas redes
de mundo pequeno, rede de maior similaridade com as redes sociais do mundo real. A
abordagem proposta no modelo foi construir a rede social através de um autômato celular.
O comportamento coletivo gerado pelas interações entre os usuários da rede pode ser capaz
de reproduzir fenômenos que acontecem nas redes sociais. Abordagens análogas também
já foram realizadas em estudos de espalhamento de epidemias no mundo real como pode
ser visto na Figura 3.2 da seção 3.2.
O modelo proposto considera uma matriz de N ×N dimensões com condições periódicas de
contorno. A rede regular quadrada (Figura 4.1(a)), possui cada sı́tio mantendo conexões
32
com quatro vizinhos. As dimensões dessa rede foram simuladas para uma matriz N × N
com o valor de N = 4. Como podemos acompanhar no fluxograma apresentado na Figura
4.2, o passo seguinte acontece com a criação da rede aleatória conservativa vista na Figura
4.1(b).
(a) (b) Figura 4.1: (a) Desenho de uma rede regular quadrada; (b) Representação de uma rede aleatória
conservativa.
Consideramos a rede regular criada, como a base inicial para a criação da rede aleatória
conservativa. A reutilização de informações pelo sistema foi executada através de uma
função que transfere a imagem da rede regular quadrada para a nova rede. A função
escolhe de forma aleatória um sı́tio, em seguida altera aleatoriamente suas coordenadas
de conexão. Este processo, está inserido em um laço do sistema que faz percorrer toda
a dimensão da rede. Importante dizer que o número de ligações entre os nós da rede
permanece inalterado até o fim da execução.
Em seguida, criamos a rede aleatória não conservativa. O processo de criação da rede
aleatória não conservativa inicia com a cópia da rede aleatória conservativa. No passo
seguinte, ocorre a escolha aleatória de um sı́tio, e após a escolha do nó, uma conexão
aleatória é feita. O laço que faz percorrer toda a rede envolve o processo de escolha
aleatória dos sı́tios e de suas conexões. Conexões idênticas não são permitidas. O resultado
desse processo pode implicar em sı́tios sem conexão, diferenciando assim as duas redes
aleatórias. A geração da rede de mundo pequeno foi implementada nessa versão como
ponto final para a criação de nosso ambiente de simulações. A rede de mundo pequeno
foi criada a partir da rede aleatória não conservativa, um dos benefı́cios da codificação
orientada a objetos. A rede de mundo pequeno é criada a partir do processo que escolhe
aleatoriamente um sı́tio da rede. É um processo similar ao da rede não conservativa.
Entretanto, utilizamos de um contador para cada sı́tio. O sı́tio escolhido como fonte da
conexão recebe um incremento em seu contador. A ligação desse ponto de origem ao de
33
Gera Rede Quadrada Gera Redes Aleatórias Gera Rede de Mundo Pequeno Calcula distância entre vizinhos Execução Não A rede gerada foi toda lida? Sim Gera arquivos de dados estaBsBcos Fim Figura 4.2: Fluxograma simplificado da criação das redes do modelo computacional.
destino é feita também de forma ateatória. O contador de conexões de cada sı́tio começa
assim a interferir na escolha de sı́tios no sistema. Durante a execução, os sı́tios que tem
maior número de conexões tem maior probabilidade de serem escolhidos possuindo assim
cada vez mais conexões. Esse processo resulta em sı́tios com muitas conexões e outros com
pouquissı́mas conexões. Geramos gráficos a partir de estatı́sticas das distâncias entre os
nós conectados. A distribuição das distâncias entre os nós da rede apresentada na figura
4.3 segue a tendência de comportamento coerente com caracterı́sticas de redes de mundo
pequeno com a quantidade relativa de conexões de curto e médio alcance em relação ao
tamanho da rede.
Assim, o modelo computacional foi construı́do em sua primeira parte para a preparação
e simulação do ambiente onde as informações serão disseminadas. A rede de mundo
pequeno que acaba de ser criada será utilizada em nosso modelo para representar a rede
social onde faremos o nosso estudo. Nossa rede social é constituı́da por usuários que
34
Data: Data3_B
Model: Allometric2
Chi^2/DoF
= 0.2089
R^2
= 0.95495
-115.00191
156.83576
-0.08834
±263.15869
±261.4109
±0.16927
Distâcias
a
b
c
10
1
10
Distribuição
Figura 4.3: Distribuição das distâncias entre os usuários para uma de mundo pequeno com L = 96 .
podem ter diversos tipos de comportamento como: receber notı́cias aleatoriamente a
partir de uma central de notı́cias, receber notı́cias de um amigo via rede e enviar notı́cias
aos seus vizinhos. O envio de notı́cias por parte dos usuários também deflagra o processo
de disseminação da informação em cascata que ocorre no momento em que as notı́cias são
encaminhadas aos vizinhos dos vizinhos conectados.
O processo acima descrito foi implementado em nosso sistema obedecendo a criação de
objetos estruturados, onde pudemos instanciar os posts, o seu assunto principal, a lista de
notı́cias de maior preferência de cada usuário e a lista das 12 notı́cias mais reencaminhadas
na rede a cada perı́odo de tempo.
A dinâmica desse processo pode ser melhor entendida com a leitura do fluxograma apresentado na Figura 4.4, que inicia com a transferência da rede de mundo pequeno para a
rede social de usuários. Consideramos essa premissa pelo motivo de um usuário estar
conectado a pelo menos um vizinho fazendo assim parte de uma rede social. O passo
seguinte acontece na população de notı́cias de nossa central de notı́cias.
A estrutura do ‘objeto’ notı́cias em nosso modelo é composta por um vetor de 8 posições.
O vetor é preenchido de forma aleatória em todas as posições com valores entre [0,1].
Os usuários foram instanciados em um objeto que guardam as coordenadas de conexões
com seus amigos, o grau de interesse de assuntos veiculados na rede e uma lista de suas
12 notı́cias preferidas. O despejo de notı́cias na central acontece de forma aleatória. A
lista de notı́cias preferidas de cada usuário atende o critério de quanto maior o grau de
similaridade da notı́cia com o seu perfil, melhor posicionada estará.
Para o processo de assimilação e disseminação de notı́cias desenvolvemos um critério
de classificação das informações. Tal critério foi idealizado utilizando como fonte o
35
•  Gera Rede de Mundo Pequeno •  Transfere Rede de Mundo pequeno para a Rede Social •  Despeja de forma aleatória no;cias de conteúdo aleatório na rede •  Inicia Ciclo do Usuário •  Inicia laço Temporal •  Ordena no;cias preferidas do usuário •  Recebe No;cias •  Atualiza lista de No;cias preferidas Não Conteúdo de No;cia atende preferência? Sim Envia no;cias preferidas para vizinhos •  Encerra Ciclo do Usuário Sim t < T ? •  Atualiza Central de No;cias Não 00011000 00011001 : : 12 No;cias mais populares Fim Figura 4.4: Fluxograma simplificado da dinâmica do modelo de disseminação de informações em uma
rede de mundo pequeno.
modelo de Penna, que consiste em comparar cadeia de bits com determinada regra e
prover um determinado resultado. Para tal processo de averiguação de classificação da
informação implementamos um vetor de 8 posições que compoem a natureza de toda
peça de informação presente na rede. A informação é representada literalmente por um
conjunto de 8 valores dentro do intervalo [0,1]. A Figura 4.5 representa como o sistema
gera de forma aleatória a sequência. Esse conjunto é submetido a uma verificação por
usuário a cada iteração do sistema. A função verifica através de uma operação lógica o
grau de semelhança entre a sequência de valores da informação recebida com o perfil do
usuário. O resultado da operação é considerado para que a informação seja aceita ou não
em sua lista de preferências. O grau de interesse foi implementado no sistema de forma
que todas as informações presentes na rede, quando direcionadas a um usuário, sofreria
uma comparação lógica de todos os seus 8 bits, alcançando um valor que pode flutuar no
intervalo de 0 a 7. Para tal classificação definimos que o valor 0 classificaria a informação
36
com seu conteúdo totalmente genérico e o valor com o limite de até 7 pontos representaria
a adequação total do conteúdo da informação disponibilizada na rede com o perfil do
usuário da rede.
Resultado (grau de semelhança) No2cia inserida na rede 1 1 1 0 1 0 1 1 = Operação lógica Preferência usuário 1 0 1 1 0 0 0 4 1 Figura 4.5: Cadeia de bits de informação tomando como referência o conceito do modelo de Penna.
Como descrito acima, a notı́cia é triada e classificada com o grau de similaridade ao
perfil configurado para cada usuário. Isso quer dizer que o usuário ao receber as notı́cias
guardará apenas as de sua preferência em sua lista de notı́cias, onde serão valoradas
pelo grau de semelhança de acordo com seu perfil. O grau de semelhança foi testado na
primeira fase de simulações com o valor igual a 3. Esse parâmetro sofreu alterações para
simulações posteriores.
Outro componente importante do sistema que merece explanações é a central de notı́cias
da rede. Essa recebe no inı́cio da execução do sistema uma avalanche de notı́cias ainda não
encaminhadas aos usuários. A partir do momento que os usuários começam a recebê-las,
a dinâmica do sistema começa fazer com que os usuários contribuam para a disseminação
das notı́cias de seu interesse e assim destacá-las com o passar do tempo na central de
notı́cias. As notı́cias de maior circulação são direcionadas para central de notı́cias a cada
espaço de tempo. Esse processo permite que o ciclo de vida de cada notı́cia seja renovado a
cada instante. Ao contrário de notı́cias que despertam pouco interesse entre os usuários, o
resultado é o desaparecimento imediato da rede. A central tem a capacidade de armazenar
as doze notı́cias mais vinculadas na rede a cada hora através de uma matriz de 12 posições.
Em nosso modelo, fizemos diversas simulações variando os tamanhos das redes de mundo
pequeno de extensão linear L. Alteramos a cada momento a quantidade de informações
despejadas na rede e o grau de preferência de notı́cias dos usuários da rede.
A primeira simulação foi executada com a variação do tamanho da rede. Alteramos o
37
parâmetro de extensão linear para L = 10. O tamanho dessa rede abre a possibilidade
de termos um número de 200 usuários ativos. O número de notı́cias que será despejado
na rede é também um parâmetro alterado em cascata em nosso sistema. A quantidade
de notı́cias sofre impacto quando ocorre a variação do valor de L. O valor de L é um dos
componentes para calcular o volume de notı́cias que estará presente na rede. O objetivo
desse conjunto de variações é entender como o sistema se comporta com o aumento de
escala da rede e consequentemente o volume de notı́cias circulantes. O grupo de variações
dos parâmetros segue uma ordem crescente. Essas variações afetam o ciclo de vida de
cada notı́cia na rede. Podemos observar a tendência de variação do tempo de vida das
notı́cias de acordo com o crescimento da rede. O reflexo de diminuição de perenidade
das notı́cias pode ser visto na transição do histograma (a) para o (b) da figura 4.6. As
distribuições seguem a tendência de quanto maior a rede e seu volume de informações
vinculadas, maior a tendência do sistema entrar em colapso. A curva ajustada a equação
Gaussiana tem seu coeficiente cada vez mais próximo de 1, como observamos na figura
4.6(d), com um alcance de 0,998, seguindo a tendência de crescimento da rede e do volume
de notı́cias. No conjunto de histogramas da figura 4.6, observamos que o tempo de vida
das notı́cias tende a reduzir, de acordo com a quantidade de notı́cias despejadas na rede.
Suspeitamos que a diminuição do tempo de vida da informação pode ter como causa
o tamanho reduzido do objeto ‘notı́cias’(apenas 8 posições), a grande similaridade de
conteúdo e o aumento do volume de informção circulante resultando em um cenário de
grande competição pela atenção dos usuários da rede. Essa suspeita pode ser reforçada
quando deparamos com os resultados estatı́sticos a seguir apresentados na Figura 4.7.
Como descrito na dinâmica do nosso modelo, as notı́cias podem ser enviadas a outros
usuários da rede. Com o objetivo de mapear esse comportamento, registramos o número
de vezes que cada notı́cia foi reenviada para outro usuário. As notı́cias podem possuir
reenvios diversos ou nenhum. Para tal entendimento geramos um conjunto de histogramas
que apresenta como o reenvio das notı́cias sofreu impacto quando ocorreu o aumento da
quantidade de notı́cias na rede. Podemos perceber na evolução dos histogramas presentes
na figura 4.7, que com o volume de notı́cias da rede aumentando fica cada vez mais difı́cil
a mesma notı́cia ser reenviada por diversas vezes. Na figura 4.7(a), vemos que diversas
notı́cias foram reenviadas por 5 vezes, tendo assim o seu ciclo de vida renovado, o que
não podemos perceber nos histogramas 4.7(b),(c) e (d), onde nesse último ocorre uma
redução brutal dos reenvios das notı́cias.
Após termos exercitado essas simulações com a variação do tamanho da rede e quantidade
de informações despejadas nos ambientes, partiremos para a próxima etapa, que consiste
em fixar o tamanho da rede e a quantidade de informações veı́culadas e variar o grau de
preferência do usuário na rede.
38
Data: Graph1_Counts1
Model: Gauss
Data: Graph1_Counts1
Model: Gauss
200
Chi^2/DoF
= 2030.51633
R^2
= 0.99806
Chi^2/DoF
= 32.0716
R^2
= 0.99573
y0
xc
w
A
0.91923
1192.9179
279.86682
68796.79329
±2.99368
±3.62821
±9.42788
±2708.39427
y0
xc
w
A
0.17038
400.5417
154.28573
445135.57537
±26.58183
±1.29141
±3.5855
±12626.50539
1500
Notícias
Notícias
150
2000
100
1000
50
500
0
0
600
800
1000
1200
1400
1600
200
300
400
Tempo de vida
500
(a) y0
xc
w
A
Data: Graph1_Counts1
Model: Gauss
Chi^2/DoF
= 15304.84608
R^2
= 0.99693
5000
700
(b) Data: Graph1_Counts1
Model: Gauss
6000
600
Tempo de vida
Chi^2/DoF
= 162155.39577
R^2
= 0.99604
16000
10.50019
±41.42037
202.30412
±0.73666
106.48858
±1.81713
776952.62879 ±14948.20237
y0
xc
w
A
14000
12.18303
±138.54256
136.45982
±0.76141
87.16443
±1.83581
1811952.32631 ±42181.25543
12000
Notícias
Notícias
4000
3000
10000
8000
6000
2000
4000
1000
2000
0
0
0
100
200
300
400
50
100
150
200
250
300
350
Tempo de Vida
Tempo de vida
(c) (d) Figura 4.6: Distribuição do tempo de vida das notı́cias em redes de mundo pequeno de diversos
tamanhos.(a) Para uma extensão Linear de L = 10; (b) Para uma extensão Linear de L = 30;(c) Para
uma extensão Linear de L = 60;(d) Para uma extensão Linear de L = 90
Caracterı́sticas das atividades do usuário conforme seu perfil
A definição de um usuário ativo é qualquer um que tenha votado em pelo menos uma
notı́cia. Existem 950 usuários ativos na rede de acordo com nossa simulação. Na rede
de mundo pequeno, os usuários ativos designaram pelo menos um outro usuário como
amigo totalizando 18434 enlaces de amigos. A partir desses dados, a rede de seguidores
dos usuários ativos foi desenhada, como por exemplo, usuários ativos que acompanham
as atividades de outros usuários. Em seguida, as atividades dos usuários pertencentes a
rede foram caracterizadas. Nesta seção de simulações, temos a rede social já criada, bem
como o número de notı́cias circulantes. Os 950 usuários ativos do conjunto de dados da
rede podem votar em L × L × L, sendo L = 96, totalizando 884.736 notı́cias. Assim, como
já mencionado, iniciamos a variação do parâmetro diretamente relacionado com o grau
de preferência de notı́cias do usuário da rede. Então, uma vez fixada a extensão linear
da rede social e a quantidade de notı́cias circulantes, pretendemos indentificar como o
sistema se comporta perante a percepção do conteúdo de uma mensagem veı́culada sobre
a ótica dos usuários ou aglomerados de usuários. Na Figura 4.8 temos um conjunto de
39
7000
300
6000
250
5000
Notícias
Notícias
350
200
150
4000
3000
100
2000
50
1000
0
0
1
2
3
4
5
6
7
1.0
1.5
2.0
2.5
Reenvios
3.0
3.5
4.0
4.5
5.0
Reenvios
(a) (b) 35000
80000
30000
60000
20000
Notícias
Notícias
25000
15000
40000
10000
20000
5000
0
1.0
1.5
2.0
2.5
3.0
3.5
0
4.0
1.0
Reenvios
(c) 1.5
2.0
2.5
3.0
3.5
4.0
Reenvios
(d) Figura 4.7: Distribuição de reenvios das notı́cias em redes de mundo pequeno de diversos tamanhos.(a)
Apresenta a distribuição do tempo de vida das notı́cias em uma rede de mundo pequeno com extensão
linear de L = 10, com N = 2 × L × L = 200 enlaces com a quantidade de 698 notı́cias na rede que foram
lidas pelo menos uma vez; (b) Apresenta a distribuição do tempo de vida das notı́cias em uma rede de
mundo pequeno com extensão linear de L = 30, com N = 2 × L × L = 1.800 enlaces com a quantidade de
8900 notı́cias na rede que foram lidas pelo menos uma vez;(c) Apresenta a distribuição do tempo de vida
das notı́cias em uma rede de mundo pequeno com extensão linear de L = 60, com N = 2 × L × L = 7.200
enlaces com a quantidade de 39.078 notı́cias na rede que foram lidas pelo menos uma vez;(d) Apresenta
a distribuição do tempo de vida das notı́cias em uma rede de mundo pequeno com extensão linear de
L = 90, com N = 2 × L × L = 16.200 enlaces com a quantidade de 90.828 notı́cias na rede que foram
lidas pelo menos uma vez.
histogramas, onde acompanhamos a evolução do ciclo de vida das notı́cias e seu alcance
na rede conforme o grau de preferência de um grupo de usuários. Podemos perceber
resultados similares no par de histogramas (a) e (b) da Figura 4.8, onde o grau de
preferência está dentro do intervalo de 1 a 4. O resultado mostra apenas a variação
da quantidade de informações que é insuficiente para alterar de forma significativa o ciclo
de vida das notı́cias e seu alcance na rede. A variação do parâmetro de grau de preferência
começa a impactar e refletir em um comportamento diferente do sistema quando atinge
o valor 5 e assim por diante como poderemos aferir. O histograma (c) da Figura 4.8,
apresenta um aumento significativo do ciclo de vida da notı́cia da rede social, onde
podemos confirmar a tendência na imagem seguinte. Em nosso modelo, identificamos
situações em que o alcance da informação propagada pode sofrer alterações no que diz
40
respeito a preferência do conteúdo vinculado.
Data: Graph1_Counts1
Model: Gauss
20000
18000
y0
xc
w
A
16000
Data: Graph1_Counts1
Model: Gauss
18000
Chi^2/DoF
= 163275.30504
R^2
= 0.99707
Chi^2/DoF
= 221290.4815
R^2
= 0.99545
16000
10.76995
±147.8218
133.30663
±0.63671
79.72997
±1.54095
1902134.87712 ±40836.60526
y0
xc
w
A
14000
14000
6.78022
±182.43018
133.60771
±0.83925
86.65439
±2.09355
1903653.36248 ±52547.48389
12000
Notícias
Notícias
12000
10000
8000
10000
8000
6000
6000
4000
4000
2000
2000
0
0
50
100
150
200
250
300
0
350
0
Tempo de Vida
50
100
150
200
250
300
350
Tempo de Vida
(a) (b) 12000
Data: Graph1_Counts1
Model: Gauss
10000
20000
Data: Graph1_Counts1
Model: Gauss
Chi^2/DoF
= 196277.43084
R^2
= 0.98938
Notícias
87.2126
136.5073
132.38168
1871871.8895
Chi^2/DoF
= 5640534.6542
R^2
= 0.9037
±129.17447
±1.52214
±3.64487
±57671.3594
15000
Notícias
y0
xc
w
A
8000
6000
y0
xc
w
A
582.60589
±591.9308
190.80864
±14.50433
306.42514
±31.97555
8403188.86909 ±833642.69605
10000
4000
5000
2000
0
0
0
100
200
300
400
500
0
Tempo de Vida
500
1000
1500
2000
Tempo de vida
(c) (d) Figura 4.8: Distribuição das notı́cias e seu alcance na rede de mundo pequeno com L = 96 com variação
do grau de preferência dos usuários. (a)Distribuição das notı́cias e seu alcance na rede de mundo pequeno
com L = 96 e um número de 95.266 notı́cias,com valor de preferência do usuário maior que 0; (b)
Distribuição das notı́cias e seu alcance na rede de mundo pequeno com L = 96 e um número de 95.216
notı́cias com valor de preferência do usuário maior que 2;(c)Distribuição das notı́cias e seu alcance na
rede de mundo pequeno com L = 96 e um número de 95.211 notı́cias com valor de preferência do usuário
maior que 4;(d)Distribuição das notı́cias e seu alcance na rede de mundo pequeno com L = 96 e um
número de 95.193 notı́cias com valor de preferência do usuário maior que 6.
A possibilidade restante para essa fase de simulação foi a variação do parâmetro de grau de
preferência para o valor maior que 7, o que traduz a compatibilidade total do conteúdo da
informação veı́cula na rede com o perfil do usuário. Os resultados obtidos nessa simulação
estão, em parte, traduzidos na Figura 4.9, onde acontece uma mudança de comportamento
drástica do sistema. Apesar do ciclo de vida das notı́cias seguir a tendência das simulações
anteriores em primeira impressão, podemos avançar em um melhor entendimento desse
comportamento. O resultado do ciclo de vida das notı́cias e segue a tendência, entretanto
não em sua distribuição. Nesse caso, ocorre um nivelamento das distribuições para a
maioria das mensagens. Diversas notı́cias possuem o mesmo alcance e tempos de vida
41
semelhantes, porém o cenário muda drásticamente para uma quase nulidade do sistema.
Um comportamento totalmente explosivo do sistema.
3500
Data: Graph1_Counts1
Model: Gauss
3000
Chi^2/DoF
= 542254.43887
R^2
= 0.82236
2500
y0
xc
w
A
Notícias
2000
-187.61372
±337.14709
491.40079
±43.56214
794.39839
±125.97837
3874678.62959 ±767466.15024
1500
1000
500
0
0
500
1000
1500
2000
Tempo de Vida
Figura 4.9: Distribuição das notı́cias e de seu alcance na rede de mundo pequeno com L = 96 com um
número de 32.180 notı́cias com valor de preferência dos usuários maior que 7.
Sendo assim, podemos observar pelos histogramas que, apesar de valores de resultados
totalmente distintos, as distribuições acompanham uma semelhança até o momento de
transição. Com o intuito de melhor entender o comportamento do sistema, geramos
dados que apresentam o tempo de vida de cada notı́cia e sua quantidade de reenvios. O
quadro de gráficos apresentado da Figura 4.10, segue a mesma sequência das simulações da
Figura 4.8. A representação dos gráficos da Figura 4.10, como não poderia ser diferente,
segue a dinâmica de resultados dos histogramas da 4.8. Entretanto, podemos indentificar
que o padrão de evolução do sistema, em relação ao ciclo de vida de cada notı́cias e seu
alcances, forma a partir dos dados coletados um Gráfico 4.11 de equação linear quando o
parâmetro de preferência atinge o valor maior que 7.
R
Atualmente, uma das redes sociais on-line, o FACEBOOK
, permite criar páginas(FAN
R
PAGES ) com conteúdo especı́fico, disponibilizando um conjunto ferramentas de resultados
estatı́sticos. Podemos sugerir que esse comportamento assemelha-se com a divulgação de
unidades de informação para grupos especı́ficos que compartilham de interesses semelhantes,
entretanto, necessitam constantemente de uma renovação de conteúdo que desperte o
ciclo de divulgação maciça de notı́cias em grupo. Caso contrário, a falta de novidade
pode reduzir o ciclo de vida e o alcance da notı́cia drásticamente. Esse processo pode
ser acompanhado através de resultados desses ferramentas citadas. Um comportamento
semelhante a nossa última simulação do sistema.
O gráfico apresentado na figura 4.11 mostra uma tendência que assemelha-se a um comportamento
de marketing viral em redes sociais, o que mesmo acontece na disseminação de epidemias.
42
400
350
350
300
Número de votos
Número de votos
300
250
200
150
100
250
200
150
100
50
50
0
0
0
200
400
600
800
200
400
Tempo
600
800
Tempo
(a) (b) 500
2000
Número de votos
Número de Votos
400
300
200
1500
1000
500
100
0
0
0
200
400
600
0
800
200
400
600
800
Tempo
Tempo
(c) (d) Figura 4.10: (a)Número de votos por notı́cia por determinados espaços de tempo na rede de mundo
pequeno com L = 96 e um número de 95.266 notı́cias com valor de preferência maior que 0.(b)Número
de votos por notı́cia por determinados espaços de tempo na rede de mundo pequeno com L = 96 e um
número de 95.216 notı́cias com valor de preferência maior que 2.(c)Distribuição das notı́cias e seu alcance
na rede de mundo pequeno com L = 96 e um número de 95.211 notı́cias com valor de preferência maior
que 4.(d)Número de votos por notı́cia por determinados espaços de tempo na rede de mundo pequeno
com L = 96 e um número de 95.193 notı́cias com valor de preferência maior que 6.
Entretanto, como todos os assuntos em redes sociais são muito recentes, não podemos
afirmar tal comportamento. Entendemos que faz-se necessário a continuidade de estudos
desses assuntos tão contemporâneos.
43
2000
1800
1600
Número de Votos
1400
1200
1000
800
600
400
200
0
200
400
600
800
Tempo
Figura 4.11: Número de votos por notı́cia por determinados espaços de tempo na rede de mundo pequeno
com L = 96 e um número de 32.180 notı́cias com valor de preferência maior que 7.
44
Capı́tulo 5
Conclusões e Perspectivas
Este trabalho propôs um modelo para simulação das principais caracterı́sticas da dinâmica
de crescimento do número de notı́cias em redes socias simuladas em redes aleatórias e de
mundo pequeno. Partimos da hipótese de que a estrutura das rede sociais segue uma
topologia em forma de redes complexas.
A velocidade de propagação da notı́cia e sua perenidade são fatores muito importantes
em uma rede social. Neste trabalho, o modelo descrito sugere que, além da topologia da
rede, um fator importante associado à propagação das notı́cias é o seu grau de afinidade
com os usuários.
Desta forma, o usuário pode consumir as notı́cias veı́culadas da rede e dar maior velocidade
a sua propagação aumentando a possibilidade as manterem ‘vivas’ na rede. Por se tratar
de um trabalho inicial, o mesmo sugere uma infinidade de perspectivas. Dentre elas,
temos a possibilidade de criar simulações com notı́cias com maiores cadeias de bits para
entender como uma notı́cia se comporta na rede devido a sua quantidade de palavras e
sı́mbolos. A possibilidade de criar diversos centros de notı́cias pode impactar a divulgação
da informação na rede. Devido a contemporaneidade do assunto estudado e cronograma
limitado, vemos a possibillidade de desenvolver diversos cenários para procurar entender
a dinâmica das rede sociais. O caminho para o maior entendimento desse processo passa
R
pelo entendimento da comunicação de diversas ferramentas atuais como: TWITTER
,
R
R
R
FACEBOOK , DIGG , INSTAGRAM .
Essas ferramentas possuem suas próprias rede e cada dia uma se conecta a outra utilizando
e transferindo as conexões de uma para outra. O entendimento da dinânica da navegação
da informação nas redes sociais, atualmente, precisa considerar essas interseções.
45
Apêndice A
Anexo
A.1
Percolação
O processo de percolação é um problema genérico conhecido desde a antiguidade que
consiste na propagação de fluidos de uma forma não linear em diversos meios (por exemplo,
rochas porosas).
Existem dois regimes bem definidos, a propagação e a extinção, separados por uma
transição brusca - a transição de percolação. A generalidade deste modelo permite estudar
uma variedade de processos com aplicações práticas, desde a recuperação terciária de
petróleo à propagação de incêndios florestais. Existem dois tipos de modelos de percolação
padrão: percolação de sı́tios e percolação de elos [2].
Processos de Percolação
Um processo de percolação consiste na propagação do estado de uma célula ativa às células
vizinhas, que depois de ativadas continuam o processo. O processo termina quando não
há mais células do agregado que possam ser ativadas. Usando o exemplo de percolação
de sı́tios, descrito acima, um quadrado de uma cor pode ser ativado pintando-o de outra
cor e o processo consiste na propagação da nova cor às células do agregado como pode ser
visto em momento inicial do processo da Figura A.1.
A duração do processo de percolação depende de dois fatores: o tamanho do agregado
e a forma como está conectado. Quanto ao primeiro, é evidente que quanto maior for
o agregado maior é a duração do processo. O segundo é mais sutil mas revela-se mais
importante: um agregado muito conectado percola mais rapidamente do que um pouco
conectado, porque no primeiro cada célula ativa um número maior de células vizinhas.
Considerando sistemas discretos, é possı́vel classificar percolação em quatro tipos:
46
Figura A.1: Um quadrado pode ser ativado pintando-o de outra cor e o processo consiste na propagação
da nova cor às células do agregado.
Imagem retirada de
http://cftc.cii.fc.ul.pt/PRISMA/capitulos/capitulo5/modulo6/topico1.php
• Percolação de sı́tios: neste caso, cada sı́tio possui uma probabilidade p de estar
ocupado, e 1−p de estar vazio. Cada sı́tio é estatisticamente independente dos outros
e existe um valor crı́tico, pc , acima do qual uma fase percola por todo o sistema,
correspondendo ao ‘aglomerado finito’ formado pela união de sı́tios ocupados primeiros vizinhos entre si.
• Percolação de ligações: neste caso, a ligação entre dois sı́tios estaria presente com
probabilidade pb e ausente com probabilidade 1 - pb ; as ligações são idênticas entre
si e estatisticamente independentes. Acima de pb e pc , há um caminho de ligações
presentes conectando sı́tios primeiros vizinhos que estende-se por todo o sistema.
• Percolação de sı́tios e ligações: este caso é a combinação dos dois casos considerados
acima.
• Percolação direcionada: pode ser definida do mesmo modo que a percolação de sı́tios,
ligações, ou de sı́tios e ligações, porém as conexões só são permitidas se possuı́rem
uma orientação pré-definida.
Os processos de percolação desempenham papel crucial em muitas aplicações, em particular,
no estudo da propagação de incêndios florestais [17].
47
Limite de Percolação
Denomina-se por limite de percolação o limiar que separa dois comportamentos distintos
do sistema; acima deste limite uma fase percola por todo o sistema enquanto abaixo dele
não há percolação.
Enquanto a percolação de sı́tios é adequada ao estudo de processos de contágio ou para
modelar sistemas adsorventes, os outros tipos de percolação são mais adequados para
a descrição de fenômenos de transporte[18]. O modelo de percolação direcionada é
largamente utilizado, e suas aplicações se estendem desde fenômenos de invasão de um
fluı́do em meio poroso até redes neurais[19]. A diferença entre a percolação direcionada
e a percolação de ligações pode ser facilmente compreendida considerando uma rede de
resistores aleatoriamente distribuı́dos em uma malha quadrada; nesse caso, podemos ter
a percolação de ligações; se substituirmos os resistores por diodos, teremos a percolação
direcionada[18].
Considerando uma rede infinita, o limite de percolação é associado ao valor crı́tico da
concentração pc , acima do qual um aglomerado de tamanho infinito percola no sistema.
O valor de pc depende do tipo de percolação que estamos considerando, da dimensão de
imersão do sistema e da geometria utilizada para se construir a rede [16].
A.2
Leis de Escala e Potência
Nesta seção conforme explicitado por Atman[16] serão apresentados dois comportamentos
tı́picos observados quando do estudo do crescimento de superfı́cies de fractais: leis de
escala e leis de potência.
Souza [20]defende que, na análise da morfologia de uma superfı́cie, torna-se essencial o
conceito de escala. Este conceito vem sendo utilizado pela mecânica estatı́stica moderna
para demonstrar os chamados comportamentos universais de escala, ou seja, mostrar que
sistemas que aparentemente são diferentes, apresentam um comportamento de escala em
comum.
Existem, portanto, certas “leis de escala” que são básicas e independentes de muitos
detalhes desses sistemas. Assim, se um papel toalha for imerso num recipiente de café e
o perfil da interface for analisado, serão identificados certos expoentes de escala ligados à
rugosidade que são os mesmos encontrados se variarmos certos parâmetros da experiência,
como tipo de papel, concentração do café ou mesmo se o fluı́do for trocado por tinta
salienta Souza[20].
A caracterização de sistemas através de expoentes globais leva à definição de classes de
48
universalidade: dois sistemas pertencem à mesma classe universal se podem ser descritos
pelos mesmos expoentes de escala (adiante serão apresentados três expoentes de escala:
de crescimento, de rugosidade e dinâmico)[20].
Dois exemplos onde a rugosidade se comporta segundo uma lei de potência são no perfil
da Deposição aleatória de partı́culas (w ∼ t1/2 ) e na definição do expoente de Hurst,
(w(ε) ∼ εH ) .
A principal caracterı́stica de uma grandeza que se comporta com uma lei de potência
é sua invariância por escala. Desse modo, em uma deposição aleatória de partı́culas a
rugosidade cresce com a mesma taxa, independente da escala temporal.
Grandezas que se comportam segundo uma lei de escala podem apresentar regimes distintos
dependendo do intervalo temporal considerado. Para exemplificar,consideremos um modelo
de deposição com correlações espaciais, onde a rugosidade do perfil irá se comportar
segundo uma lei de escala. Este modelo é conhecido como deposição aleatória com a
relaxação superficial[21]. A presença de tais correlações suaviza a interface, não permitindo
o crescimento ilimitado da rugosidade; esse comportamento é confirmado por simulações
como observado nas Figuras A.2(a) e A.2(b); na Figura A.2(b), onde são mostrados perfis
obtidos para a Deposição Aleatória com Relaxação Superficial - DARS são muito mais
suaves que as interfaces produzidas pela Deposição Aleatória (vide Figura A.2(a)), onde
também verifica-se que o crescimento da rugosidade é bem mais lento.
(a) (b) Figura A.2: (a)Perfis gerados pela Deposição Aleatória em um substrato com L = 256. A cada 400
passos a cor das partı́culas é trocada. (b)Perfis gerados pela DARS. A cada 10 camadas depositadas a
cor das partı́culas e trocada. Note que os perfis são bem mais suaves que na DA e novamente ocorre a
conservação da altura média. Imagem retirada de [21].
A evolução temporal da rugosidade pode ser estudada com o andamento de passo de
tempo. Na Figura A.2(b), a rugosidade cresce com uma lei de potência para escalas
49
temporais curtas e atinge a saturação após um certo tempo, denominado tempo de
saturação (ou de crossover)t× [21].
Figura A.3: Evolução da rugosidade para a DARS. O tamanho do sistema e L = 1024 e o resultado a
representa a média sobre 100 amostras. Note que ocorre a saturação da rugosidade para tempos acima
a do tempo de crossover, indicado por t; este comportamento da rugosidade evidencia sua lei de escala.
Imagem retirada de [21].
Portanto, o comportamento da rugosidade para este modelo depende da escala temporal
de observação. É importante notar que logo no inı́cio da deposição, a inclinação da curva
w × t, é maior que nos tempos seguintes. Esse comportamento denota a propagação
das correlações no sistema: inicialmente, com o substrato liso e ausência de correlações
a deposição se dá idênticamente como na DA (w ∼ t1 /2). À medida que o número de
partı́culas depositadas aumenta, as correlações começam a crescer, diminuindo o ritmo de
crescimento de rugosidade (w ∼ t1 /4). Finalmente, as correlações atingem o tamanho do
sistema fazendo com que a rugosidade entre em um regime estacionário.
Portanto, podemos sintetizar o comportamento da rugosidade neste modelo através de
três expoentes crı́ticos:
Inicialmente a rugosidade cresce com uma lei de potência,
(w(L, t) ∼ tβ /ω), para t tx ,
(A.1)
onde βω é denominado o expoente de crescimento, que caracteriza a dinâmica temporal
50
da rugosidade e t o tempo de crossover .
Para tempos longos a rugosidade de saturação ,(w(L, ∞) cresce com o tamanho do sistema
segundo uma lei de potência.
(w(L, ∞) ∼ Lα ), para t tx ,
(A.2)
onde α é o expoente de rugosidade, o segundo expoente crı́tico.
O tempo de saturação também comporta-se segundo uma lei de potência em relação ao
tamanho do sistema.
tx ∼ Lz ,
(A.3)
onde z é o expoente dinâmico.
Maiores detalhes sobre os conceitos acima descritos podem ser encontrados em publicação
de Atman [21].
A.3
Passeio Aleatório
De acordo com o autor Weisstein [22], o Passeio Aleatório é um processo que consiste numa
sequência de passos discretos de comprimento fixo. Por exemplo, o caminho traçado por
uma molécula, uma vez que viaja em um lı́quido ou um gás, o caminho de procura de um
animal de caça e o preço flutuante de um estoque podem ser modelados como passeios
aleatórios. Os passeios aleatórios têm sido usados em muitos campos como o da economia,
da psicologia, da ciência da computação, da fı́sica, da quı́mica e da biologia para explicar
os comportamentos observados de processos nestes domı́nios [23]. Um exemplo elementar
de um passeio aleatório unidimensional é o passeio aleatório cj de números inteiros, que
começa em 0 e em cada etapa move +1 ou -1 com igual probabilidade. Um passeio
aleatório frequentemente citado é o da descrição das flutuações do mercado de ações . Uma
possibilidade de passeio aleatório também ocorre em maiores dimensões como a descrição
do exemplo que segue: Imagine agora um bêbado andando aleatoriamente em uma cidade
idealizada. A cidade é efetivamente infinita e organizada em uma grade quadrada e, em
cada cruzamento, o bêbado escolhe uma das quatro rotas possı́veis (incluindo a que ele
veio) com igual probabilidade. Formalmente, este é um passeio aleatório sobre o conjunto
de todos os pontos no plano com coordenadas inteiras.
51
Figura A.4: Exemplo de oito passeios aleatórios em uma dimensão a partir do ponto 0. O gráfico mostra
a posição atual na linha(eixo vertical) versus os passos no tempo (eixo horizontal).
Imagem retirada de http://en.wikipedia.org/ wiki/ Random_walk
A.4
Autômatos Celulares
Os autômatos celulares (CA’s) são sistemas dinâmicos discretos propostos por John Von
Neumann e Ulam, aplicados em modelos matemáticos com o intuito de investigar a
auto-organização de sistemas em diferentes áreas como computação, mecânica estatı́stica,
dinâmicas de populações, biologia, geologia, etc[16, 2, 24]. Os autômatos celulares consistem
de uma rede uniforme onde o estado é representado como uma variável discreta em cada
sı́tio (célula). O estado em um passo de tempo é determinado pelo estado da vizinhança
no passo anterior e as regras de transição podem ser determinı́sticas ou probabilı́sticas
[16, 24]. O aumento de interesse no estudo dos (CA’s) nos últimos anos deve-se ao
sucesso em conseguir descrever um grande volume de fenômenos das mais variadas áreas
de conhecimento.
A.5
Geradores de números aleatórios
Geradores de números aleatórios, de acordo com Marsaglia[25], são processos computacionais que codificam os bits de um número ou conjunto para gerar um novo número aleatório
independente do gerado anteriormente. Além disso, Marsaglia[25] salienta ainda que
vários métodos de codificação foram abordados ao longo dos anos. Verifica-se a presença
dos geradores de números aleatórios na grande parte dos sistemas computacionais em
forma de bibliotecas e/ou pacotes[25] .
52
Tipos de Geradores
De acordo com Banks[26] os tipos de geradores de números aleatórios mais comumente
utilizados são:
• Geradores Congruentes Lineares
• Geradores de Atraso de Fibonacci
• Geradores de Registradores de Deslocamento
• Geradores Hı́bridos.
Neste trabalho, optou-se pelo uso do método linear congruente, que será explicado abaixo,
devido ao seu baixo custo computacional e alta confiabilidade.
Gerador Congruencial
A maioria dos métodos usados hoje em dia são variações do chamado Método Linear
Congruente, cujos pontos básicos foram propostos por Lehmer[27]. Destaca-se como o
mais conhecido algoritmo para geração de sequências pseudoaleatórias de inteiros [28].
In+1 = AIn + C , mod M,
(A.4)
onde M é o módulo, 0 ≤ A < M é o multiplicador, 0 ≤ C < M é o incremento e
0 < I0 < M é a semente.
Para C 6= 0, o gerador congruente é misto, e para C = 0, o gerador congruente é
multiplicativo. A relação recursiva A.4 gera o próximo número inteiro. Para se obter
uma variável aleatória uniformemente distribuı́da, no intervalo [0,1), deve-se dividir In
por M : Zn = In /M .
Esse método pode gerar uma sequência de números aleatórios; contudo, se os valores das
constantes não forem selecionados corretamente, depois de algumas interações, a sequência
irá repetir-se sem gerar todos os números possı́veis, no intervalo [0, M ).
Se A, C e M são corretamente selecionados, a sequência pode chegar a um comprimento
máximo M, distribuı́dos aleatoriamente no intervalo de 0 a (M − 1). O teorema, a seguir
mostra as condições necessárias para os valores ideais de A, C e M [29] .
O método linear congruente tem um perı́odo M se, e somente se:
53
• C e M são primos entre si;
• B = (A − 1) é múltiplo de P , para todo P primo divisor de M ;.
• Se M for múltiplo de 4, então B tem que ser múltiplo de 4.
Na linguagem C, temos à disposição 231 números inteiros, A = 843314861 e C = 453816693
são números mágicos, como descreve Stauffer[30], que permitem que o método acima
sorteie cada um dos 231 números disponı́veis exatamente uma vez antes que a sequência
volte a se repetir.
54
Referências Bibliográficas
[1] ALBERT, R.; BARABÁSI, A.L. Statistical mechanics of complex networks. Reviews
of Modern Physics, v. 74, p. 47-97, jan. 2002.
[2] BOCCARA, N. Modeling Complex Systems. Chicago, USA: Springer, 2004.
(Graduate Texts in Contemporary Physics). [A slightly modified version of this review
appeared in Physics Today, February 2005 (v. 58, issue 2), p. 65.]
[3] CAJUEIRO, D. O. and ANDRADE R. F. S. Learning paths in Complex networks.
European Physics Letters: A letters journal exploring the frontiers of physics. EPL
Eutophisics Letters, v. 87, n. 5, p. 1-6, set. 2009, 580004.
[4] CAJUEIRO, D. O. Optimal navigation in complex networks. Physical Review,
Physical Review E - Statistical, Nonlinear and Soft Matter Physics, v. 79, Issue:
4 Pt 2, Publisher: APS, Pages: 046103p. 79, April 2009.
[5] BOAVENTURA, P. O. Grafos: teoria, modelos, algoritmos. 3. ed. So Paulo: Edgard
Blucher, 2003.
[6] MILGRAM, S. The small world problem. Psychology Today, v. 22, p. 61-7, 1967.
[7] MENDES, José Fernandes. Fı́sica de redes complexas. Gazeta de Fı́sica.
Departamento de Fı́sica da Universidade de Aveiro, Aveiro (Portugal), 2005. p. 10-16.
[8] ROCHA, Luis Enrique C. R. Redes acopladas: estrutura e dinâmica. Jul. 2007.
Dissertação (Mestrado) Instituto de Fı́sica de São Carlos (USP) São Carlos, 2007.
[9] RODRIGUES, Francisco Aparecido. Caracterização, classificação e análise de redes
complexas. Ago. 2007. Tese (Doutorado). Instituto de Fı́sica de São Carlos (USP)
São Carlos, 2007.
[10] WATTS, Duncan J.; STROGATZ, S. H. Collective dynamics of small-world’
networks. Nature, v. 393, n. 6684, p. 440-42, Jun. 1998.
[11] WATTS, Duncan J. Six Degrees: The Science of a Connected Age. New York: W.
W. Norton, 2003.
55
[12] BARABÁSI, A.L. Linked: How everything is connected to everything else and what
it means for business, science and everyday life. New York: Publisher: Plume Books;
April 2003).
[13] BUCHANAN, Mark. Nexus: Small worlds and the groundbreaking theory of
networks. New York: W.W. Norton e Company, 2002.
[14] DEGENNE, Alain; FORS, Michel. Introducing social networks. London: Sage, 1999.
[15] GRANOVETTER, M. The strength of weak ties. The American Journal of Sociology,
v. 78, Issue 6, May, 1973.
[16] ATMAN, Aspectos fractais em sistemas complexos. Out. 2002. Tese (Doutorado)
UFMG. Belo Horizonte, out. 2002.
[17] BAK, P.; CHEN, K. C. Tang A forest-fire model and some thoughs on turbulence,
Phys Lett A, v. 147, n. 5-6, p. 297-300, 1990.
[18] LESME, A. Renormalization Methods: critical phenomena, chaos and fractal
structures. Chichester: John Wiley & Sons, 1998.
[19] HINRICHSEN, H. On possible experimental realizations of directed percolation. Braz
J Phys, v. 30, n. 1, p. 69-82, 2000.
[20] SOUZA CRUZ, Tersio Guilherme de Souza Cruz. Leis de escala e dimenso fractal
em filmes finos: Microscopia de Fora Atmica e Voltametria Cclica. 2002. Tese
(Doutorado) - Instituto de Fsica Gleb Wataghin da Universidade Estadual de
Campinas - Laboratrio de Optoeletroqumica e Materiais. Campinas (SP), 2002.
[21] BARABÁSI, A. L.; STANLEY, H. E. Fractal concepts in surface growth. Cambridge:
Cambridge Univ. Press, 1995.
[22] WEISSTEIN, Eric W. ”Random Walk.” MathWorld - A Wolfram Web Resource.
http://mathworld.wolfram.com/RandomWalk.html (1999).
[23] WEISS G. H. (Ed.). Aspects and applications of the random walk. Amsterdam:
Holland Press, 1994.
[24] WOLFRAM, S. Statistical mechanics of cellular automata. Reviews of Modern
Physics, v. 55, p. 601-644, 1983.
[25] MARSAGLIA, G. Random number generation. Encyclopedia of Computer Science.
4th. Chichester: UK. 2003.
[26] BANKS, Jerry. Discrete-event system simulation. 4.ed. Upper Saddle River: Prentice
Hall 2005.
56
[27] FITZPATRICK, R. Computational physics: an introductory course. The University
of Texas Austin: [s.n.].D. H. Lehmer, Ann. Comp. Lab. Harvard Univ, v. 26 p. 141,
1951.
[28] KLEIN, A; GODUNOV, A. Introductory computational physics. [S.l.]: Cambridge
University Press, 2006.
[29] HULL, TE; DOBELL, AR. Random number generators. Society for Industrial and
Applied. Mathematics Review, v. 4, p. 230-54, 1962.
[30] STAUFFER, D. Monte Carlo Methods in statistical physics, in computer simulation
and computer algebra. Berlim: Springer Verlag, 1993.
[31] OLIVEIRA, S. Moss de. A small review of the Penna model for biological ageing,
Physica A, v. 257, p. 465-69, 1998.
[32] OLIVEIRA, S. Moss de; OLIVEIRA, P.M.C. de; STAFFER, D. Evolution, money,
war and computers. Teubner: Leipzig and Stuttgart, 1999.
[33] ALMEIDA, R.M.C. de; OLIVEIRA, S. Moss de; PENNA, T.J.P. Theoretical
approach to biological aging, Physica A, v. 253, p. 366-78, 1998.
[34] COE, J. B.; MAO, Y; CATES, M. E. Solvable senescence model showing a mortality
plateau. Physical Review Letters, v. 89, n. 28, p. 288103, 2002.
[35] PENNA. T.J.P. A Bit-string model for biological aging. J. Stat. Phys., v. 78, p. 1629,
1995.
[36] SUTON R. S.; BARTO A. G., Reinforcement learning. The Mit Press, Cambridge,
Mass, 2002.
[37] VESPIGNANI, Alessandro et al. .Predicting the behavior of techno-social systems.
DOI: 10.1126/science.1171990. Science, v. 325, p. 425, 2009.
[38] HUBERMAN, B. A.; ADAMIC, L. Lecture notes in physics. Springer, Heidelberg
(Germany), 2003).
[39] PASTOR-SATORRAS, R.; VESPIGNANI, A. Evolution and structure of the
internet. Cambridge: Univ. Press Cambridge, 2004.
[40] CROVELLA, M. E. KRISHNAMURTHY, B. Internet Measurements: infrastructure,
traffic and applications. Wiley: Chichester, UK, 2006.
[41] WASSERMAN, S.; FAUST, K. Social network analysis. Cambridge: Cambridge
Univ. Press, 1994.
[42] HANSKI, I. A.; GAGGIOTTI, O. E. Ecology, genetics and evolution of
metapopulations. San Diego (CA): Academic Press, 2004.
57
[43] BARABSI. A.-L. R. Albert. Science, v. 286, p. 509, 1999.
[44] NEWMAN, M. E. J. The structure and function of complex networks. SIAM Review,
v.45, p. 167-256, 2003.
[45] BARRAT, A.; BARTHELEMY, M.; VESPIGNANI, A. Dynamical processes on
complex networks. Cambridge: Cambridge Univ. Press, 2008.
[46] BARRAT A. et al.. Proc. Natl. Acad. Sci. U.S.A. v. 101, p. 3747, 2004.
[47] MURRAY, J. D. Mathematical biology I: An Introduction. Third Edition. Springer,
New York, 1993.
[48] MASSEY, A. Epidemiology in relation to air travel. London: H. K. Lewis, 1933.
[49] PEIRIS, J. S. M.; YUEN, K. Y.. STOHR, K. The severe acute respiratory syndrome.
N. Engl. J. Med., v. 349, p. 2431, 2003.
[50] HOLLINGSWORTH, T. D.; FERGUSON, N. M.; ANDERSON, R. M. Will travel
restrictions control the international spread of pandemic influenza? Nat. Med., v. 12,
p. 497-99, 2006.
[51] EPSTEIN, J.M.; GOEDECKE, D.M.; YU, F.; MORRIS, R.J. et al. Controlling
Pandemic Flu: The Value of International Air Travel Restrictions. PLoS ONE, v. 2,
n. 5: p. e401, 2007.
[52] COLIZZA, V.; VESPIGNANI, A.; THEOR, J. Epidemic modeling in metapopulation
systems with heterogeneous coupling pattern: Theory and simulations. Biol., v. 251,
p. 450-67, 2008.
[53] COLIZZA, V. ET AL. PLOS MED. V. 4, P. E95, 2007.
[54] ADAMIC, L. A.; GLANCE, N. The political blogosphere and the 2004 U.S. election:
divided they blog. In LinkKDD, 2005.
[55] JENSEN, D.; NEVILLE, J. Data mining in social networks. In National Academy of
Sciences Symposium on Dynamic Social Network Analysis, 2002.
[56] EUBANK,
S.
et
al.
Modelling
disease
outbreaks
in realistic urban social networks. Nature, v. 429, p. 180-84, 2004. Disponvel em:
http://ndssl.vbi.vt.edu/Publications/modellingDisease.pdf
[57] MOTTER, A. E. Cascade control and defense in complex networks. Phys. Rev. Lett.,
v. 93, 098701, 2004.
[58] MASON, W. A.; CONREY, F. R.. SMITH, E. R. Situating social influence processes:
dynamic, multidirectional flows of influence within social networks. Pers. Soc.
Psychol. Rev., v. 11, p. 279-300, 2007.
58
[59] AVERY, C.; ZEMSKY, P. Multidimensional uncertainty and herd behavior in
financial markets. Am. Econ. Rev., n. 88, p. 724-48, 1998.
[60] SHILLER, R. J. Irrational exuberance. Princeton: University Press, 2000.
[61] LAZARSFELD, P. F.; BERELSON, B.; GAUDET, H. The people’s choice. New
York: Columbia Univ. Press, 1944.
[62] CHRISTAKIS, N. A.; FOWLER, J.H. The spread of obesity in a large social network
over 32 years. New Engl. J. Med., v. 357, p. 370-79, 2007.
[63] SALGANIK, M. J.;DODDS, P. S.; WATTS, D. J. Experimental study of inequality
and unpredictability in an artificial cultural market. Science, v. 311, p. 854-56, 2006.
[64] KATZ, E.; LAZARSFELD, P. F. Personal influence. Glencoe, Il-linois: The Free
Press, 1955.
[65] WATTS, D.; GOEL, S.; MASON, W. Work in progress, 2009.
[66] CARR, D. Why twitter will endure. New York Times, 2010.
[67] ONNELA, J.-P.; REED-TSOCHAS,F. The spontaneous emergence of social influence
in online systems. Boston: Boston University, 2009.
[68] MAYER, A.; PULLER, S. L. The old boy (and girl) network: social network
formation on university campuses. J. Public Econ., v. 92, p. 329-47, 2008.
[69] LEWIS, K.;, KAUFMAN, J.; GONZALEZ, M.; WIMMER, A.; CHRISTAKIS, N.
A. Tastes, ties, and time: a new social network dataset using Facebook.com. Soc.
Networks, v. 30, p. 330-42, 2008.
[70] CRANE, R.; SORNETTE, D. Robust dynamic classes revealed by measuring the
response function of a social system. Proc. of the National Academy of Sciences, v.
105, p. 15649-15653, 2008.
[71] GOLDER, S.A.; WILKINSON, D.; HUBERMAN, B.A. Rhythms of social
interaction: messaging within a massive online network. HP Social Computing
Laboratory Laboratory paper. Disponvel em: http://arxiv.org/abs/cs/0611137.
[72] TRAUD, A. L.; KELSIC, E. D.; MUCHA, P. J.; PORTER, M. A. Community
structure in online collegiate social networks. available at arXiv:0809.0690v1.
[73] Onnela, J.-P. et al. Structure and tie strengths in mobile communication networks.
P. Natl. Acad. Sci., USA, v. 104, p. 7332-7336, 2007.
[74] LAZER, D. et al. Computational social science. Science, v. 323, p. 721-23, 2009.
[75] FLAMMINI, A.; VESPIGNANI, A.; MENCZER, F. Competition among memes in
a world with limited attention. Sci. Rep., v. 2, p. 335; DOI:10.1038/srep00335, 29
mar. 2012.
59
[76] DAVENPORT, T. H.; BECK, J. C. The attention economy: understanding the new
currency of business. Boston: Harvard Business School Press, 2001.
[77] TAPSCOTT, D.; WILLIAMS, A. D. Wikinomics: How mass collaboration changes
everything. Portfolio Hardcover, 2006.
[78] DAWKINS, R. The selfish gene. Oxford: Oxford University Press, 1989.
[79] SIMON, H. Designing organizations for an information-rich world. In:
GREENBERGER, M. (ed.) Computers, Communication, and the Public Interest.
Baltimore: The Johns Hopkins Press, 1971, p. 37-52.
[80] GOLDHABER, M. H. The attention economy and the net. First Monday, v. 2, n. 4,
1997.
[81] MORRIS, S. Contagion. Rev. Econ. Studies, v. 67, p. 57-78, 2000.
[82] WATTS, D. J. A simple model of global cascades on random networks. Proceedings
of the National Academy of Sciences, v. 99, p. 5766-5771, 2002.
[83] WU, F.; HUBERMAN, B. A. Novelty and collective attention. Proceedings of the
National Academy of Sciences, v. 104, p. 17599-17601, 2007.
[84] FALKINGER, J. Attention economies. Journal of Economic Theory, n. 133, p. 266294, 2007.
[85] CRANE, R.; SORNETTE, D. Robust dynamic classes revealed by measuring the
response function of a social system. P. Natl. Acad. Sci. USA, v. 105, p. 15649-15653,
2008.
[86] LESKOVEC, J.; BACKSTROM, L.; KLEINBERG, J. Meme-tracking and the
dynamics of the news cycle. In: Proceedings of the 15th ACM SIGKDD International
Conference on Knowledge Discovery and Data Mining, p. 497-506. ACM, New York,
NY, USA, 2009.
[87] GOETZ, M.; LESKOVEC, J.; MCGLOHON, M.; FALOUTSOS, C. Modeling blog
dynamics. In: Proc. Third International AAAI Conference on Weblogs and Social
Media, 2009.
[88] LERMAN, K.; GHOSH, R. Information contagion: an empirical study of the spread
of news on digg and twitter social networks. In: Proc. Fourth International AAAI
Conference on Weblogs and Social Media, 2010.
[89] RATKIEWICZ, J.; FORTUNATO, S.; FLAMMINI, A.; MENCZER, F.;
VESPIGNANI, A. Characterizing and modeling the dynamics of online popularity.
Phys. Rev. Lett., n. 105, p. 158701, 2010.
[90] LAZER, D. et al. Computational social science. Science, v. 323, p. 721-23, 2009.
60
[91] VESPIGNANI, A. Predicting the behavior of techno-social systems. Science, v. 325,
p. 425-28, 2009.
[92] Moussaid, M.; Helbing, D.; Theraulaz, G. An individual-based model of collective
attention. In: Proceedings of the European Conference on Complex Systems, 2009.
[93] ASUR, S.; HUBERMAN, B. A.; SZABO, G.; WANG, C. Trends in social media:
Persistence and decay. In: Proceedings of the 5th International AAAI Conference on
Weblogs and Social Media, 2011.
[94] ROMERO, D. M.; GALUBA, W.; ASUR, S.; HUBERMAN, B. A. Influence and
passivity in social media. In: Proceedings of the 20th International Conference on
World Wide Web (Companion Volume), p. 113-14, ACM, 2011.
[95] BAKSHY, E.; MASON, W. A.; HOFMAN, J. M.; WATTS, D. J. Everyone’s an
influencer: Quantifying influence on twitter. In: Proceedings of the Fourth ACM
International Conference on Web Search and Data Mining, 2011.
[96] WU, F.; HUBERMAN, B. J. A persistence paradox. First Monday 15, 2010.
[97] ROMERO, D. M.; MEEDER, B.; KLEINBERG, J. Differences in the mechanics of
information diffusion across topics: Idioms, political hashtags, and complex contagion
on twitter. In: Srinivasan, S. et al. (eds.) Proceedings of the 20th International
Conference on World Wide Web. ACM, 2011.
[98] ARAL, S.; MUCHNIK, L.; SUNDARARAJAN, A. Distinguishing influence-based
contagion from homophily-driven diffusion in dynamic networks. Proceedingns of
the National Academy of Sciences, v. 106, p. 21544-21549, 2009).
[99] GONÇALVES, B.; PERRA, N.; VESPIGNANI, A. Validation of dunbar’s number
in twitter conversations. PLoS One, v. 6, p. e22656, 2011.
[100] LEHMANN, J.; GONÇALVES, B.; RAMASCO, J. J.; CATTUTO, C. Dynamical
classes of collective attention in twitter. In: Proc. 21st International World Wide
Web Conference (WWW), 2012.
[101] DUNBAR, R. I. M. The social brain hypothesis. Evolutionary Anthropology, v. 6,
p. 178-90. 1998.
[102] IENCO, D.; BONCHI, F.; CASTILLO, C. The meme ranking problem: Maximizing
microblogging virality. Journal of Intelligent Information Systems (Forthcoming), v.
2, 2012.
[103] YANG, L.; SUN, T.; MEI, Q. We KnowWhat @You #Tag: Does the Dual Role
Affect Hashtag Adoption? In: Proc. 21st International World Wide Web Conference
(WWW), 2012.
61
[104] GOFFMAN, W.; NEWILL, V. A. Generalization of epidemic theory: an application
to the transmission of ideas. Nature, v. 204, p. 225-8, 1964.
[105] DALEY, D. J.; KENDALL, D. G. Epidemics and rumours. Nature, v. 204, p. 11181119, 1964.
[106] BAILEY, N. The mathematical theory of infectious diseases and its applications.
2nd edn. London: Griffin,1975, xvi-413.
[107] LESKOVEC, J.; MCGLOHON, M.; FALOUTSOS, C.; GLANCE, N.; HURST, M.
Cascading behavior in large blog graphs: Pattern and a model. Tech. Rep. 0704.2803,
arXiv, 2007. URL http://arxiv.org/abs/0704.2803.
[108] SIMON, H. A. et al. On a class of skew distribution functions. Science, v. 42, p.
425-40, 1955.
[109] SNEPPEN, K.; TRUSINA, A.; JENSEN, M. H.; BORNHOLDT, S. A minimal
model for multiple epidemics and immunity spreading. PLoS One, v. 5, p. e13326,
2010.
[110] KERRER, B.; NEWMAN, M. E. J. Competing epidemics on complex networks.
Tech.Rep., v. 1105, p. .3424, arXiv, 2011.
[111] ROGERS, E. M. Diffusion of Innovations. 5th Edition. New York: Free Press, 2003.
[112] DOMINGOS, P.; RICHARDSON, M. Mining the network value of customers. In
Proceedings of the seventh ACM SIGKDD international conference on Knowledge
discovery and data mining, KDD ’01, p. 5766, New York, NY, USA. ACM 2001.
[113] KEMPE, D.; KLEINBERG, J.; EVA TARDOS. Maximizing the spread of influence
through a social network.In KDD 03: Proc. 9th Int. Conf. on Knowledge discovery
and data mining, p. 137-46, 2003.
[114] GRUHL, D.; LIBEN-NOWELL, D.. Information diffusion through blogspace. In:
Proc. Int.WorldWideWeb Conference (WWW), p. 491-501, 2004.
[115] ADAMIC, L. A.; ADAR, E. How to search a social network. Social Networks, v. 27,
n. 3, p. 187-203, 2005.
[116] INFORMATION CONTAGION: An Empirical Study of the Spread of News on Digg
and Twitter Social Networks Kristina Lerman and Rumi Ghosh USC Information
Sciences Institute Marina del Rey, CA 90292, USA.
[117] DAVITZ, J.; YU, J.; BASU, S.; GUTELIUS, D.; AND HARRIS, A. 2007. ilink:
Search and routing in social networks. In Proc. Knowledge Discovery and Data
Mining Conference (KDD), 2007.
[118] Association for the Advancement of Artificial Intelligence (www.aaai.org).
https://networkchallenge.darpa.mil
62
[119] LESKOVEC, J.; HORVITZ, E. Planetary-scale views on a large instant-messaging
network. In: WWW - 08: Proc. 17th Int. World Wide Web Conference, p. 915-24,
2008.
[120] VAZQUEZ, A.; OLIVEIRA, J. G.; DEZSO, Z.; GOH, K.; KONDOR, I;
BARABÁSI, A.. Modeling bursts and heavy tails in human dynamics. Phys. Rev. E,
v. 73, n. 3, p. 036127+, 2006.
[121] HOGG, T.;LERMAN, K. Stochastic models of usercontributory web sites. In: Proc.
Int. Conference on Weblogs and Social Media, 2009.
[122] WU, F.; HUBERMAN, B.; ADAMIC, L.; TYLER, J. Information flow in social
groups. Physica A, 2004.
[123] LIBEN-NOWELL, D.; KLEINBERG, J. Tracing information flow on a global scale
using internet chain-letter data. PNAS, v. 105, n. 12, p. 4633-38, 2008.
[124] LESKOVEC, J.; MCGLOHON, M.; FALOUTSOS, C.; GLANCE, N.; HURST, M.
Cascading behavior in large blog graphs: Pattern and a model. Tech. Rep. 0704.2803,
arXiv, 2007. URL http://arxiv.org/abs/0704.2803.
[125] LESKOVEC, J.; KRAUSE, A.; GUESTRIN, C.; FALOUTSOS, C.;
VANBRIESEN,J.; GLANCE, N. Cost-effective outbreak detection in networks. In
KDD -07: Proc. 13th Int. Conf. on Knowledge discovery and data mining, p. 420-9,
2007.
[126] CRANE, R.; SORNETTE, D. Viral, quality, and junk videos on youtube:
Separating content from noise in an information-rich environment. In: Proc. AAAI
symposium on Social Information Processing, 2008.
[127] HOGG, T.; LERMAN, K. Social dynamics of digg. In: Proc. Int. Conference on
Weblogs and SocialMedia (ICWSM10), 2010.
[128] LERMAN, K.; GALSTYAN, A. Analysis of social voting patterns on digg. In: Proc.
1st ACM SIGCOMM Workshop on Online Social Networks., 2008.
[129] HOGG, T.;LERMAN, K. Stochastic models of usercontributory web sites. In: Proc.
Int. Conference on Weblogs and Social Media, 2009.
[130] WU, F.; HUBERMAN, B. A. Novelty and collective attention. Proceedings of the
National Academy of Sciences, v. 104, p. 17599-17601, 2007.
[131] HOGG, T.; SZABO, G. Diversity of user activity and content quality in online
communities. In: Proc. Int. Conference on Weblogs and Social Media (ICWSM),
2009.
[132] WILKINSON, D. M. Strong regularities in online peer production. In: EC -08:
Proc. 9th Conf. on Electronic commerce, p. 302-9, 2008.
63
[133] NEWMAN, M. E. J. Spread of epidemic disease on networks. Physical Review E,
v. 66, n. 1, p. 016128+, 2002.
[134] LESKOVEC, J.; ADAMIC, L.; HUBERMAN, B. The dynamics of viral marketing.
In: EC -06: Proc. 7th Conf. on Electronic commerce, p. 228-37, 2006.
[135] BAKSHY, E.; KARRER, B.; ADAMIC, L. A. Social influence and the diffusion
of user-created content. In: EC -09: Proc. 10th ACM conference on Electronic
commerce, p. 325-34, 2009.
64
Download

Modelo de Propagaç˜ao de Informaç˜oes em Redes Sociais