Artigos novos: #ProtestosBR e Debates Presidenciais


Mais dois artigos saindo do forno e que foram publicados nos anais de dois eventos. 

O primeiro, chamado "#ProtestosBR: Análise Comparativa do Discurso  dos Veículos Jornalísticos" focado nos discursos dos veículos jornalísticos sobre os #protestosBR faz uma análise comparativa dessa atuação através de elementos de análise de redes sociais e análise de contingência. O resumo:

Neste trabalho, discutimos as temáticas e o discurso reconstruído por seis veículos jornalísticos no Twitter, sobre os protestos de junho de 2013 no Brasil. Focando os veículos com maior número de retweets (@Estadao, @JornalOGlogo, @UOLNoticias, @Folha_com, @PortalR7 e @cartacapital), através de uma análise de contingência de cerca de 3 mil tweets únicos, discutimos a presença de um viés crítico com relação aos eventos, notadamente focando a tarifa como principal demanda e a violência contra os jornalistas como principal foco. Outros elementos encontrados focam eventos pontuais, a associação das manifestações com conceitos diversos, o foco no Rio e em São Paulo e o uso de hashtags.

O segundo, chamado "Métricas de Centralidade e Conversações em Redes Sociais na Internet: Desvelando Estratégias nos Debates Presidenciais de 2014" é  focado nos debates presidenciais e sua discussão na internet, traz uma análise de dois debates do primeiro turno e das estratégias dos candidatos no Twitter, através, principalmente de análise de redes sociais. O resumo:

O presente trabalho busca explorar os debates presidenciais de 2014 no Twitter, através das métricas de Análise de Redes Sociais. Buscamos analisar e discutir como os candidatos apareceram nas conversações estabelecidas pelos atores utilizando as hashtags oficiais em dois debates presidenciais. Utilizamos, para esta discussão, as métricas de centralidade eigenvector, betweeness e grau. 

Ambos estão tb na sessão de "artigos" nas publicações do blog.

A Questão do Ódio nos Sites de Rede Social


flamewar.jpgTalvez muitos não saibam, mas uma das pesquisas que desenvolvemos atualmente com maior interesse no MIDIARS (Grupo de pesquisa em mídia, discurso e análise de redes sociais) refere-se, exatamente, à questão do espalhamento da violência simbólica e do discurso do ódio nos sites de rede social. Essa questão está muito evidente com as eleições, especialmente pela intolerância generalizada nessas ferramentas. A questão central nisso é... por que isso acontece? Por que somos tao mais agressivos nos sites de rede social?

O problema do contexto e das audiências

Primeiramente, é preciso pensar sobre a questão do contexto. Em nosso dia a dia cotidiano, há normas de contexto que governam as nossas interações (para os Foucaultianos de plantão, poderíamos pensar em termos de "ordem" do discurso). Isso significa que há coisas que podem ser ditas em determinados contextos, mas não em outros. Assim, piadas sexistas que você provavelmente conte para os seus amigos no bar não serão contadas no ambiente de trabalho. Questões religiosas serão evitadas quando você está visitando seus parentes que são ultra religiosos. Nossa tendência, assim, é conversar sobre o que nos une, evitando os assuntos que possam gerar conflito (em geral, ok?), porque se gasta muita energia emocional nesse tipo de evento (discussão). O problema dos sites de rede social é que esses contextos normativos, as ordenações discursivas, não são evidentes. Não existem fronteiras claras entre as diferentes redes sociais que ali se encontram. Assim, sua rede de amigos está misturada com sua rede do trabalho, com sua rede de parentes e etc. Além disso, há uma grande audiência invisível, que você não percebe diretamente (amigos de amigos, por exemplo). Com isso, boa parte do contexto do que se fala é perdido. Pessoas que não conhecem você (ou que conhecem pouco) terão acesso ao que você publicou como piada e poderão se sentir ofendidas. Não há controle de interação (não se vê os efeitos da fala, apenas depois que ela já está presente na rede) e as correções são impossíveis ou muito difíceis. 

Isso significa que basicamente, é muito dificil "falar" para diferentes audiências, com diferentes contextos e ordens discursivas sem ofender ninguém. Especialmente em questões mais polêmicas. E, uma vez ofendidas, as pessoas são agressivas, o que inflama ainda mais as questões. Na irritação, imagina-se um receptor genérico, desconhecido que, na prática, pode ser um grande amigo. A opinião polêmica é colocada visando a concordância, o apoio da rede e não a flame (discussão). Mas a flame é uma decorrência dessa opinião e das audiências invisíveis (que é um conceito maravilhoso desenvolvido pela danah boyd aqui). E a flame também gera radicalização das posições e não debate. Aí não se discutem idéias, mas se agride o falante, o sujeito que diz. 

O problema do preconceito

Por causa dos elementos que falei acima, vemos que discursos presentes na sociedade começam a se tornar mais visíveis. Isso significa que não é a internet que faz com que as pessoas falem mal dos nordestinos, como recentemente observamos após os resultados do primeiro turno das eleições. Este discurso já está presente na sociedade brasileira. Não são as pessoas que decidem ser racistas ou homofóbicas por conta da internet. Esses discursos já estão na sociedade, eles apenas são "abafados". Você não faz aquela piada racista para pessoas que vão te julgar por isso. Ou seja, a internet parece ter um papel desvelador de discursos que estão presentes, preconceitos constituídos e elementos de violência simbólica. E esse desvelamento, embora ele discuta a naturalização dessas idéias (por exemplo, o sujeito que diz "não sou preconceituoso, mas..."), ela também coloca o sujeito no holofote.

A questão é que, uma vez mais visível, esse discurso de ódio pode encontrar ressonância. E uma vez que encontre, ele é legitimado por outros grupos, seja através de concordância, apoio, curtidas, compartilhamentos etc. E essa legitimação amplia a força desse discurso, tornando-os menos marginal. Então, aquele discurso torna-se mais aceito e seu enunciador, mais certo de que aquilo é "verdadeiro". Esse mecanismo funciona tanto para discursos que consideramos legais (por exemplo, apoio a causas e discussão de questões de gênero, etc.) quanto para discursos que consideramos intolerantes. 

Vejam, por exemplo, o mapa a seguir, que tem cerca de 36 mil tweets coletados logo após as eleições contendo a palavra "nordestinos" (que está dentro do conceito "Nordeste"). As conexões representam a frequência do conceito em relação aos demais conceitos e o tamanho do nó (palavra) o número de vezes que apareceu no dataset. Observem os traços presentes associados à "Nordeste" (burros, pobres, bolsa familia, mal, voto, culpa e etc.)

nordeste1.png


Assim, consideramos que é essencial estudar esses mecanismos para compreender como esses discursos aparecem e, fundamentalmente, oferecer subsídios para o desenvolvimento de políticas de educação para esses discursos de ódio. Mais do que isso, também é necessário compreender os mecanismos da intolerância e da radicalização ocasionados pela hiperconexão dos sites de rede social e pelos mecanismos de informação hoje. 



#DebateCNBB - Alguns dados


Ontem coletei dados do Twitter sobre o debate promovido pela CNBB e a TV Aparecida. A hashtag de coleta foi #DebateAparecida. Este mapa foi de uma coleta as 23:53, quase no encerramento do debate. Fiz várias coletas, mas só vou colocar aqui os dados da última coleta, os finais do debate. Foram 20 mil tweets totais, dos quais, 6066 nós e 12835 conexões únicas. Ele mostra citações e retweets e centrei a análise nos candidatos. Utilizei o NodeXL para a coleta e análise. É importante ressaltar que devido ao grande número de tweets, esses dados são provavelmente referentes aos tweets dos momentos finais do debate e não do debate como um todo.

Indegree (mais citados entre os 20)
@jornaloglobo - 618
@blogdosakamoto - 576
@lucianagenro - 537
@aecioneves - 536
@diimabr - 481
@eduardojorge43 - 316
@dilmabr - 311
@aecioblog - 228
@silva_marina - 129
@levyfidelix - 126

É interessante observar que é a primeira vez entre os dados dos debates que eu coletei (tenho coletado todos) em que Luciana Genro e o Eduardo Jorge aparecem com tantas citações. 

Betweenness (candidatos mais "pontes"- citados por grupos diferentes)
@blogdosakamoto
@diimabr
@jornaloglobo
@aecioneves
@lucianagenro
@dilmabr
@aecioblog
@eduardojorge43

Esses dados mostram que os candidatos que mais apareceram nos momentos finais foram Aécio, Luciana, Dilma e Eduardo Jorge. Marina aparece menos, bem como os demais candidatos (nesses dados).

O mapa a seguir mostra o papo nesse tempo final separado por clusters (grupos) por contas que tendem a ser citadas juntas (Clauset-Newman-Moore). É interessante observar os clusters por embates nesse final: De um lado, com o maior cluster de citações, Luciana Genro (PSOL) e Aécio Neves (PSDB). Em outro grupo, Eymael (PSDC) e Marina Silva (PSB). Em um grupo menor, abaixo, Dilma Rousseff (PT) e Levy Fidélix (PRTB). Separados, Eduardo Jorge (PV) com um grande cluster em verde e Pastor Everaldo (PSC) em verde claro. (Clique na imagem para ver em tamanho maior)

debatecnbb23532.png

Palavras mais citadas por cluster: 
G1 (azul, luciana e aécio ao centro): luciana genro, sujo, mal lavado, corrupção, Aécio, Dilma, aeroporto.
G2 (azul claro, com marina e eymael ao centro):luciana, debate, dilma, aécio, eduardo jorge, eymael, pergunta, tempo, aborto.
G3 (verde escuro, acima) viradadoaecio, aécio, dilma, luciana, marina, brasil, petrobras, pt.
G4 (verde claro, c/ eduardo jorge ao centro): eduardojorge, aborto, lei, machista, jornaloglobo, aécio, luciana, dilma, proibição, criminoso.
G5 (vermelho, no canto): reduzir, luciana, aécio, eduardo, pastor, chobatada, dízimo, excomunhão, aeroporto.
G6 (laranja, ao centro): diimabr, aécio, never, aeroporto, psdb, corrupção, cristã, católica, bilhões.
G7(amarelo, com dilma e levy ao centro): dilma, greenpeace, levyfidelix, luciana, aécio, debate, hidrelétrica, brasil, jornaoglobo.
G8 (verde claro, everaldo ao centro): dilma, marina, aécio, brasil, quatro, acorda, luciana, everaldo, jornaloglobo.

Tem outros dados dos debates anteriores de análises que fiz no blog do MIDIARS, grupo de pesquisa do qual participo.

A Espiral do Silêncio na Mídia Social


spiral.jpgUm estudo da Pew Internet, liderado pelo Keith Hampton, que foi divulgado na quinta passada apontou a existência, cada vez mais forte, da chamada "espiral do silêncio" na mídia social. A idéia é básica e conhecida: As pessoas tendem a fugir do conflito nas suas redes sociais (offline) e por isso, conversam sobre os assuntos que tendem a conseguir maior concordância da audiência (demais pessoas) e não sobre aqueles onde a disconrdância e o conflito podem aparecer (que são, portanto, silenciados, gerando uma inexistência da discordância). O estudo testou alguns casos polêmicos nos EUA (como o caso Snowden) e apontou que (1) as pessoas pareciam estar menos dispostas a discutir esses temas polêmicos na mídia social do que offline, (2) ao contrário do esperado a mídia social não foi apontada como uma plataforma para compartilhar opiniões de forma alternativa, (3) as pessoas tendiam a discutir os temas apenas se achavam que a audiência concordava com elas, (4) usuários de mídia social também tendem a compartilhar menos as suas opiniões no espaço offline, exceto em casos onde pensavam que a sua audiência nesses sites concordava consigo.

O estudo é bem relevante porque mostra os efeitos da mediação e do conflito na mídia social para o silenciamento dos discursos discordantes (por exemplo, aqueles minoritários numa determinada cultura) e é bastante semelhante aos que encontramos na nossa pesquisa sobre a violência na mídia social no Brasil. Vou comentar alguns pontos que eu acho relevantes:

 A mídia social torna as redes sociais mais heterogêneas. Isso basicamente quer dizer que mais gente que pensa diferente de você está mais conectado a você na mídia social (uma vez que as redes são mais complexas) do que no ofline. Ou seja, você tem mais acesso à opiniões discordantes e o conflito pode ser mais frequente com isso. Assim, ferramentas de filtragem, como as que o Facebook implementou ("silenciar", "unfollow" e etc.) são mais relevantes para as pessoas. 

Contraponto

Entretanto, acho que há uma série de diferenças aqui e hipóteses que acho que dá pra pensar. Diferenças  (1) entre Twitter e Facebook e (2) entre usuários brasileiros e americanos. Primeiro que me parece que nesse último caso, os usuários brasileiros ainda estão menos envolvidos nessa "espiral" que os americanos neste momento, o que não quer dizer que com a visibilidade dos casos de ódio isso não se reduza consideravelmente. Acho que a principal causa aqui é um pouco de falta de experiência. Segundo que enquanto o Facebook constroi uma rede mais "invisível" para os usuários - e portanto, levaria a um contato maior com discursos aliens - o Twitter constrói uma rede mais pública e visível e, portanto, poderia levar a uma maior construção da espiral do silêncio. Além disso, a "pressão dos pares" pode ser mais reduzida quando os próprios pares discordam (o que seria mais provável em redes sociais maiores, que seria o caso das redes sociais online), o que poderia reduzir essa pressão, uma vez que a rede social seria capaz de permitir a organização e a visibilidade de grupos sociais menores.Finalmente esse contato com discursos divergentes pode radicalizar o discurso da minoria ou plantar uma sementinha de dúvida e fazer silenciar ou mudar de opinião.

 Quais seriam os efeitos dessa espiral, caso seja amplificada? 

Primeiro, o maior fechamento dos grupos sociais - as pessoas tendem a usar mais ferramentas de moderação/separação/ invisibilidade, o que reduz o valor (social) de sites de rede social como o Facebook (que misturam diferentes redes) e aumenta o valor de espaços que permitem redes menores (como o Whatsapp). Segundo, um maior fechamento dos processos de difusão de informações, onde menos informações diferentes circulam nos clusters e mais informações iguais - e que buscam o acordo têm mais atenção. Temos observado, na pesquisa da violência, exatamente esses efeitos em grupos segmentados. Resta saber se são abrangentes e gerais ou não. Temas aí para bons e necessários estudos.

Debate da Band: Algumas Redes no Twitter


Estou ainda analisando e vendo o que se pode perceber nos dados do primeiro debate. Coletei uns 80 mil tweets com várias hashtags. Aqui vou mostrar dois mapas, do final do primeiro e do terceiro bloco, ambos com cerca de 20 mil tweets. Vemos, no grafo, os nós que citaram as contas oficiais dos candidatos. Colori os candidatos para que se veja melhor. Há muitas citações únicas, com vários grupos em torno dos candidatos (eu chamo de pedaços de brócolis- são contas que só citaram aquele candidato, mais relacionadas à militância). Ao centro, aqueles que citaram mais de um candidato. E na periferia, aqueles que falaram do debate usando a hashtag, mas não citaram as contas oficiais (a maioria),  Os grafos abaixo foram feitos a partir da hashtag #debatedaband e ao final dos blocos em questão. As conexões são citações, retweets e menções. Não vou mencionar os demais usuários que também foram citadas, exceto se relevantes p/ o comentário.

Primeiro bloco: (20 mil tweets, 8857 contas)

Nós mais citados (maior indegree): @dilmabr (1250), @jeanwyllys_real (446), @silva_marina (338), @diImabr (a bolada) (306), @aecioneves (144). 

Nós com maior centralidade betweenneess (mais citados por diferentes grupos - nessa medida estou tentando tirar a militância): @dilmabr, @jeanwyllys_real, @silva_marina (em quarto), @diImabr (a bolada), @aecioneves (em décimo).

A rede a seguir mostra a posição na rede dos candidatos pelas conversações no primeiro bloco do debate (não estamos, neste momento, avaliando a qualidade das citações, apenas sua existência). Essa rede marca também se quem falou do candidato A também falou do B, por exemplo. Quanto mais interconectada a rede de um candidato à dos demais, maior o número de pessoas que falou de ambos. É relevante observar que apenas um pequeno grupo (notadamente mídia e quem narrou o debate) faz esse trabalho, situando-se mais ao centro do grafo. (Clique na imagem para ver em tamanho maior)

bloco1debate2.png
É interessante, neste mapa, observar as militâncias muitas vezes como "torcidas" (há blocos de apoio - os brócolis) para cada candidato. Há maior coordenação da militância da Dilma e menor das dos demais candidatos em torno das citações. Além disso, a Dilma é a mais citada também pelos demais, até mesmo pelas falas no primeiro bloco. Curiosamente, o @jeanwyllys_real foi muito mais citado que a candidata do PSOL pela conta oficial. Marina desponta também com muitas citações (muitas críticas também). Luciana está mais ao centro do grafo, como Fidelix, porque são candidatos que foram mais citados por grupos diferentes.

Terceiro bloco: 19 mil tweets, 14373 nós

Mais citados: @diImabr (a bolada) (851), @silva_marina (668). Depois vários usuários e em 7o, @aecioneves (323) e em 9o, @queremosaecio (227).

Os mais citados por grupos diferentes (ou seja, nessa medida estou tentando tirar a militância): @diImabr (a bolada), @silva_marina, @aécioneves em quarto, @dilmabr em nono.

bloco2debate.png
O mapa da rede continua bastante semelhante. Vejam que a Luciana Genro vai mais para o meio do grafo, ou seja, começa a ser citada por mais grupos diferentes, bem como o Eduardo Jorge. Dilma, Marina e Aécio também apresentam grupos que falam apenas deles (como no primeiro bloco), mas com mais ênfase aqui, onde reduz a polaridade Dilma-Marina do primeiro grafo. Há várias contas de apoiadores sendo citadas junto com a do Aécio que começam a aparecer. E junto à Dilma, tem as citações da Dilma Bolada, que neste bloco foi a conta mais citada. Finalmente, as citações à Marina crescem bastante e, principalmente, dentro de diferentes grupos. Há um conjunto mais fluído de contas que citaram mais de um candidato (portanto, mais torcida), por isso há um maior afastamento do centro (menor clusterização) do grafo.

Depois vou ver se consigo olhar o resto dos dados. P/ essa análise, usei o NodeXL. :-)

A estreia de Peter Capaldi no #DoctorWho


De sexta a noite até hoje ao meio dia coletei dados (tweets) relacionados à estreia da nova temporada da série inglesa "Doctor Who" e do ator Peter Capaldi no papel de doctor. Eu ainda não vi o episódio (sem spoilers, por favor), mas pelos comentários gerais, fiquei bem entusiasmada. A seguir, o mapa dos discursos a partir da hashtag "#doctorwho" (que por algum motivo, é sempre a favorita dos whovians, deixando "#drwho", a escolha mais óbvia, em segundo lugar), com 68.586 tweets. Já que o Marco Toledo Bastos sempre reclama dos meus grafos de bolinhas, fiz um de tags.  Tamanho das tags indica frequência da palavra (ou conceito), força da conexão por espessura, proximidade por co-ocorrência, bem como conexão. Como sempre, cliquem nas imagens para ver em tamanho maior.

doctorwhopeq.png

Vejam que há muitos termos positivos associados à tag, o que me surpreendeu, dado que quando mapeei a escolha do Capaldi como novo doctor, tínhamos muita polêmica. Ao que parece, os fãs realmente gostaram muito do episódio. Vemos, logo a seguir, uma imagem do cluster marcado por centralidade betweenneess, ou seja, pelas palavras/conceitos que aparecem em mais tweets diferentes entre si (para retirar um pouco a questão dos retweets/spam de um pequeno grupo que podem alterar o resultado). Vejam que continuamos com posições altamente positivas. (Destaque para o "love" escondido embaixo do "doctor who". ) 

doctorwhocluster.png

Também graças a um script do Marco, tenho um mapa dos tweets por localização. É interessante para mostrar onde a série parece "ecoar" mais e onde se falou do novo episódio. Vejam que há um foco grande na Europa e no UK, como esperado, mas também uma grande popularização nos EUA.

doctorwho_tweets_geolocation.png

Fiz algumas buscas específicas por "Capaldi" também, para tentar capturar dados mais focados na atuação dele. A seguir, 49334 tweets com a palavra "Capaldi" e o que eu extraí desses tweets (nos mesmos parâmetros das redes anteriores). Vejam que também os termos são muito elogiosos. 

capaldinovo.png

A seguir, a rede marcada pela mesma medida de centralidade anterior, onde se pode perceber melhor os termos utilizados para qualificar o ator.

capaldiclusterbetwenneess.png
De novo, por geolocalização a seguir, vemos de onde saíram os tweets que comentaram a atuação. De novo, forte presença da Europa, EUA e, na América do Sul, do Brasil. 

Capaldi_tweets_geolocation.png
De posse desse spoiler, fiquei entusiasmadíssima para assistir o novo episódio. Agora vamos ver o que vou achar. :-)

#DilmanoJN


Ontem a presidenta Dilma esteve presente no Jornal Nacional, para uma entrevista de 15 minutos, conforme vem sendo feito com os candidatos a presidência da República. Coloquei o Aécio que foi semana passada no último post. Agora o grafo da discussão em torno da hashtag #DilmanoJN. Coletei cerca de 9 mil tweets uma hora após a entrevista. Uma vez retirados tweets repetidos (spam) e afins, ficamos com 6010 tweets e 3016 contas únicas. Como o grafo do Aécio, o de Dilma também é bastante polarizado. Na imagem a seguir, as conexões em vermelho representam grupos apoiadores, cujos conjuntos de palavras mais utilizadas remetem ao apoio à reeleição da presidenta. Em azul, os grupos contrários, seja por manifestações críticas ou a favor de outros candidatos. Em cinza ficaram os grupos "neutros", onde não foi possível determinar um posicionamento claro. (Clique na imagem para ver em tamanho maior.)

dilmanojn.png

Na tagcloud a seguir, temos os principais termos utilizados pelo principal grupo de apoio (o maior). Há uma clara militância nesse sentido, com a hashtag #dilma13denovo, que foi largamente utilizada pelos grupos de apoio em conjunto com a hashtag #dilmanojn (que eu excluí da tagcloud justamente porque foi o termo de coleta de dados, então obviamente seria o mais citado). Também é interessante observar os elementos positivos associados nesta tagcloud. (Clique na imagem para ver em tamanho maior.)

g1dilma.png
Na tagcloud a seguir, peguei o principal grupo crítico. Vejam que os termos utilizados mudam, e que os candidatos concorrentes são bastante citados. Também há palavras mais críticas, como "foradilma. É importante ressaltar que houve também uma militância contrária à Dilma, que foi marcada pela hashtag #EuVouDeAécio, que subiu nos trending topics meio que junto com a #dilma13denovo. A questão é que o grupo crítico não usou a hashtag #dilmanojn, o que fez com que seus tweets não aparecessem nessa busca. Assim, as palavras usadas pelos grupos críticos são mais difusas e menos direcionadas nestes dados do que as do grupo de apoio, que aparecem mais organizadas.

g3dilma.png
A seguir, o grafo total das palavras mais citadas. Vemos um conjunto total mais positivo (porque, como vimos no grafo, há um conjunto maior e mais articulado de militância no sentido de construir conceitos positivos). Os comentários negativos são mais difusos (embora também tenha aparecido militância contrária, conforme vimos), pois se articularam em torno de uma hashtag que não analisei aqui.
dilmatudo.png
É importante notar a presença das militâncias na mídia social. Elas demarcam uma guerra discursiva agressiva que tem começa a ganhar força online porque tem mais visibilidade. É interessante também que essa guerra apareça com mais força no grafo de hoje, em detrimento daquele do Aécio que fiz semana passada. Faz sentido, uma vez que Dilma está em primeiro lugar nas pesquisas, que exista uma concentração de militância anti-Dilma dos opositores, bem como uma maior militância positiva. A ver no que isso tudo vai resultar.

A coleta e análise dos dados apresentados aqui foi feita com o NodeXL, as tagclouds gerados com o Wordle e as análises com scripts desenvolvidos pelo MIDIARS.

#AecionoJN


Ontem a noite o candidato a presidência da república Aécio Neves deu entrevista ao Jornal Nacional. A hashtag #aecionojn apareceu nos trending topics do Twitter e ficou ali por um bom tempo. Fiz uma coleta rápida, de cerca de 18 mil tweets, dos quais 12304 usuários únicos. O grafo abaixo mostra as interações entre esses usuários. Usei o NodeXL. Os grupos estão separados por clusters (Clauset-Newman-Moore). Isso significa que as contas que mais se citaram entre si tendem a ficar agrupadas no mesmo conjunto, abarcando um pouco melhor as conversações de determinados grupos. 

É interessante que claramente temos dois grandes grupos: O azul, que parece conter uma posição mais favorável ao candidato e sua participação no programa e um vermelho, que parece conter um grupo mais crítico ao mesmo.  Também há dois outros grupos (em verde e azul claro), mas a posição dos tweets é mais difusa nesses dois. (Clique na imagem para ver em tamanho maior.)

aecionnojn.png
Para tentar entender melhor essas participações no Twitter, fiz tagclouds das palavras mais frequentes em cada um dos principais grupos e no grafo como um todo. A seguir, a tagcloud do grafo como um todo. Vemos aqui as palavras mais frequentes (por tamanho) utilizadas nos tweets. O tamanho das palavras se dá por sua frequência e selecionei apenas as 100 mais frequentes, retirada a hashtag, que obviamente se apresenta em todos os tweets. (Clique na imagem para ver em tamanho maior.)
tagcloudgrupo1.png

A seguir, a tagcloud das palavras mais frequentes usadas no grupo 1 (o Grupo azul). (Clique na imagem para ver em tamanho maior.)

aeciogrupo12.png
E finalmente, a tagcloud das palavras mais frequentes no grupo 2 (o vermelho). (Clique na imagem para ver em tamanho maior.)
tagcloudgrupo2.png
É interessante observar que há frequencias diferentes de palavras diferentes em cada grupo, embora o conjunto e a oposição entre Aécio e Dilma apareça em todos. Também é interessante observar que grupos diferentes parecem participar entre si, mas pouco conjuntamente (o que seria esperado, com exceção de pontos de união em flames - discussões - e citações a um candidato ou outro).