Anúncio de Dunga como novo técnico da seleção


Coletei esses tweets com o NodeXL, entre 10 e 11 da manhã de hoje, após o anúncio oficial na coletiva da CBF. Foram 11.444 tweets e  8122 nós envolvidos (contas). Como o Node não se dá muito bem com grafos muito grandes, as imagens foram feitas no Gephi. Para a análise, usei uma série de programas diferentes, além dos já referidos.

O primeiro grafo é o das citações e menções. Ao centro, estão aqueles nós que mais repercutiram com sua cobertura do anúncio, ou seja, que foram mais citados e retuitados. São eles: @oledobrasil, @skysportsnews, @impedimento, @brasilglobetour, @cbf_futebol, @everaldomarques, @lbertozzi, @espn_interativo, @anterogreco.  Também temos os nós mais "ativistas", ou seja, aqueles que mais citaram outros nós, participando da conversação em torno do anúncio. São eles: @michaelmsb, @serpaiva, @brendonhilario, @robertagbetty. Também temos aqueles nós que repercurtiram mais em grupos diferentes, ou seja, que foram citados dentro de clusters diferentes de nós: @oledobrasil, @everaldomarques, @fernando_duarte, @cbf_futebol, @skysportsnews, @impedimento.  Na imagem, a seguir, mostro apenas o centro do grafo e seus principais clusters (marcados por vizinhança). Para ver o mapa com todos os nós, clique aqui (o mapa é grande e vai demorar um pouco a baixar).

dungacluster.png
(Clique na imagem para ver em tamanho maior.)

A seguir, temos o mapa com os discursos em torno do anúncio que estão estabelecidos nos tweets coletados. Os conceitos estão aproximados por co-ocorrência, ou seja, quanto mais tendem a ocorrer juntos, mais próximos e da mesma cor são as conexões. O tamanho de cada conceito está estabelecido pela frequência dele nos dados. Vejam que o material principal está focado na apresentação do novo treinador, com um conjunto de sentimentos positivos e negativos associados. O centro da discussão é a apresentação de Dunga pela cbf, como técnico da seleção do Brasil. 

dungatexto.png
(Clique na imagem para ver em tamanho maior).

Entre o maior número de ocorrências entre dois conceitos, Dunga é descrito como (1) novo (3000 ocorrências), (2) burro (485 ocorrências), (3) bom  (150 ocorrências), (4) gaúcho (30 ocorrências),  (5) retrocesso (19 ocorrências). Ou seja, ha uma maioria de sentimentos negativos associados ao nome do novo treinador. Entretanto, há também muitos desejos de boa sorte e bom trabalho, embora nao associados diretamente ao nome do treinador e com tanta força quanto os anteriores. Como boa parte da repercussão está associada à cobertura da imprensa (vide o grafo anterior), é possível que boa parte dos desejos positivos associados tenham sido fruto desta cobertura e que os comentários negativos sejam mais proeminentes no grande público (ou seja, nos usuários que comentaram a escolha de Dunga, não necessariamente citando a imprensa).  

#PresosdaCopa: Mapa dos discursos


Grafo dos discursos em torno da hashtag #presosdacopa Unidade em torno da crítica à prisões arbitrárias (cluster azul), críticas ao governo federal e às obras (verde) e citação dos principais patrocinadores da copa (vermelho). 20 mil tweets, coletados ontem, após o jogo do Brasil. Retirei propositalmente as @s, só deixei a da presidenta, por motivos óbvios.

Imagem em tamanho maior aqui -https://www.dropbox.com/s/osd6df8l8qzn0dz/presosdacopa.png . Clicando na imagem abaixo vc tb vê o grafo em tamanho maior.

presosdacopapeq.png

O Discurso em torno de Zuniga: Críticas e Xingamentos


Para o trabalho em torno da propagação da violência simbólica que atualmente desenvolvemos junto ao grupo e ao MIDIARS, coletamos os tweets relacionados ao jogador Zuniga, da Colombia, que atingiu o brasileiro Neymar no último jogo contra a Colombia, sábado, e o tirou da Copa.

O primeiro mapa aqui mostra um conjunto de 60 mil tweets, onde estão os principais conceitos associados aos tweets que foram coletados. Vejam que o nome do Neymar aparece igualmente ao do Zuniga. Há uma série de xingamentos em várias línguas ao redor e chamo a atenção para o "negro" que aparece a esquerda. O tamanho dos nós é proporcional a sua frequencia, a cor representa vizinhança (nós que tendem a aparecer mais juntos), bem como quanto mais ao centro, maior a ocorrencia em conjunto. As conexões representam a intensidade da co-ocorrência. (Clique para ver a imagem um pouco maior.)


zunigagrau.png
O segundo mapa apresenta os conceitos por centralidade eigenvector. Os nós estão distribuídos exatamente como no mapa anterior. Vejam como há concentração de mensagens de apoio também próximas aos xingamentos, que nascem provavelmente como resposta aos últimos (e por isso estão interconectadas). Relevante observar que os xingamentos não estão restritos a mensagens em Português. 

stronglyconnected.png
Último item, os principais assuntos que estão nestes dados, que permitem que a gente veja melhor quais conjuntos de palavras mais apareceram juntas. Clique para ver em tamanho maior. 
zuniga2.png
Último mapa, desta vez de apenas 40 mil tweets, c/ o mapa dos tweets por localização (apenas dos geolocalizados).
zuniga_tweets_geolocation.png

#Compós2014: Quem falou e o que falou no Twitter


Aconteceu nos últimos dias o Encontro da Compós em Belém (PA). Gabriela Zago apresentou nosso trabalho (meu, dela e do Marco Bastos) chamado "Quem retuíta quem? Papéis de ativistas, celebridades e imprensa nos #ProtestosBR" no GT de Cibercultura, mais um artigo resultante do trabalho conjunto nos dados dos protestos de Junho. Eu e o Marco não pudemos ir, mas acompanhamos de perto a discussão. 

Este ano, teve bem pouca participação do pessoal do evento no Twitter, provavelmente porque a Internet não estava muito boa. Ainda assim, coletei alguns dados via hashtag #compos2014 e fiz alguns mapas. São cerca de 200 tweets apenas. 

compos2014.png
(Clique na imagem para ver em tamanho maior.)

O primeiro acima mostra a participação dos poucos nós no Twitter. Está dividido por grupos (clusters) por cortes e por recortes.  Quanto mais central o nó em cada grupo, mais ele citou e foi citado. Aliás, as conexões mostram justamente, as citações. Como há um grupo bem grande de retweets, citação não significa necessariamente que a @ participou do evento, cobrindo ou comentando. Nós com maior indegree (mais foram citados por outros nós): @compos2014, @gabizago, @andrelemos, @herdeirodocaos, @ufpa_oficial, @fatimaregis, @sibonei. Nós com maior outdegree (mais citaram outros nós): @gabizago, @divabelem, @raquelrecuero, @herdeirodocaos, @ronaldohenn. 

GTs mais citados: #gtciber (21 citações) e GTJornalismo (14 citações, mas apenas "jornalismo" tem 15). 

O mapa a seguir mostra as co-ocorrências de termos nos tweets (apenas co-ocorrências maiores que 20). Vejam como os GTs de Jornalismo e Cibercultura dominam o debate, possivelmente porque tinham mais membros tuitando a respeito.

compos2.png
(Clique para ver a imagem em tamanho maior.)

No grafo dá para ter uma idéia dos assuntos que mais rolaram nos GTs e do que mais foi comentado. Cores significam vizinhança, ou seja, palavras que tenderam a aparecer mais juntas (como grupo). Tamanho do nó é a frequência individual de cada palavra. Espessura da conexão indica força (vezes em que o par apareceu mais associado).http://encontro2014.compos.org.br/

Usei: NodeXL, Gephi, Textometrica.

Ferramentas, Grafos e Redes Sociais na Internet


Já escrevi aqui no blog vários posts sobre ferramentas de análise e visualização de grafos, ferramentas de coleta de dados e ainda, métodos de análise. Só que vez por outra as pessoas me procuram perguntando novamente como eu faço um determinado grafo e como se analisa/coleta esses dados. É muito legal que o estudo dos dados provenientes de redes sociais na internet esteja seduzindo tanta gente. É preciso que, cada vez mais, a gente estude/compreenda melhor os impactos da tecnologia na vida das pessoas e da sociedade. Claro, isso não se faz apenas através de estudos quantitativos (como é o principal foco desses estudos com grafos), mas também com esses trabalhos. Então para atualizar um pouco essas discussões e os sistemas que tenho usado, segue a lista. 

Crawlers
É claro que a primeira coisa que se precisa ter para coletar dados para um grafo é uma questão de pesquisa, algo que se quer "descobrir" e que se presta a esse tipo de análise. Alguns crawlers populares:

yTK - É uma chatice de instalar/fazer rodar. Precisa de um servidor (porque vai rodar 24/7) e uma conexão bastante estável para não sair do ar toda hora. Essencialmente, você corre uma série de riscos ao utilizá-lo, porque tecnicamente a API do Twitter tornou esse tipo de coleta não muito, digamos, legal. A qualquer momento, portanto, pode ser barrado. Também leve em conta que tem vantagens: ele coleta tweets do momento que você setou a busca em diante, e tende a coletar uma quase totalidade dos tweets (há controvérsias) no período em que você o deixar rodando.  Só para Twitter.
NodeXL - Pra mim é o melhor sistema para quem está começando. Não precisa servidor, você pode rodar de casa mesmo, tem uma interface bastante amigável e funciona como um layer para o Excel. Além disso, vem junto com formas de analisar e plotar esses dados. Desvantagem é que coleta tweets para o passado, ou seja, do momento que você setou para trás. Com isso, sofre outras limitações do Twitter como tempo de ping (o Twitter limita imensamente esse tipo de busca), e número de tweets buscados (18 mil). Tem plug in para Facebook, YouTube e outros sistemas (Social Network importer).
NetVizz - Funciona via Facebook e para o Facebook. Coleta dados e mostra o grafo.

Também é bom lembrar que muitos pesquisadores desenvolvem suas próprias ferramentas (programam) e que há uma série de limitações para a coleta desse tipo de dado da maior parte dos sites de rede social. Por conta disso, há muitos sistemas aparecendo o tempo todo e que você pode conseguir usar ou até mesmo desenvolver. Também é bom lembrar que a maioria dos crawlers (com exceção do NodeXL) também precisa que os dados sejam tratados antes de ser enviados para um programa de análise. Isso também pode dar algum trabalho.

Análise
Uma vez que você tenha coletado os dados, é preciso analisá-los. A primeira coisa que você precisa fazer aí é definir um método de análise. Na maior parte das vezes, a visualização de grafos leva em conta métricas da Análise de Redes Sociais (escrevi recentemente um texto sobre que está aqui em versão rascunho). Mas também pode usar (como eu tenho usado ultimamente) outros focos, como Análise de Conteúdo/Discurso, etc.  (Leia mais aqui sobre pra que servem esses estudos.) A partir desta decisão, há vários programas free e pagos que podem ajudar a analisar os dados em grande quantidade: 

Redes e Visualização de Redes:
NodeXL - Já falei acima, é uma opção que coleta e analisa no mesmo sistema.
Gephi - A escolha de 9 em 10 estudiosos do momento, analisa e plota os grafos. Não é muito amigável e tem um monte de plugins que precisam ser instalados para que você tenha mais opções de visualização. É bom também salientar que o Gephi precisa de bastante memória e que quanto maior o grafo, mais lento ele é. 
NetDraw- Uma das primeiras ferramentas que usei, lá em 2002. Limitada, mas free. 
GraphStream - Também é bem interessante e free. 


Análise de Conteúdo (Recomendo que você estude um pouco sobre análise de co-ocorrências em análise de conteúdo para poder entender o que esses sistemas fazem):
WordStat - É super completo, mas também difíci de usar. E é pago. 
Leximancer - Um dos mais legais, mas também não é simples de usar e é pago.
Textometrica - É bastante rápido e free. Só que não é muito amigável também. 
ConTEXT - Não consegui usar ainda, mas também faz análise e grafos de co-ocorrências de conceitos.
Wordle - Apenas para tag clouds e visualização de nuvens de frequencia.

Finalmente, é bom lembrar:
Screen Shot 2014-04-30 at 8.27.13 AM.png
(Crédito da imagem para a Gabriela Zago.)

Já falei várias vezes aqui, mas grafos são apenas representações e como representações, não querem dizer muita coisa a menos que estejam definidos o modo de plotar, as métricas utilizadas, a forma de coleta e etc. Assim, é preciso analisar, explicar métricas, dados e forma de plotar. Senão são meras ilustrações. Este outro post  explica isso em mais detalhes.

Outras referências:
# Falei de mapeamento anteriormente aqui. 
# Site do projeto do Axel Bruns - Mapping Online Publics - que explica as ferramentas que eles usam. 
# Site do projeto Ecologia Digital do pessoal da USP que também explica o ferramental.

Dados da #ArenaNetMundial


Análise de conteúdo e grafo das co-relações dos conceitos relacionados aos termos mais utilizados com as hashtags #ArenaNetMundial, #netmundial2014, #netmundial. Total de 59484 tweets. Os conceitos representam mais de uma palavra, geralmente também em mais de uma língua. A força da conexão (grau) é dada pela força da linha, que representa o número de vezes em que os conceitos apareceram juntos. Não retirei @s e hashtags que representam usuários mais citados (RT e menções), mas também estão agrupados por conceito. O tamanho do nó representa o grau (ocorrências) de cada conceito. Cores são indicativo de modularidade (conceitos que tendem a aparecer mais juntos). O grafo separa os nós que apareceram em um menor número de contextos mais do lado de fora do grafo. (Clique no grafo para ver em tamanho maior.)

Untitled-2.png

Artigos sobre os #protestosBR


sul.pngDepois de um longo hiato, simplesmente por conta de trabalho demais, retorno aos poucos ao blog. Uma das razões pelas quais estive ausente foi um grande investimento de trabalho com o Marco Toledo Bastos e a Gabriela Zago no sentido de analisar os dados que coletamos durante os protestos de junho. E esses estudos já renderam alguns frutos, que estão, aos poucos, sendo publicados. Vou comentar rapidamente de três artigos aprovados, que já foram publicados/estão sendo publicados.

Esse artigo, que saiu em março na First Monday, traz um experimento com análise espacial, ou seja, com as informações geográficas dos tweets sobre os protestos e os protestos em si. Vejam que os protestos espalharam-se largamente pelo País, conforme todos sabemos. Entretanto, queríamos explorar essas relações a partir das informações de GPS, dos perfis dos usuários e da narrativa em si e especialmente, qual o papel de cada usuário na narrativa dos protestos a partir de sua localização geográfica. Entre os principais resultados, observamos que muitos usuários que falavam dos protestos usando as hashtags, digamos, "localizadas" (como #protestosp, por exemplo), não estavam realmente nas ruas, mas usavam essas tags como uma forma de "amarrar" seus tweets ao stream do protesto naquela localidade. Esses usuários atuam também como reverberadores das informações das ruas, ampliando o alcance do protesto. Outro elemento relevante foi que muito da narrativa dos protestos estava focada nos grandes centros urbanos, especialmente São Paulo e Rio de Janeiro, mesmo quando outras localidades também tinham protestos. Ou seja, mesmo com protestos em seu quintal, as pessoas amplificavam principalmente aqueles protestos que já tinham muita visibilidade, amplificando narrativas que nem sempre eram as da sua localidade. Tem mais detalhes no artigo (e dados).

Esse artigo foi aceito para ser apresentado na Compós de 2014. O objetivo foi explorar detalhadamente a questão dos "papéis" dos usuários na circulação e a difusão de informações dos protestos no Twitter. Explorando esses usuários, observamos três grandes papeis (ativistas, celebridades e imprensa), cada qual com uma função específica. No artigo, discutimos essas funções e seus impactos nos protestos. Observamos que aqueles usuários que produzem informações dependem daqueles que não estão no local para sua reverberação e amplificação da visibilidade. Assim, esses vários papéis vão atuando em diferentes estágios da produção e da difusão das informações, onde tanto ativistas (que atuam publicando várias informações sobre os eventos), celebridades (que dão visibilidade e amplificam os eventos) e imprensa (que realizam a cobertura e legitimam a narrativa) co-existem.

O Discurso dos #ProtestosBR: Análise de Conteúdo do Twitter
Esse terceiro está na fila para a publicação na Galáxia e deve sair apenas no segundo semestre (se você quiser uma cópia "rascunho" antes disso, envie um email). Esse artigo foca a questão do discurso dos protestos, buscando analisar quais temáticas e co-relações entre as temáticas foram mais frequentes em cada região brasileira, identificando atores, contextos e demandas. Entre os principais resultados, observamos o uso do Twitter para (1) narrar os protestos e (2) mobilizar outros usuários, mais do que para discutir e debater demandas e ações, (3) foco no ao vivo, ou seja, nas narrativas do "agora", (4) uso de hashtags "panfletárias", ou seja, mobilizadoras e interconexões fortes entre algumas regiões brasileiras. Também foi importante observar que os principais atores são os manifestantes em si, ou seja, na maior parte dos discursos, encontramos pouquíssimas demandas.

Há mais coisa por aí. Assim que tiver notícias desses, disponibilizarei por aqui.

Chamada de Trabalhos - "Linguagem, Sociedade e Tecnologia"


A equipe da revista Linguagem e Ensino (RLE - http://www.rle.ucpel.tche.br/index.php/rle), conjuntamente com os organizadores, professores Dr. Júlio Araújo (UFC), Dra. Ana Elisa Ribeiro (CEFET/MG) e Dra. Raquel Recuero (UCPel) convidam autores para submeter trabalhos inéditos para o seu próximo número especial (2014) que terá como tema "Linguagem, Sociedade e Tecnologia". 

O tema abarca aqueles trabalhos que, de alguma forma, focam as relações contemporâneas entre as linguagens, práticas linguístico-discursivas e as tecnologias de informação e comunicação, notadamente as digitais. A introdução e a apropriação dessas tecnologias pela sociedade gerou impactos consideráveis nas relações sociais, na educação, nas formas de interação e nos discursos. Assim, para este número, busca-se fazer um apanhado dos trabalhos de pesquisa que, de alguma forma, trazem essa discussão.


Temáticas relevantes:
- Redes sociais e Linguagem
- Identidade e Representação nas tecnologias digitais
- Gêneros Textuais nas Tecnologias Digitais
- Discurso Mediado pelo Computador

- Educação e Tecnologias Digitais
- Discurso, tecnologia e aspectos multimodais

- Tecnologias digitais e processos editoriais


Calendário:
Submissão de artigos - Até 20/06/2014.
Pareceres - Até 20/08/2014
Previsão de Publicação: Dezembro de 2014.

Para este número temático, podem submeter artigos pesquisadores doutores, mestres ou doutrandos.  A Linguagem e Ensino é um periódico científico semestral publicado pelo Programa de Pós Graduação em Letras da Universidade Católica de Pelotas, com Qualis A2.

 

Normas de publicação:

Os trabalhos podem ser escritos em português, espanhol, inglês ou francês. Os trechos citados devem ser traduzidos para a língua em que estiver escrito o trabalho. A extensão do texto deve ficar entre 5.000 e 7.000 palavras, contendo título, palavras-chaves e referências.

O artigo deve conter título, autor, instituição de origem, um resumo em inglês e português (de 100 a 150 palavras cada) e uma lista de três a cinco palavras-chave em inglês e português, independentemente da língua utilizada. Solicita-se que o resumo apresente, de modo conciso, o conteúdo de todo o trabalho, incluindo os resultados e/ou conclusões. Para facilitar a localização em consultas bibliográficas, as palavras-chave devem corresponder a conceitos gerais da área do trabalho.

As tabelas e quadros devem ser identificados e numerados com algarismos arábicos, seguidos do título. As ilustrações (fotos, desenhos, gráficos) devem ser consideradas ‘Figuras’ e igualmente numeradas em sequência. Todas as tabelas e ilustrações devem estar incluídas no texto, não podendo ultrapassar as dimensões da página impressa (10 x 17 cm) na orientação "retrato".

Artigos que utilizem símbolos fonéticos devem ser salvos incorporando fontes “true type”. As referências devem seguir o formato da ABNT, com os nomes completos dos autores ou organizadores das obras, bem como os de seus tradutores, se for o caso.  Para outros detalhes, utilize esse template (Clique para fazer o download.)

Diretrizes de Anonimato

Todos os artigos enviados serão analisados pelo sistema Peer-review, ou seja, por pareceristas e, portanto, deverão ser enviados anonimizados. Assim, solicita-se que as informações de autoria (nome do autor, instituição de origem, email, telefone e endereço) sejam enviadas em uma folha de rosto, juntamente com o título. As citações e referências bibliográficas aos autores devem ser substituídas por "AUTOR (ano)".

Os autores receberão os pareceres juntamente com a decisão editorial.

ATENÇÃO:

As submissões devem ser feitas pelo email: rleespecial@gmail.com