Análise de Redes Sociais: #Plutoflyby e Capital Social


Há alguns dias atrás a New Horizons passou por Plutão, enviando à Terra algumas das primeiras imagens com boa resolução do planeta anão. A nave está há dez anos na missão. O evento, histórico, repercutiu bastante na Internet e entre alguns outros trabalhos, fiz alguns mapas para observar a repercussão, através da hashtag #plutoflyby. Neste post, discuto alguns detalhes interessantes que podemos observar através da análise de redes. Coletei os dados com o auxílio de alguns scripts e do NodeXL na quarta-feira (dia 15/07) e por isso, os dados referem-se aos dias anteriores (13, 14 e 15/07). Coletei 27.536 tweets com a hashtag, de 19.442 contas únicas. Os mapas a seguir foram construídos no Gephi (que funciona melhor com arquivos grandes).

O mapa geral vemos a seguir. Ele mostra todos os usuários que retuitaram ou citaram outro usuário representado pelas conexões. Cada bolinha (nó) representa uma conta no Twitter que tuitou usando a hashtag #plutoflyby. Cada conexão indica uma menção ou retuíte entre duas contas. As cores indicam vizinhança (modularidade), ou seja, nós que estão mais próximos seja porque se retuitam entre si ou porque retuitam a mesma conta. O tamanho dos nós, neste mapa, indica indegree (grau de entrada), ou seja, o número de conexões (menções e retuítes) que um determinado nó recebeu. (Clique nas imagens para ver em tamanho maior.)

plutoflybyindegree10.png

Credibilidade (ou capital social)  é mais importante que o número de seguidores. Embora isso seja uma releitura do famoso artigo do "1 million follower falacy", é um dado interessante. No primeiro close do mapa, abaixo, vemos os nós com maior número de seguidores (o tamanho do nó representa o número de seguidores). Vejam como os nós com maior número de seguidores são @barackobama, @kimkardashian, @google, @nytimes, @facebook e etc.

plutoflybyzoomcentro2.png
Agora comparemos o mapa acima com o mapa dos nós com maior número de citações a seguir (maior número de menções e retuítes). O mapa é bastante diferente, com um centro forte nas contas oficiais da @nasa e da @nasanewhorizons.

plutoflybyindegree10centro.png

Uma das maiores contas é a do @barabckobama (conta da assessoria do presidente dos EUA - a pessoal é a @POTUS). Obama tem 61,9 milhões de seguidores. Entretanto, observem, há pouquíssimos tweets que referenciam o seu tweet sobre a New Horizons. Isso significa que, embora seu tweet tenha dado visibilidade para o evento, as pessoas prefereriram retuitar a conta da @nasa (na bola roxa). Mesma coisa a conta da @kimkardashian, do @facebook e outros. Vejam que as pessoas preferiram retuitar veículos jornalísticos (@bbcbreaking, @natgeo, @bbcworld - cada um deles forma uma pequena árvore de retweets em torno de si) e a fonte oficial (@nasa e contas afins) do que aqueles usuários com maior número de seguidores. Isso é um importante indicativo do impacto que o capital social tem na circulação de informações na ferramenta. Os mapas, assim, dão um indício de que mais importante do que o número de seguidores é quem dá a informação e como as pessoas negociam capital social no processo de circulação de informações na mídia social.

Scholar Metrics de Revistas da Comunicação


Agora em junho, o Google Scholar divulgou as métricas de citações medidas pela ferramenta de 2015. Basicamente, é possível procurar ali o número de citações medidas pelo Scholar para qualquer revista. 

Como funcionam as métricas? O h-index é uma das métricas mais usadas para medir impacto de publicações no mundo (embora ainda usemos pouco nas nossas áreas de Humanas e Sociais no Brasil). A métrica indica o número "h", que é o maior número em que, pelo menos, um número "h" de artigos foi citado um número "h" de vezes cada um. Ou seja, se uma revista tem cinco artigos citados 10, 8, 5, 4 e 2 vezes, o h-index vai ser 4 (pelo menos quatro artigos citados quatro vezes).

Os artigos mais citados de uma revista constituem seu h-core (que o Scholar não mapeia para a maior parte das publicações). A h-median (mediana) é a mediana de publicações dos artigos mais citados. Além disso, o Scholar só contabiliza as citações dos artigos publicados nos últimos 5 anos (h-index 5). 

O Scholar como mecanismo já foi objeto de análise por vários pesquisadores. Alguns mostraram uma correlação positiva com outras métricas de impacto,  outros discutiram seus pontos fracos, salientando a relevância especialmente p/ as ciências humanas, que carecem de mais referenciais bibliométricos, outros ainda falaram da facilidade de manipulação dos resultados por conta, principalmente, da falta de controle das fontes . Entretanto, eu ainda acho particularmente útil porque 1) é livre e gratuito (ao contrário de mecanismos como o Web of Science e o Scopus); 2) não adiciona apenas citações de veículos cadastrados, mas tem um espectro maior de abrangência; 3) parece que tem menos erros de autoria (eu tenho problemas sérios com citações no Scopus, por exemplo, que não pega vários artigos que eu tenho publicados em periódicos cadastrados e me confunde com outros "Recueros" e eu preciso deletar manualmente essas citações), 4) tem muito mais espectro de coleta em publicações de humanas e sociais (inclusive em outras línguas que não inglês) do que as ferramentas anteriores e 5) a mim parece uma ferramenta interessante particularmente para avaliar as citações de revistas (mais do que de pesquisadores), mostrando quais periódicos têm impacto na área.

Tendo isso em vista, fiz um cruzamento rápido (e não exaustivo) entre periódicos das áreas de Comunicação. Basicamente acessei o Webqualis, peguei as revistas brasileiras ou em Português do extrato 1 (A1, A2, B1 e B2) e fiz uma busca no Scholar para medir o impacto delas. O resultado é a tabela a seguir. Para fins comparativos, coloquei algumas revistas A1 (também apenas nacionais e em PT), uma vez que a Comunicação, como subárea, não tem revistas com qualis A1. Além disso, várias revistas não aparecem porque: 1) Algumas eu realmente não achei no Scholar; 2) Algumas têm nomes que são iguais a outras revistas e eu não consegui separar o h-index de cada uma.  (Atenção: A lista não é exaustiva! Não pequei todas as revistas.)

revistascomunicacao2.png

Evidentemente, o h-index das publicações nacionais não é comparável com aquele de publicações internacionais. Apenas para fins comparativos, o h-index da First Monday, uma revista open, dedicada à área de sociais e humanas, que tem tido grande impacto na chamada Ciência Social Computacional, área que atuo, é avaliada pelo nosso Qualis como B3. Entretanto, seu h-index é 31, com uma mediana de 65. Possivelmente uma das revistas de maior impacto, comparável ao ICWSM (International Conference on Weblogs and Social Media), um dos eventos de maior impacto na área, que tem um h-index de 55 e uma mediana de 105 e o Journal of Computer Mediated Communication, h-index de 32 uma mediana de 53. Além disso, podemos ver que revistas que não estão online e que têm apenas publicação impressa são muito pouco ou nada citadas (ou seja, a dificuldade de acesso online pode ser um fator importante para reduzir o índice de impacto). 

É claro que as publicações em Português tendem a ser menos citadas simplesmente porque a parcela da população de pesquisadores que a lê é muito menor do que em inglês. Mas mesmo assim, acredito que também tem impacto nessas métricas o fato de que, na área da Comunicação, as pessoas citam pouco seus conterrâneos no Brasil. Parece-me que sempre se procura citar autores estrangeiros mais do que artigos publicados em periódicos da área por aqui, mesmo que o trabalho em PT tenha igual ou maior relevância para o que se está discutindo. Já me deparei várias vezes com situações de review onde o autor não cita NADA do que já foi publicado no País, mesmo com várias dezenas de publicações relevantes anteriores. É uma questão cultural, mas tem um impacto muito grande no modo como fazemos ciência por aqui e, evidentemente, no índice de impacto de nossas revistas.

Sobre Avatares Coloridos, Facebook e Difusão de Informação


fotocolorida.pngEstava há algum tempo para escrever sobre isso, mas não tinha tido, ainda, tempo. Desde sexta-feira (26), quem logou no Facebook deve ter visto uma avalanche de cores nos avatares das pessoas. A ferramenta, denominada "Celebrate Pride", foi disponibilizada pelo próprio Facebook naquele dia, para celebrar as paradas LGBT que acontecem no final do Junho no País. Ao mesmo tempo, no mesmo dia, a Suprema Corte americana, numa decisão histórica por lá, decidiu que casais gays tinham o direito de se casar em qualquer estado da União. A união das duas coisas gerou um fenômeno que foi bastante explorado pela mídia nos últimos dias, onde milhares de pessoas mudaram suas fotos por avatares coloridos em celebração ou apoio (não apenas no Facebook, mas principalmente por lá).

Diante disso, muita gente comentou que há uma falsa percepção de apoio por conta dos filtros do Facebook (ou seja, "parece" que todo mundo está colorido porque sua rede está colorida), que isso não importava porque o filtro da ferramenta não permitia que outras pessoas vissem as fotos "coloridas" ou mesmo, que apenas 26 milhões de pessoas tinham mudado a foto, o que era nada diante do mais de 1 bilhão de usuários do Facebook. Acabei comentando algumas coisas sobre a importância desse "ativismo de sofá", que vou explorar um pouco melhor aqui.

O Impacto maior da Foto de Perfil
O primeiro ponto que acho que é importante é que pouca gente falou no impacto que a foto de perfil tem no processo de difusão de informações no Facebook. Isso porque a foto de perfil é uma informação pública por natureza. Ou seja, independentemente de seus settings de privacidade, sua foto de perfil é a informação mais pública que se tem. Qualquer pessoa que procurar por outra pessoa no Facebook verá sua foto de perfil. Se você instalar qualquer aplicativo que funciona via Facebook (joguinhos como Candy Crush, ferramentas como Swarm, enfim, qualquer coisa que use o Facebook login) vai mostrar sua foto de perfil para a rede que você tem lá. Qualquer comentário que você faça em outra ferramenta via Facebook login, mostra sua foto de perfil. Se você usar o Facebook chat, outro exemplo, lá estará sua foto para quem falar com você. Além disso, o algoritmo do Facebook privilegia a mudança de foto de perfil, tornando essa informação mais visível para sua rede. Então, a foto de perfil transita de modo diferente na rede. Ela tem muito mais impacto no processo de difusão de informações porque é muito mais visível do que qualquer outra informação que você publique lá (por isso, acho que não dá para comparar com posts, por exemplo). Ela "fura" muito mais os filtros do Facebook, circula mais livremente e atinge sim, uma rede muito mais distante do "ego" (ou seja, do ator central) do que outras informações. 

Isso é importante porque o Facebook tem uma estrutura mais clusterizada do que se imagina. O trabalho de Backstrom et al. (2011), por exemplo, encontrou a distância média entre dois usuários da ferramenta como sendo de 4,74 (4 conexões). Isso significa que, em média, você está separado de qualquer outro usuário do Facebook por até três pessoas. O estudo, que é baseado no popular trabalho do Milgram sobre seis graus de separação, mostrou que o site de rede social aproxima, sim, as pessoas. Na teoria, isso também daria ao Facebook um potencial de circular as informações muito mais rapidamente em sua rede, porque os nós estão mais próximos. Na prática, em geral, essa circulação é "desacelerada" pelos filtros de relevância. A exceção, aqui, seria a informação da foto de perfil, que tem mais visibilidade e transita mais pela ferramenta. Isso explicaria a velocidade da adoção da foto colorida e o fato de atingir 26 milhões em poucos dias. Como as pessoas estão mais próximas e a informação circula mais livremente, ela tem mais impacto na rede. Portanto, mais do que a "impressão" causada pelo algoritmo de concordância do Facebook, você teve a impressão porque sua rede mudou a foto, sim. E sua rede influenciou outras redes (o Malini, do Labic, falou em algo como mais de 320 mil tweets em poucas horas com a hashtag #LoveWins). 

graus.png
Imagem: Graus de separação

Ativismo de Sofá
Embora muita gente tenha criticado o "ativismo de sofá" de apenas mudar sua foto, como falei acima, essa é uma ação muito significativa, pois deu visibilidade sim para o apoio aos direitos LGBT, o que, em tempos de intolerância, é muito importante. Outro ponto relevante é que muitas pessoas famosas, celebridades, políticos, órgãos governamentais e etc. também apoiaram de forma explícita o movimento. Isso tem um impacto muito grande nas demais pessoas, pois mostra um discurso oposto ao que tem sido majoritariamente divulgado em muitos espaços (especialmente no Brasil). Neste caso, de modo específico, a viralização do ativismo tem um impacto relevante, a meu ver, na sociedade, pois houve um apoio "pessoalizado".  E esse apoio pessoalizado, público, parece-me relevante.

26 milhões... é pouco?
Na verdade, todos os números de usuários do Facebook (e de qualquer outra ferramenta) são geralmente baseados em MAU (monthly active users), ou seja, número de usuários ativos no mês (1,5 bilhão). Isso significa que um "usuário ativo" é considerado qualquer pessoa que logou na ferramenta (inclusive usando um aplicativo de terceiro) uma única vez durante o mês. Isso significa que, na verdade, o número de usuários que passa pela ferramenta diariamente não é nem perto do mais de 1 bilhão de usuários. Em fenômenos localizados como este, isso é bastante importante, porque a tendência na mídia social é um menor movimento durante o final de semana (vejam que eu falei que "Celebrate Pride" começou na sexta-feira). O único número de DAU (daily active users/usuários ativos por dia) do Facebook que eu encontrei é este aqui - 800 milhões. De novo, isso significa que em média, até 800 mi de pessoas utilizam o login do Facebook em um dado dia. No final de semana, provavelmente, esse número seja bem menor. Além disso, temos todos os limites de ação que impedem as pessoas de tomar partido de movimentos como esse, tal como "não entrar na modinha", não querer participar de um experimento do Facebook, manifestar apoio na timeline, mas não mudar a foto e etc. Finalmente, tem a questão do fuso horário, que também influencia a difusão de informações. Assim, se um movimento do tipo atinge seu ápice num horário onde a rede está morta em outro lado do mundo, há uma tendência a essa difusão estar reduzida naquela localidade.  Por isso, considero que 26 milhões em apenas 3 dias é, sim, um número considerável. 

Enfim, acredito que este foi um fenômeno bastante relevante de viralização e que salienta a importância da foto de perfil como informação e como informação que circula de modo diferente na rede. Seria muito interessante se o Facebook divulgasse a geolocalização dos números, para que pudéssemos ver se há outras influências (como fuso horário, por exemplo) e o próprio processo de difusão das imagens. De qualquer modo, suspeito que o Facebook Data Science Team deva divulgar alguma coisa sobre esse movimento (uma vez que apenas eles têm esses dados, que são absolutamente fechados p/ outros pesquisadores. Algumas matérias já estão, inclusive, especulando sobre isso.). 

ARS - Campanha de Dia dos Namorados de OBoticário


Polêmica da vez na mídia social é o filme que marca a campanha de Dia dos Namorados de O Boticário. No vídeo, casais hetero e homossexuais se abraçam e se dão presentes. Várias notícias recentes anunciaram que houve denúncia no Conar contra o vídeo e que o mesmo sofreu uma campanha negativa na Internet. Intrigada com isso, fui dar uma olhadinha nos dados do Twitter sobre a marca. Meu objetivo aqui foi observar a rede de conversação em torno de "oboticario" e a rede de assuntos que circundaram a marca nos últimos dias. Os dados mostram 76403 nós (contas no Twitter que citaram a marca) e 122.268 conexões (retweets e menções) entre os atores. É um buzz considerável se observarmos que esses dados dizem respeito ao dia 26/05 até hoje (03/06), ou seja, uma semana.  A minha pergunta foi relativamente simples: Afinal, o que o buzz está trazendo? Há campanha negativa no Twitter?

oboticario.png
(Clique na imagem para ver em tamanho maior.)

Neste primeiro grafo vemos todos os nós da rede. Ao centro, vemos um cluster, que concentra a conversação sobre a marca. Quando olhamos um pouco mais de perto esse cluster, vemos aqueles nós que mais repercutiram seus tweets (indegree>30). O maior indegre do grafo é 11755, ou seja, o nó que mais recebeu citações e conexões chegou neste número. Curiosamente, não se vê muitas pessoas com um alto outdegree, o que caracterizaria uma campanha negativa. O maior outdegree no grafo é 79 (quantidade de conexões feitas por um nó, ou seja tweets que citaram a marca e outro usuário).  Não há grupos de opositores e apoiadores claramente identificados. Há muita conversação e muito buzz em torno do filme, a maioria reproduzindo tweets ou citando outras pessoas.


indegreeoboticario.png
(Clique na imagem para ver em tamanho maior.)

No grafo anterior, vemos o grupo com maior indegree. Isso significa que foram usuários mais citados. Os tweets da maioria dessas @s com maior indegree são bastante positivos ou humorísticos com relação à campanha. De um modo geral, há opositores e críticos, mas não entre a maioria. Quando observamos o grafo do que mais repercutiu, dá para ter uma idéia mais clara do que as pessoas comentaram no período. Quanto maior o nó, maior o grau. Quanto mais forte a conexão (número de vezes em que um nó A e um nó B se citaram), mais grossa ela aparece na figura.
outdegreeoboticario.png
 Entre as contas com maior número de tweets, vemos a da marca (em destaque, em creme). Isso porque a conta é bastante ativa, mas não falou apenas da campanha. Entre os nós ativos, há alguns bots (robôs) que capturam algo que está sendo discutido no canal e passam a tuitar sobre isso o tempo todo.

Mas afinal, o que foi dito sobre a campanha? O grafo a seguir mostra as co-ocorrências normalizadas dos principais conceitos associados às conversações sobre o boticário (dados de pouco mais de 100 mil tweets). O tamanho das palavras indica sua frequência nos dados (ou seja, número de vezes em que a palavra apareceu) e as conexões, as relações entre aquele conceito e outro. Quanto mais forte a conexão, mais grossa ela aparece no grafo. As cores indicam o grupo de palavras que tende a co-ocorrer mais. 

discursosoboticario.png
(Clique para ver a imagem em tamanho maior.)

Ao contrário do que eu esperava (até porque faço esse tipo de análise toda hora), o conceito mais central e mais citado não foi a marca (como geralmente é), mas o conceito "lindo", conectado fortemente ao conceito "amor". Ao centro, vê-se um conjunto de conceitos bastante positivo, que fala também de um "boicote", associado a "empresas" (em uma analise mais proxima, vê-se que são citadas outras empresas que apoiam os direitos LGBT e que o discurso em questão refere-se à discussão sobre o suposto boicote, criticando-o e dizendo que muitas empresas apoiam a causa. Vê-se, do lado direito, em azul escuro e roxo, um grupo de palavras associada à crítica da ação, esses sim, negativos. Em rosa, abaixo, conceitos que estão associados a tweets ironicos sobre a familia tradicional e a compra do produto. Abaixo, tweets também ironicos falando sobre propagandas de cerveja que expõem mulheres peladas que não são objeto da mesma polêmica. Outros discursos também reverberam e podem ser observados na imagem de forma mais detalhada.

Achei interessante que, ao que parece, a campanha recebeu apoio massivo no Twitter e a maioria dos conceitos associados é positivo. Também há grupos críticos, mas não como as matérias que li pareciam apontar em termos de boicote. Outras formas de observar a rede também poderiam ser focadas na grupabilidade e no grau de intermediação, que não fiz aqui, mas que poderiam dar mais detalhes sobre o que acontece. Vale dar uma observada nos próximos dias. Muita gente especifica que a polêmica e a organização está mais estabelecida no Facebook mas, infelizmente, não temos mais como gerar dados de lá desde a ultima mudança de API. Então por enquanto, só Twitter.

****
Pessoal, vi alguns comentários apontando o grafo das palavras como absoluto. Não é. São os dados normalizados, ou seja, os dados são tratados para representar a frequencia e as co-relações no conjunto e em relação uns aos outros. Depois posto aqui o grafo de co-relações absolutas. 


Violência, Política e Sites de Rede Social


Nos últimos dias participei de um evento promovido pela Comissão de Participação Legislativa, na Câmara, sobre ódio e violência nos sites de rede social e acabei dando uma entrevista para a Zero Hora sobre um evento que aconteceu numa mesa com o mesmo tema, aqui no RS, quando um grupo se levantou, em meio a agressões, e acabou com a mesa. Há algumas coisas sobre esses eventos que eu acho importante ressaltar. 

Sobre a Violência nos Sites de Rede Social
Há dois tipos de violência, como o Žižek coloca na sua obra: A subjetiva, que é aquela mais visível, a agressão direta, o atentado terrorista, o homicídio; e a objetiva, que é sistêmica e que diz respeito também à violência do discurso. Uma não existe sem a outra e a violência do discurso é aquela que causa o status quo a partir do qual a violência subjetiva emerge. Gosto muito dessa idéia, porque mostra que a violência é sistêmica e não isolada e que está intrinsecamente sendo construída por todos nos discursos todos os dias. Então, nesse espectro, na nossa pesquisa, interessam-nos mais os discursos que não são evidentemente violentos, mas revestidos de violência simbólica (no sentido de Bourdieu, violência que é naturalizada e que naturaliza). Interessam-nos as formações discursivas que desvelam a violência em um nível mais geral (por exemplo, como o fato de "negro" ser um sujeito ausente na discussão sobre o dia da consciência negra no Twitter, artigo que está no prelo para ser publicado). Assim, esse tipo de violência é geradora de outras formas de violência mais explícitas. Esses discursos sempre existiram na sociedade, mas se tornaram mais visíveis na mídia social, por conta de suas características de "públicos em rede" (da danah boyd): permanência, escalabilidade, audiências invisíveis e etc.

Sobre a Violência, Política e as Eleições 2014
Nosso interesse por essas formas mais explícitas nasceu durante as campanhas eleitorais de 2014. Isso porque as campanhas foram bastante presentes na mídia social. Só que o que aconteceu aqui é outra coisa. As campanhas eleitorais, em geral, no Brasil, nunca foram "limpas", por assim dizer. Sempre houve baixaria, agressões, militância agressiva e etc., particularmente apoiadas pelos candidatos. Os debates refletiam muito isso. A questão é que, em 2014, essa campanha "suja" tradicional apareceu com muita força na internet e, como sabemos, a mídia social tem um forte aspecto de contágio. O comportamento agressivo de alguns candidatos, militância e o próprio "tom" da campanha foi rapidamente espalhado pelas redes sociais, onde as pessoas comuns foram inflamadas e as agressões passam a ocorrer.

Ou seja, a agressão aqui não foi uma coisa típica da mídia social, mas das campanhas. Essas agressões foram pioradas pela guerrilha informacional que foi proposta e por estratégias de "grito", ou seja, onde alguns candidatos contratavam bots e pessoas para fazer uma determinada informação circular (verdadeira ou não) e falar sobre isso sem parar. Essa estratégia gera um volume muito grande de mensagens agressivas, que era criado por um grupo pequeno, mas muito articulado, passando a impressão que TODOS estavam dizendo a mesma coisa (mas na verdade temos apenas um grupo "gritando"). O que temos hoje é que essas articulações continuaram após as eleições. É resultado direto dessa guerrilha informacional que vimos na mídia social. A maioria das pessoas, por exemplo, não passa o dia todo falando agressivamente de candidatos e ex-candidatos. Há outros assuntos, há outras coisas importantes. Mas essas estratégias de guerrilha continuam ativas e dão a impressão que todo mundo está envolvido numa interminável discussão política e acabam, muitas vezes, por inflamar as demais pessoas vez por outra (mas não o tempo todo). O que estou dizendo, assim, é que existem vários fenômenos acontecendo, que não dizem todos respeito às mesmas causas e efeitos

Violência Organizada
O que vimos na mesa sobre ódio na assembléia do RS, por exemplo, é resultado desse efeito das eleições e das novas formas de articulação da guerrilha informacional que toma a política. Há uma intencionalidade na agressão, há uma mobilização para agredir por motivos diversos mas, geralmente, políticos (gerar descrédito, silenciar, etc.). Essa agressão "mobilizada" acontece em outras esferas também, como a do bullying, e é geralmente organizada por um grupo pequeno, que se mobiliza em torno da "causa". O problema desse primeiro fenômeno é a organização em torno da violência. Há uma ação de grupo para agredir, há uma mobilização para "inflamar" outros que vão também se tornar agressores. Não há ruído, há intencionalidade nessa violência.

Apenas para dar exemplo, vejam a seguir o grafo em torno de um discurso agressivo político. São cerca de 30 mil tweets de pouco menos de um mês (a busca não foi feita através hashtag). Vejam como há uma centralização em torno de grupos articulados (coloridos, ao centro) que vão contaminando outros sujeitos, uma vez que a agressão se torna mais visível. (Clique na imagem para ver em tamanho maior.)

exemplo2.png

 
Violência Orgânica
As agressões no cotidiano da maioria das pessoas são resultado de ruídos do canal e emoções afloradas. Essas agressões têm características específicas. Em primeiro lugar, é preciso lembrar que o ator conversa com uma tela, não com outra pessoa. Há milhares de elementos necessários à conversação (características não verbais como tom de voz e expressão facial) que são perdidos. Em segundo lugar, é difícil construir um contexto de fala. Imagine, por exemplo, que você faria uma piadinha sobre um determinado candidato para seus amigos no bar, porque sabe que eles ririam e não levariam a sério e isso seria legal. Quando você faz essa mesma piadinha no Facebook, recebe um levante de comentários agressivos. Isso acontece porque não há como setar um contexto. É dificil perceber quem é a audiência que recebe aquilo que você publica. E particularmente, é difícil entender como essa audiência vai receber a mensagem. E o Facebook, por exemplo, ainda tem outra característica ruim para esses casos: É assíncrono. Ou seja, ao contrário da conversação "offline", onde você percebe que sua mensagem não foi bem recebida e rapidamente corrige isso, no online há uma demora, e as agressões escalam, porque as emoções ficam inflamadas.

Apenas para ilustrar, de novo, no grafo a seguir, vemos um exemplo disso. É o grafo de um discurso agressivo de gênero que estamos trabalhando (não é hashtag). São quase 50 mil tweets de pouco menos de um mês. Vejam como há pouca centralidade e como as falas não se baseiam em citações e retweets. Há uma prevalência do discurso em grupos diferentes. (Clique na imagem para ver em tamanho maior.)

exemplo1.png


Meu objetivo aqui foi colocar um pouco do que temos pensado em termos de violência em site de rede sociais. Esse projeto, que desenvolvemos desde 2008, tem o apoio da FAPERGS e boa parte do que fizemos só foi possível graças aos parcos recursos que conseguimos com alguns editais do CNPq. Em breve, publicaremos alguns resultados no blog do grupo MIDIARS.


Renato Janine Ribeiro no MEC - ESPM Media Lab


Há algumas semanas eu fiz um trabalho com o ESPM Media Lab, sob a batuta do Vinicius Pereira. O objetivo era perceber como a indicação de Renato Janine Ribeiro tinha sido recebida na mídia social e identificar os principais discursos que foram associados e repercutidos com o nome dele. Com autorização deles, vou comentar alguns dos principais resultados a seguir.

Twitter

Analisamos em torno de 4600 tweets a partir das palavras chaves "Renato Ribeiro", "ministro" e "Educação". A partir dos tweets, fizemos uma análise de contingência com os dados normalizados. 

renatoribeirocoocnorm.png
(Clique na imagem para ver em tamanho maior.)



No Twitter, ambiente onde as principais repercussões foram diretamente associadas a conceitos como "educador", "ética", "filósofo", "intelectual" e "professor". Essa presença associa uma tendência a comentar a escolha da presidenta diante das credenciais de Renato Ribeiro. 

Dentre as principais figuras que contribuíram para o espalhamento desses discursos, destacam-se veículos de mídia (@observatorio - o Observatório da Imprensa, por exemplo), veículos do governo cobrindo a indicação (@mec_comunicação e o @blogdoplanalto), bem como o ex-ministro do STF Joaquim Barbosa (@joaquimboficial) que elogiou publicamente a indicação. Este último é um ponto importante na rede justamente por sua postura de oposição ao governo Dilma, pois atinge pessoas que não são tradicionalmente alcançadas pelos veículos de orientação mais à esquerda ou pelos órgãos do governo.

Entretanto, também há discursos contrários. Notadamente são muito reproduzidos a coluna de Reinaldo Azevedo e o vídeo de Felipe Moura, ambos divulgados pela revista Veja. Interessantemente esses dois críticos usam os mesmos elementos qualificadores do ministro para o cargo, mas buscam zombar dessas qualificações apontando desqualificações ("cinismo", "canalha", "esquerdista", "vigarice" e etc.). Esse ponto é importante porque indica que as credenciais de Renato Ribeiro para o cargo são ressaltadas por ambos os discursos. Além disso, também pesa o fato de que as críticas contrárias são pessoalizadas, ou seja, buscam desqualificá-lo apesar destas credenciais.


Facebook
Analisamos cerca de 2000 posts públicos (como vocês sabem o Facebook está cortando esse acesso em alguns dias, mas isso é assunto para outro post). Os dados normalizados revelaram o seguinte: 


rjrfbnorm.png
(Clique na imagem para ver em tamanho maior.)

Nos dados do Facebook repercutem os mesmos discursos. Enquanto o ministro é associado a conceitos bastante semelhantes que o qualificam para o cargo ("professor", "filósofo", "universidade", "intelectual", "mestre", "doutor", "ética" e etc.), também é associado à reprodução exaustiva da coluna de Reinaldo Azevedo e do vídeo de Felipe Moura, como os principais articuladores da crítica. No Facebook também há um forte elemento de crítica associado a uma posição do ministro relacionada ao "kit gay" nas escolas. Esses opositores, notadamente associados a núcleos religiosos e conservadores, reproduziram essa informação indagando o que seria das escolas e das crianças. 

Ou seja...
É importante notar que, de modo geral, o nome de Renato foi muito associado a suas qualificações e à educação, por todos os discursos. Também é importante notar que, organicamente (ou seja, descartada a reprodução de falas de outros), a presença maior é de aprovação do nome.  Mesmo nos discursos críticos, há o reconhecimento das qualificações do ministro. Observamos ainda que a reprodução exaustiva das mesmas críticas pela oposição é relativamente incomum, especialmente com pouco ou nenhum comentário. 

Dubsmash: Retrato de uma Trend


Acompanhando monitoramentos variados, incluindo os protestos e o Game of Thrones, marcamos uma tendência muito interessante dos comentários sobre o Dubsmash, aplicativo de dublagem que ganhou muita atenção na mídia social brasileira nos últimos dias. É um caso bastante interessante de movimento mais orgânico, sem robôs atuando de forma forte e que tem, por isso, uma rede bastante peculiar. Para quem não conhece ainda, o Dubsmash é um aplicativo de dublagem, que permite que você faça um vídeo curtíssimo dublando alguma coisa. A imagem a seguir mostra a frequencia do uso do termo no Twitter via Topsy, nos últimos dias. Vejam que há um pequeno aumento no início de abril, mas que dispara mesmo a partir do 08/04.(Clique nas imagens para ver em tamanho maior.)

topsydubsmash.jpg

Vejam, a seguir o mapa do Twitter (cuidem que as pessoas postam no instagram e repassam no Twitter e Facebook) de mais de 80 mil tweets dos últimos três dias com a palavra-chave "dubsmash". Os dados foram coletados entre o dia 12 e o dia 14 de abril. Vejam que interessante é o fato de que a rede não tem centros e tampouco, audiência. No meio do grafo há poucos nós (ou seja, não há muita centralidade). Isso significa que tem muita gente falando, muita gente postando, mas pouca gente sendo citada pelo post. É uma trend muito ampla e muito orgânica (todo mundo experimenta e comenta, mas onde apenas alguns vídeos estão realmente chamando a atenção). O mapa mostra o tamanho dos nós por indegree (número de conexões recebidas).

dubsmash.png
Observando os principais conceitos envolvidos nesses tweets, notamos também os principais conceitos relacionados ao app. Observem a força do humor com os conceitos relacionados a risada, "legal, "engraçado" e etc. Ao mesmo tempo, entretanto, vemos também o discurso da "vergonha alheia" das pessoas que não curtiram os zilhares de vídeos de dublagem aparecendo na sua timeline. Atenção também para os nós mais citados, o @youtube e a @dilmarousself. É interessante observar, também, as associações fortes entre "Gostei" e "youtube", "aplicativo" "legal""parar" e "hora", "novela" "pior""dublagem" e "mexicana".  

dubsmashconteudo2.png
Esses elementos mostram um pouquinho da força do trend, que aparece subitamente, domina a rede e depois pode ou não desparecer tão rápido quanto chegou. O mais interessante é que em meio a todos os assuntos do final de semana, como o vazamento dos episódios de Game of Thrones e os protestos, o termo "Dubsmash" ganhou de levada nos monitoramentos, com mais de 100 mil tweets no período, contra cerca de 30 mil dos protestos e 60 mil de GOT.


Acidente Aéreo: Circulação de Notícias e Protagonismo dos Veículos


O papel dos veículos jornalísticos na circulação de notícias já foi debatido com propriedade por vários estudiosos, inclusive nos trabalhos da Gabriela Zago, uma das coordenadoras do MIDIARS. Hoje o mundo ficou bastante chocado com o acidente aéreo do A320 da companhia Germanwings, que caiu nos Alpes. Por coincidência, conseguimos capturar tweets sobre o acontecimento desde o início e pudemos observar algumas coisas sobre o processo de construção e circulação da notícia no Twitter.

As primeiras notícias, por exemplo, parecem ter circulado a partir de veículos especializados, ou seja, de contas que representam aplicativos de monitoramento aéreo, como o @flightradar24, possivelmente um dos primeiros a dar a informação de que o vôo tinha desaparecido dos radares e o @airlivenet. Este primeiro mapa mostra tweets referentes à primeira meia hora após o desaparecimento do avião. Observem a centralidade dos nós que representam essas contas. Acima, em amarelo, já aparece a conta da @germanwings, ainda pequena e a esquerda, em roda, a @BBCNews. Esse primeiro mapa representa 13325 tweets de 10544 contas diferentes. O termo de busca foi #4U9525, o identificador do vôo que até então estava desaparecido. Os maiores nós são aqueles que receberam maior número de citações. As vizinhanças estão demarcada por cores e mostram a repercussão de cada nó. Ok, talvez o bias desta busca seja o número do vôo, que só realmente os sites especializados teriam acesso. Então buscamos também por "germanwings", a cia aérea, no próximo mapa.

flightcluster.png

O segundo mapa representa os tweets 45 minutos após o desaparecimento. O termo de busca foi "germanwings", para que não pegássemos apenas os sites especializados, mas também os veículos informativos. Já são 39808 contas e 50814 tweets. É interessante que mesmo nesse cluster, onde há bem mais participantes, os principais nós continuam sendo os veículos especializados, como o @flightradar24, a @germanwings e a @bbcbreaking. A esqueda, em rosa, o @airlivenet também mantém o foco de atenção, bem como o @planefinder. Aqui aparecem alguns veículos jornalísticos, como a @cnnbrk, a @reuters e, alguns franceses em menor escala (@lefigaro). É interessante notar, entretanto, que o protagonismo nas "breaking news" é dos sites especializados, mais do que dos veículos neste momento. Novamente, o tamanho dos nós é relativo ao número de citações, e as cores, à sua audiência (grupo).

germanwingsclusters.png
Neste terceiro mapa temos os mesmos dados anteriores, mas agora focamos em betweenness. É de se esperar que os veículos jornalísticos tivessem um papel mais central, sendo citados por diferentes grupos. Mas, novamente, vemos os sites especializados como as principais fontes, com maior centralidade (no caso, com maior número de menções entre os diferentes grupos). Isso mostra que, neste momento, as notícias que mais circulavam vieram deles e não de veículos jornalísticos.

germanwingsclusterbetweeness.png
O último mapa vem a seguir. Este é  posterior, já feito hoje a tardinha. São 39241 nós e 46473 tweets. Agora a coisa muda de figura. Como o acontecimento em si já é de conhecimento geral, os sites especializados perdem espaço, pois o foco está mais no desenvolvimento da história do que, efetivamente, no "breaking news". Já se encontraram os destroços, já se sabe que haver sobreviventes é improvável. O foco, então, parece voltar-se para os veículos jornalísticos, que poderiam apresentar conteúdo de aprofundamento na história, reportagens, entrevistas e opiniões. Observem que a centralidade é mais esparsa no grafo e vários veículos (como @bbcbreaking, @el_pais, @cnnee, @abc_es, @bbcworld entre outros) tomam a frente (mas o @flightradar24 continua aparecendo no canto superior). Evidentemente, a @germanwings é o nó com maior centralidade. (Aqui, novamente, a centralidade betweenness dos veículos).

germanwingstardeclusterbetweenness.png
É interessante observar, nesta rápida olhada, que parece que os veículos jornalísticos, mais uma vez, perdem o protagonismo nas chamadas "breaking news" (furo) para veículos especializados. Entretanto, quando a notícia já está circulando, eles a alimentam com novas informações sobre o acontecimento e seus desdobramentos. O seu papel, assim, parece estar mais no aprofundamento do que, efetivamente, no furo do acontecimento. A relação com a própria mediação entre fonte e público também é complexa, uma vez que o público tem acesso direto à fonte (o que explica a conta da @germanwings ter tanta importância) e não necessita dos mediadores aqui. Mas aparentemente, o papel dos veículos fica mais forte na cobertura quando esta começa a se desenrolar.