Dubsmash: Retrato de uma Trend


Acompanhando monitoramentos variados, incluindo os protestos e o Game of Thrones, marcamos uma tendência muito interessante dos comentários sobre o Dubsmash, aplicativo de dublagem que ganhou muita atenção na mídia social brasileira nos últimos dias. É um caso bastante interessante de movimento mais orgânico, sem robôs atuando de forma forte e que tem, por isso, uma rede bastante peculiar. Para quem não conhece ainda, o Dubsmash é um aplicativo de dublagem, que permite que você faça um vídeo curtíssimo dublando alguma coisa. A imagem a seguir mostra a frequencia do uso do termo no Twitter via Topsy, nos últimos dias. Vejam que há um pequeno aumento no início de abril, mas que dispara mesmo a partir do 08/04.(Clique nas imagens para ver em tamanho maior.)

topsydubsmash.jpg

Vejam, a seguir o mapa do Twitter (cuidem que as pessoas postam no instagram e repassam no Twitter e Facebook) de mais de 80 mil tweets dos últimos três dias com a palavra-chave "dubsmash". Os dados foram coletados entre o dia 12 e o dia 14 de abril. Vejam que interessante é o fato de que a rede não tem centros e tampouco, audiência. No meio do grafo há poucos nós (ou seja, não há muita centralidade). Isso significa que tem muita gente falando, muita gente postando, mas pouca gente sendo citada pelo post. É uma trend muito ampla e muito orgânica (todo mundo experimenta e comenta, mas onde apenas alguns vídeos estão realmente chamando a atenção). O mapa mostra o tamanho dos nós por indegree (número de conexões recebidas).

dubsmash.png
Observando os principais conceitos envolvidos nesses tweets, notamos também os principais conceitos relacionados ao app. Observem a força do humor com os conceitos relacionados a risada, "legal, "engraçado" e etc. Ao mesmo tempo, entretanto, vemos também o discurso da "vergonha alheia" das pessoas que não curtiram os zilhares de vídeos de dublagem aparecendo na sua timeline. Atenção também para os nós mais citados, o @youtube e a @dilmarousself. É interessante observar, também, as associações fortes entre "Gostei" e "youtube", "aplicativo" "legal""parar" e "hora", "novela" "pior""dublagem" e "mexicana".  

dubsmashconteudo2.png
Esses elementos mostram um pouquinho da força do trend, que aparece subitamente, domina a rede e depois pode ou não desparecer tão rápido quanto chegou. O mais interessante é que em meio a todos os assuntos do final de semana, como o vazamento dos episódios de Game of Thrones e os protestos, o termo "Dubsmash" ganhou de levada nos monitoramentos, com mais de 100 mil tweets no período, contra cerca de 30 mil dos protestos e 60 mil de GOT.


Acidente Aéreo: Circulação de Notícias e Protagonismo dos Veículos


O papel dos veículos jornalísticos na circulação de notícias já foi debatido com propriedade por vários estudiosos, inclusive nos trabalhos da Gabriela Zago, uma das coordenadoras do MIDIARS. Hoje o mundo ficou bastante chocado com o acidente aéreo do A320 da companhia Germanwings, que caiu nos Alpes. Por coincidência, conseguimos capturar tweets sobre o acontecimento desde o início e pudemos observar algumas coisas sobre o processo de construção e circulação da notícia no Twitter.

As primeiras notícias, por exemplo, parecem ter circulado a partir de veículos especializados, ou seja, de contas que representam aplicativos de monitoramento aéreo, como o @flightradar24, possivelmente um dos primeiros a dar a informação de que o vôo tinha desaparecido dos radares e o @airlivenet. Este primeiro mapa mostra tweets referentes à primeira meia hora após o desaparecimento do avião. Observem a centralidade dos nós que representam essas contas. Acima, em amarelo, já aparece a conta da @germanwings, ainda pequena e a esquerda, em roda, a @BBCNews. Esse primeiro mapa representa 13325 tweets de 10544 contas diferentes. O termo de busca foi #4U9525, o identificador do vôo que até então estava desaparecido. Os maiores nós são aqueles que receberam maior número de citações. As vizinhanças estão demarcada por cores e mostram a repercussão de cada nó. Ok, talvez o bias desta busca seja o número do vôo, que só realmente os sites especializados teriam acesso. Então buscamos também por "germanwings", a cia aérea, no próximo mapa.

flightcluster.png

O segundo mapa representa os tweets 45 minutos após o desaparecimento. O termo de busca foi "germanwings", para que não pegássemos apenas os sites especializados, mas também os veículos informativos. Já são 39808 contas e 50814 tweets. É interessante que mesmo nesse cluster, onde há bem mais participantes, os principais nós continuam sendo os veículos especializados, como o @flightradar24, a @germanwings e a @bbcbreaking. A esqueda, em rosa, o @airlivenet também mantém o foco de atenção, bem como o @planefinder. Aqui aparecem alguns veículos jornalísticos, como a @cnnbrk, a @reuters e, alguns franceses em menor escala (@lefigaro). É interessante notar, entretanto, que o protagonismo nas "breaking news" é dos sites especializados, mais do que dos veículos neste momento. Novamente, o tamanho dos nós é relativo ao número de citações, e as cores, à sua audiência (grupo).

germanwingsclusters.png
Neste terceiro mapa temos os mesmos dados anteriores, mas agora focamos em betweenness. É de se esperar que os veículos jornalísticos tivessem um papel mais central, sendo citados por diferentes grupos. Mas, novamente, vemos os sites especializados como as principais fontes, com maior centralidade (no caso, com maior número de menções entre os diferentes grupos). Isso mostra que, neste momento, as notícias que mais circulavam vieram deles e não de veículos jornalísticos.

germanwingsclusterbetweeness.png
O último mapa vem a seguir. Este é  posterior, já feito hoje a tardinha. São 39241 nós e 46473 tweets. Agora a coisa muda de figura. Como o acontecimento em si já é de conhecimento geral, os sites especializados perdem espaço, pois o foco está mais no desenvolvimento da história do que, efetivamente, no "breaking news". Já se encontraram os destroços, já se sabe que haver sobreviventes é improvável. O foco, então, parece voltar-se para os veículos jornalísticos, que poderiam apresentar conteúdo de aprofundamento na história, reportagens, entrevistas e opiniões. Observem que a centralidade é mais esparsa no grafo e vários veículos (como @bbcbreaking, @el_pais, @cnnee, @abc_es, @bbcworld entre outros) tomam a frente (mas o @flightradar24 continua aparecendo no canto superior). Evidentemente, a @germanwings é o nó com maior centralidade. (Aqui, novamente, a centralidade betweenness dos veículos).

germanwingstardeclusterbetweenness.png
É interessante observar, nesta rápida olhada, que parece que os veículos jornalísticos, mais uma vez, perdem o protagonismo nas chamadas "breaking news" (furo) para veículos especializados. Entretanto, quando a notícia já está circulando, eles a alimentam com novas informações sobre o acontecimento e seus desdobramentos. O seu papel, assim, parece estar mais no aprofundamento do que, efetivamente, no furo do acontecimento. A relação com a própria mediação entre fonte e público também é complexa, uma vez que o público tem acesso direto à fonte (o que explica a conta da @germanwings ter tanta importância) e não necessita dos mediadores aqui. Mas aparentemente, o papel dos veículos fica mais forte na cobertura quando esta começa a se desenrolar. 

#15demarço


O tamanho dos protestos ontem no Brasil me surpreendeu, pois havia muito pouca mobilização nos canais de mídia social (especialmente em comparação com junho de 2013). Entretanto, esses protestos foram narrados também nessas ferramentas, embora de modo mais discreto e menos "ao vivo" que a experiência anterior. Mapeamos várias hashtags e palavras-chaves. Os mapas que vou mostrar a seguir referem-se à palavra-chave "Dilma", exclusivamente coletada no dia 15, no período do meio da manhã e início da tarde (portanto, antes da maioria dos protestos realmente começarem a pegar fogo). O mapa refere-se a um grupo de 76393 tweets. 

dilmatudopq.png
A primeira imagem é o retrato da rede de tweets,retweets e citações. Ao centro, dois núcleos (um verde e um vermelho) de nós que repercutiram mais narrativas sobre os protestos. Neste caso específico, vemos uma centralização da narrativa (o que é bastante diferente de Junho, quando havia uma narrativa mais plural). Uma hipótese parcial levantada por outros pesquisadores é que neste evento tivemos uma participação de população com uma faixa etária mais velha (portanto, menos familiarizada com mensagens publicadas em tempo real), o que é bastante possível. A seguir, vemos os núcleos informativos principais por indegree (ou seja, os nós que mais receberam retweets e menções na rede - acima de 100).Observa-se uma concentração de citações nos veículos jornalísticos (que narravam os protestos) e críticos do governo.

nucleodilma100pq.png
E neste próximo mapa, vemos os nós com maior outdegree, ou seja, aqueles que mais citaram outros nós. Vê-se de modo mais claro o centro do grafo, com os núcleos verde e vermelho mais articulados entre si. Importante salientar que ambos os núcleos tinham posições favoráveis aos eventos e contrárias ao governo. O grafo mostra apenas nós com mais de 50 tweets sobre os eventos, citando Dilma e outros nós. Os nomes dos usuários foram suprimidos por questões éticas, principalmente porque os vemos aqui como articuladores e não como elementos que estão apenas narrando os eventos.
nucleooutdegreepa.png
Finalmente, o que essa rede dizia? Para tentar entender esses elementos, mapeamos as co-ocorrências de conceitos (deixei propositalmente mais abertos os conceitos, com tempos verbais e conjugações preservadas) e seus módulos (grupos). A seguir, vemos um mapa dos principais conceitos relacionados à palavra-chave "Dilma" com mais de 200 ocorrências nos quase 100 mil tweets analisados. Os dados estão normalizados. Há, em azul, um núcleo confuso, onde há mensagens contra Dilma prioritariamente, embora outras pautas também apareçam. A presença da hashtags #MenosOdioMaisDemocracia, originalmente contra os protestos, parece ter sido apropriada pelo movimento. Também é importante ver o núcleo amarelo, abaixo, onde se concentra uma narrativa jornalistica mais forte. Outras associações fortes aparecem em outras cores. 


coocorrencias120normdilma1503.png
Acho particularmente interessante a ausência de discursos contrários neste momento, ou seja, um silenciamento de posições em favor do governo (que apareceram em seguida, a tarde), com uma concentração de posições anti-governo. Associações como "fora Dilma", "impeachment Dilma", "intervenção militar" e "protestos governo" são particularmente fortes. No núcleo amarelo, associações como "manifestações e Rio de Janeiro" indicam a narrativa do protesto que aconteceu no RJ pela manhã. 

A Guerrilha Informacional da Crise


Seguindo na linha do post do Malini no Facebook, alguns dados sobre a palavra-chave Dilma no Twitter. É evidente que temos uma guerrilha informacional entre oposição e apoiadores do governo, com a oposição ganhando em visibilidade e mobilização. O mapa a seguir refere-se a 30 mil tweets que citam Dilma entre ontem e hoje. São 11663 usuários únicos, ou seja, uma média de quase 3 tweets por usuário. 

Entre os nós mais citados, ou seja, com maior indegree, vários jornais e opositores do governo  (como o @lobaoeletrico), além da própria presidente e do @danilogentili. Entre os nós mais ativos em tuitar com a palavra chave e as hashtags, contas de oposição (@br45ilnocorrupt, por exemplo) e contas-bots (A maior parte dos dados refere-se à noite, quando a saliência das redes de bot aparece com mais força no Twitter aqui no Brasil. É importante lembrar tb que boa parte dos bots atua coletando hashtags que estão subindo e passa a tuitá-las sem parar.).

Hashtags mais citadas: #VaiaDilma, #NãoQueroMorarnoBrasilPq, #TheNoite, #Dilma, #VempraRua15deMarço, #dia15foradilma, #impeachment, #foradilma, #foraPT.

As coisas ficam um pouco mais visíveis quando observamos o mapa dos atores por grupos de clusters (grupos que tendem a citar-se mais entre si nos dados). Vejam a seguir os grupos principais com as principais hashtags como legenda dentro de cada grupo. Há uma articulação maior da oposição ao governo, que se conecta a vários outros clusters, e uma articulação menor dos apoiadores, que estão reduzidos a um cluster embaixo (vejam pelas hashtags). Esse mapa é muito semelhante a todos os que venho observando desde o início de março. Diariamente parece acontecer uma guerra informacional entre governo e oposição, com a oposição conseguindo maior visibilidade. (Clique na imagem para ver em tamanho maior.)

dilma1003legenda.png



#CharlieHebdo


Difusão de informações em torno da hashtag, poucas horas após o ataque (>30 mil tweets). Vários veículos franceses entre os nós com maior indegree. Destaque para a mensagem que mais se difunde, o cartum de David Pope (nó maior, ao centro). 

pope.png
E o tweet mais retuitado desse conjunto de dados.
pope2.png

Artigos novos: #ProtestosBR e Debates Presidenciais


Mais dois artigos saindo do forno e que foram publicados nos anais de dois eventos. 

O primeiro, chamado "#ProtestosBR: Análise Comparativa do Discurso  dos Veículos Jornalísticos" focado nos discursos dos veículos jornalísticos sobre os #protestosBR faz uma análise comparativa dessa atuação através de elementos de análise de redes sociais e análise de contingência. O resumo:

Neste trabalho, discutimos as temáticas e o discurso reconstruído por seis veículos jornalísticos no Twitter, sobre os protestos de junho de 2013 no Brasil. Focando os veículos com maior número de retweets (@Estadao, @JornalOGlogo, @UOLNoticias, @Folha_com, @PortalR7 e @cartacapital), através de uma análise de contingência de cerca de 3 mil tweets únicos, discutimos a presença de um viés crítico com relação aos eventos, notadamente focando a tarifa como principal demanda e a violência contra os jornalistas como principal foco. Outros elementos encontrados focam eventos pontuais, a associação das manifestações com conceitos diversos, o foco no Rio e em São Paulo e o uso de hashtags.

O segundo, chamado "Métricas de Centralidade e Conversações em Redes Sociais na Internet: Desvelando Estratégias nos Debates Presidenciais de 2014" é  focado nos debates presidenciais e sua discussão na internet, traz uma análise de dois debates do primeiro turno e das estratégias dos candidatos no Twitter, através, principalmente de análise de redes sociais. O resumo:

O presente trabalho busca explorar os debates presidenciais de 2014 no Twitter, através das métricas de Análise de Redes Sociais. Buscamos analisar e discutir como os candidatos apareceram nas conversações estabelecidas pelos atores utilizando as hashtags oficiais em dois debates presidenciais. Utilizamos, para esta discussão, as métricas de centralidade eigenvector, betweeness e grau. 

Ambos estão tb na sessão de "artigos" nas publicações do blog.

A Questão do Ódio nos Sites de Rede Social


flamewar.jpgTalvez muitos não saibam, mas uma das pesquisas que desenvolvemos atualmente com maior interesse no MIDIARS (Grupo de pesquisa em mídia, discurso e análise de redes sociais) refere-se, exatamente, à questão do espalhamento da violência simbólica e do discurso do ódio nos sites de rede social. Essa questão está muito evidente com as eleições, especialmente pela intolerância generalizada nessas ferramentas. A questão central nisso é... por que isso acontece? Por que somos tao mais agressivos nos sites de rede social?

O problema do contexto e das audiências

Primeiramente, é preciso pensar sobre a questão do contexto. Em nosso dia a dia cotidiano, há normas de contexto que governam as nossas interações (para os Foucaultianos de plantão, poderíamos pensar em termos de "ordem" do discurso). Isso significa que há coisas que podem ser ditas em determinados contextos, mas não em outros. Assim, piadas sexistas que você provavelmente conte para os seus amigos no bar não serão contadas no ambiente de trabalho. Questões religiosas serão evitadas quando você está visitando seus parentes que são ultra religiosos. Nossa tendência, assim, é conversar sobre o que nos une, evitando os assuntos que possam gerar conflito (em geral, ok?), porque se gasta muita energia emocional nesse tipo de evento (discussão). O problema dos sites de rede social é que esses contextos normativos, as ordenações discursivas, não são evidentes. Não existem fronteiras claras entre as diferentes redes sociais que ali se encontram. Assim, sua rede de amigos está misturada com sua rede do trabalho, com sua rede de parentes e etc. Além disso, há uma grande audiência invisível, que você não percebe diretamente (amigos de amigos, por exemplo). Com isso, boa parte do contexto do que se fala é perdido. Pessoas que não conhecem você (ou que conhecem pouco) terão acesso ao que você publicou como piada e poderão se sentir ofendidas. Não há controle de interação (não se vê os efeitos da fala, apenas depois que ela já está presente na rede) e as correções são impossíveis ou muito difíceis. 

Isso significa que basicamente, é muito dificil "falar" para diferentes audiências, com diferentes contextos e ordens discursivas sem ofender ninguém. Especialmente em questões mais polêmicas. E, uma vez ofendidas, as pessoas são agressivas, o que inflama ainda mais as questões. Na irritação, imagina-se um receptor genérico, desconhecido que, na prática, pode ser um grande amigo. A opinião polêmica é colocada visando a concordância, o apoio da rede e não a flame (discussão). Mas a flame é uma decorrência dessa opinião e das audiências invisíveis (que é um conceito maravilhoso desenvolvido pela danah boyd aqui). E a flame também gera radicalização das posições e não debate. Aí não se discutem idéias, mas se agride o falante, o sujeito que diz. 

O problema do preconceito

Por causa dos elementos que falei acima, vemos que discursos presentes na sociedade começam a se tornar mais visíveis. Isso significa que não é a internet que faz com que as pessoas falem mal dos nordestinos, como recentemente observamos após os resultados do primeiro turno das eleições. Este discurso já está presente na sociedade brasileira. Não são as pessoas que decidem ser racistas ou homofóbicas por conta da internet. Esses discursos já estão na sociedade, eles apenas são "abafados". Você não faz aquela piada racista para pessoas que vão te julgar por isso. Ou seja, a internet parece ter um papel desvelador de discursos que estão presentes, preconceitos constituídos e elementos de violência simbólica. E esse desvelamento, embora ele discuta a naturalização dessas idéias (por exemplo, o sujeito que diz "não sou preconceituoso, mas..."), ela também coloca o sujeito no holofote.

A questão é que, uma vez mais visível, esse discurso de ódio pode encontrar ressonância. E uma vez que encontre, ele é legitimado por outros grupos, seja através de concordância, apoio, curtidas, compartilhamentos etc. E essa legitimação amplia a força desse discurso, tornando-os menos marginal. Então, aquele discurso torna-se mais aceito e seu enunciador, mais certo de que aquilo é "verdadeiro". Esse mecanismo funciona tanto para discursos que consideramos legais (por exemplo, apoio a causas e discussão de questões de gênero, etc.) quanto para discursos que consideramos intolerantes. 

Vejam, por exemplo, o mapa a seguir, que tem cerca de 36 mil tweets coletados logo após as eleições contendo a palavra "nordestinos" (que está dentro do conceito "Nordeste"). As conexões representam a frequência do conceito em relação aos demais conceitos e o tamanho do nó (palavra) o número de vezes que apareceu no dataset. Observem os traços presentes associados à "Nordeste" (burros, pobres, bolsa familia, mal, voto, culpa e etc.)

nordeste1.png


Assim, consideramos que é essencial estudar esses mecanismos para compreender como esses discursos aparecem e, fundamentalmente, oferecer subsídios para o desenvolvimento de políticas de educação para esses discursos de ódio. Mais do que isso, também é necessário compreender os mecanismos da intolerância e da radicalização ocasionados pela hiperconexão dos sites de rede social e pelos mecanismos de informação hoje. 



#DebateCNBB - Alguns dados


Ontem coletei dados do Twitter sobre o debate promovido pela CNBB e a TV Aparecida. A hashtag de coleta foi #DebateAparecida. Este mapa foi de uma coleta as 23:53, quase no encerramento do debate. Fiz várias coletas, mas só vou colocar aqui os dados da última coleta, os finais do debate. Foram 20 mil tweets totais, dos quais, 6066 nós e 12835 conexões únicas. Ele mostra citações e retweets e centrei a análise nos candidatos. Utilizei o NodeXL para a coleta e análise. É importante ressaltar que devido ao grande número de tweets, esses dados são provavelmente referentes aos tweets dos momentos finais do debate e não do debate como um todo.

Indegree (mais citados entre os 20)
@jornaloglobo - 618
@blogdosakamoto - 576
@lucianagenro - 537
@aecioneves - 536
@diimabr - 481
@eduardojorge43 - 316
@dilmabr - 311
@aecioblog - 228
@silva_marina - 129
@levyfidelix - 126

É interessante observar que é a primeira vez entre os dados dos debates que eu coletei (tenho coletado todos) em que Luciana Genro e o Eduardo Jorge aparecem com tantas citações. 

Betweenness (candidatos mais "pontes"- citados por grupos diferentes)
@blogdosakamoto
@diimabr
@jornaloglobo
@aecioneves
@lucianagenro
@dilmabr
@aecioblog
@eduardojorge43

Esses dados mostram que os candidatos que mais apareceram nos momentos finais foram Aécio, Luciana, Dilma e Eduardo Jorge. Marina aparece menos, bem como os demais candidatos (nesses dados).

O mapa a seguir mostra o papo nesse tempo final separado por clusters (grupos) por contas que tendem a ser citadas juntas (Clauset-Newman-Moore). É interessante observar os clusters por embates nesse final: De um lado, com o maior cluster de citações, Luciana Genro (PSOL) e Aécio Neves (PSDB). Em outro grupo, Eymael (PSDC) e Marina Silva (PSB). Em um grupo menor, abaixo, Dilma Rousseff (PT) e Levy Fidélix (PRTB). Separados, Eduardo Jorge (PV) com um grande cluster em verde e Pastor Everaldo (PSC) em verde claro. (Clique na imagem para ver em tamanho maior)

debatecnbb23532.png

Palavras mais citadas por cluster: 
G1 (azul, luciana e aécio ao centro): luciana genro, sujo, mal lavado, corrupção, Aécio, Dilma, aeroporto.
G2 (azul claro, com marina e eymael ao centro):luciana, debate, dilma, aécio, eduardo jorge, eymael, pergunta, tempo, aborto.
G3 (verde escuro, acima) viradadoaecio, aécio, dilma, luciana, marina, brasil, petrobras, pt.
G4 (verde claro, c/ eduardo jorge ao centro): eduardojorge, aborto, lei, machista, jornaloglobo, aécio, luciana, dilma, proibição, criminoso.
G5 (vermelho, no canto): reduzir, luciana, aécio, eduardo, pastor, chobatada, dízimo, excomunhão, aeroporto.
G6 (laranja, ao centro): diimabr, aécio, never, aeroporto, psdb, corrupção, cristã, católica, bilhões.
G7(amarelo, com dilma e levy ao centro): dilma, greenpeace, levyfidelix, luciana, aécio, debate, hidrelétrica, brasil, jornaoglobo.
G8 (verde claro, everaldo ao centro): dilma, marina, aécio, brasil, quatro, acorda, luciana, everaldo, jornaloglobo.

Tem outros dados dos debates anteriores de análises que fiz no blog do MIDIARS, grupo de pesquisa do qual participo.