Una Social Network Analysis

Approfittando di queste pigre mattine abbiamo deciso di provare – una volta tanto – a fare qualcosa di utile!. Una Social Network Analysis delle feste! Il grafo dell’immaginario natalizio ci mostra una serie di elementi interessanti ed alcune conferme: tanto per iniziare tutto gira attorno a due cluster principali: Gesù vs Babbo Natale. Da un punto di vista concettuale il regalo dovrebbe apparire in un’area intermedia tra i due contendenti. Succede invece che venga a posizionarsi nel fronte pagano grazie all’aiuto dato a Babbo Natale dalla vecchia fida Befana. Gesù conta ovviamente sul supporto genitoriale e degli abitanti della stalla ma nessuno di questi porta regali (a quanto mi è dato sapere) per cui la battaglia finale risulta un po’ impari.
È interessante notare come i Magi vengano collocati dall’analisi dei cluster nel gruppo pagano, anche se questo è probabilmente dovuto ad un arco di copresenza temporale con la Befana (circostanza sulla quale si potrebbe obiettare). Nel mezzo alcuni elementi che sembrano porsi – per una ragione o per l’altra – al confine tra i due ambiti semantici: l’albero, le candele e la stella cometa. Quest’ultima in particolar modo pur essendo legata ai Magi ed indicando la rotta verso Gesù è elemento imprescindibile di ogni albero di natale che si rispetti.
Insomma, che siate nel versante pagano o in quello religioso, il piano strategico per il natale 2013 è la conquista della stella cometa.sna_natale

International Workshop on Complex Social Network Analysis @ASONAM2012

On Sep. 26th we were in Istanbul for the ASONAM 2012 conference. The Conference was interesting with many good papers and (perhaps  too many) different sessions. Beside attending the conference we had a extra motivation to be there. We were the organizers of the first International Workshop on Complex Social Network Analysis (together with Prof. Przemyslaw Kazienko, Wroclaw University of Technology, Poland). The workshop was a success and we were pretty satisfied with the quality of the papers. One of our goals was to bring together – under the forming notion of complex social networks – a wide range of scholars from many different areas. Judging by the results obtained this year we can be satisfied even if computer scientists are still the majority.

So that’s the plan for the second edition: more Sociologists and Social Scientists. And you really should start working on your paper because ASONAM2013 will be at Niagara Falls!

Grillo, Twitter, i BOT e l’estate

La ricerca di Marco Camisani Calzolari sui follower di Beppe Grillo sta sucistando un gran vespaio [PDF]. Tra le minaccie dei fan di Beppe Grillo, le critiche sul metodo, le richieste di “credenziali accademiche” e il punto di Michele Ficara ci sono tutti gli elementi per un social-media caso estivo. E quindi la domanda è: come farselo mancare?!
Francamente, avendo fatto un po’ di ricerca su Twitter, mi sfugge il senso di tutto questo polverone attorno a quella che – mi pare ovvio – è un’uscita promozionale dei servizi di MCC fatta utilizzando il fenomeno Beppe Grillo e la polarizzazione delle opinioni che comporta, in rete e fuori.

Se vogliamo poi guardare la ricerca (è disponibile il report sintetico) possiamo fare varie considerazioni.
La ricerca è una cosa abbastanza semplice. Un software ha recuperato la lista dei follower di Beppe Grillo, ne ha selezionato un campione “casuale” di 20.000, di questi ha recuperato i tweet e poi ha assegnato una serie di punteggi sulla base di parametri definiti (inevitabilmente in maniera arbitraria) dal gruppo di ricerca che dovrebbero rappresentare degli indicatori dell’umanità o meno dell’account.
La parte metodologica è spiegata con sufficiente chiarezza nel report sintetico per cui francamente non vedo ragione di mettere in discussione i risultati: secondo i criteri identificati il 54% dei follower di Beppe Grillo è un BOT. Questo non significa che quest’informazione abbia senso.

Ci sono infatti alcune cose che possono essere – lecitamente – messe in discussione.

La prima è la significatività generale di questa percentuale. Sono molti o sono pochi? Come faccio a dirlo ? Mi manca – e non mi sembra che nel report ne vengano forniti – un qualunque dato che possa funzionare da “linea di base” e sul quale fare, banalmente, dei confronti. Dal momento che sappiamo che parte dei follower che ogni account ha sono BOT, quant’è una percentuale normale? E qual è la distribuzione di questa percentuale? Cresce al crescere dei follower reali? Tenderei a pensare che la media (anche percentuale) sia un pessimo indicatore per distribuzioni di questo genere, ma sarebbe comunque un punto di partenza.
Per come la vedo io, ogni discussione sulla scelta degli elementi che definiscono la natura di un utente andrebbe inquadrata in quest’ottica.

C’è poi l’annoso problema della verificabilità. Com’è stato testato questo sistema? I risultati che fornisce sono in linea con cosa? Sono in liena con le aspettative teoriche di un modello di distribuzione dei fake-follower in funzione del numero totale dei follower? Sono in linea con una verifica – anche campionaria – fatta manualmente tramite Mechanical Turk? Altro? Insomma per dire che un risultato è interessante o meno dovrei avere almeno un qualche elemento di verificabilità.

Un’ultima nota mi sento di farla per il discorso del campionamento. Non ne capisco bene il motivo. Non tanto perchè non creda nella casualità del campione, ma perché non credo che la distribuzione del campione sia casuale. Al momento non vedo motivi – se non di tempo richiesto – per non effettuare l’analisi sulla totalità dei follower di uno specifico account. Magari mi sbaglio, ma qeusta scelta mi pare più guidata dalla volontà di uscire con qualcosa che da un reale desiderio conoscitivo.

La versione di Henry

L’altro giorno sono stato a Bologna al bell’incontro con Henry Jenkins organizzato dagli amici di Mediamutation. È stata una interessante lecture dove Jenkins ha sistematizzato gli ultimi sviluppi del suo pensiero dopo l’approdo alla USC. Non voglio qui fare un resoconto dettagliato di quanto detto da Jenkins (ne trovate uno ottimo qui) quanto piuttosto fissare quelli che mi sembrano essere i punti chiave che delimitano il discorso che ha fatto usando i tweet che ho scritto durante come aiuto per la mia memoria. Ovviamente sarà un elenco incompleto assolutamente parziale e terribilmente interessato nella selezione dei temi e nell’enfasi data agli stessi. Ma non credo che sia possibile altrimenti.
Read More »

#terremoto – earthquake / part3

This is the third post about the analysis of the Twitter reactions to the earthquake of May 20th in the northern part of Italy. Sadly it won’t be the last one since on Monday night a new and stronger earthquake struck the same area so our dataset will keep growing. I really wish we had no more data but keep working on these data and detecting how users behave during a crisis event might help offering a better coordination of crisis communication in the future.

Today we are focusing on the analysis of the ReTweet networks happened during the two key moments we have identified (04:00 am – 06:00 am and  03:00 pm – 05:00 pm). So far we’ve pointed out that just after every single major seismic event there was a peak in Twitter production due to the desire to share and to communicate about what happened. Moving to a higher level of detail allowed us to point out how this increase is composed by a double phenomenon: first there is a large amount of original Twitter production – mainly made by users willing to share quake’s intensity and location – and just after that there is an large ReTweet activity that spreads the news all over Twitter.

Nevertheless, as we have said before, the two time frames we are analyzing show some differences mainly due to the fact that while the first time frame coincides with the first unexpected shake the second window was when the rescue operations and all the related activities were already taking place. Starting from this point, and following the schema made of informative and propagative phases during crisis communication, we assumed that the analysis of the accounts involved in the ReTweet networks could give us some insights into the propagation process of crisis communication.

Figure 1 : Retweet network between 4.00 and 6:00 am

Figures 1 and 2 show the evolution of the Retweet networks during the two phases. In both cases one the most ReTweeted user is @INGVterremoti, the official Twitter account of the National Institute for Geology and Volcanology, that gives technical information of every seismic event happening in Italy. These Tweets are basically technical messages containing Latitude and Longitude of the epicenter and magnitude of the quake. Beside the INGVterremoti account there are many others users tweeting about the earthquake basically in real time. @RoxyBarTV, the second most retweeted account, is the official account of the DJ and music journalist Red Ronnie that happens to live nearby the areas struck by the earthquake and tweeted about it.

Figure 2 : Retweet network between 5:00 and 5:00 pm


More interesting is Figure 2 that represents the ReTweet chain of the second event when the rescue operations were already operating. The most prominent account is always #INGVterremoti that continued providing information on minors and majors events. What it is ineresting to point out is the absence of public authorities of any kind (no local or central government or other state agencies) and the minor presence of mainstream news (@fattoquotidiano a well known Italian newspaper seems to be an exception).

This absence seems to be specific of the Twitter adoption phase in Italy – In a different context Authorities and Mainstream media played a different role  -  produced an interesting phenomenon: the propagation of information about how to handle the crisis has been propagated by minor users and local Twitter celebrities that used their followers as a propagation resource. As an example @Planethotel_net (the second most retweeted account) is a minor account that tweeted the availability of hotel rooms for those who lost their houses and @frafacchinetti is a famous TV host that tweeted the phone numbers of the Civil protection to be contacted.

What is interesting here is that due to the absence of Official accounts from public authorities the messages found alternative ways of propagation and – within this specific context – any already existing number of followers can be a valuable resources.

#terremoto – earthquake / part2

After the first analysis of what happened on Twitter during the first 24 h after the earthquake that on May 20th struck the northern part of Italy, we can now go a little deeper in our description by focusing on two specific time-frames. According to what we’ve pointed out in the previous article there were two major peaks of Twitter activity corresponding to the two major seismic episodes recorded that day: one was approximately at 4 am while the second was approximately at 3 pm. Since we have described in these two episodes a rather different Twitter activity in terms of ratio between original tweets and reTweets we have decided to observe these two windows of 2 hours each with a higher level of details (Figure 1 and Figure 2).

Figure1: Tweets (blue) and Retweets (red) from 4.00 to 6.00 am - 1 minute scale

Figure2: Tweets (blue) and Retweets (red) from 3.00 to 5.00 pm (1 minute scale)

When Tweet are observed on a 1 minute time scale we can see a rather different scenario. In every case when the earthquake arrived (two events in Figure 1 and 1 event in Figure 2) we have a peak in original tweet production mainly made by people witnessing the earth shaking and twitting about it. Soon after that the propagation process mainly made of retweets takes back its prominence. The lapse of time between the information phase (when original Tweets outnumber the ReTweets) and the propagation phase (when ReTweets outnumber the original Tweets) can be explained by many elements but it seems likely to be related to the number of active users and to the level of novelty of the information.

According to this analysis we can say that – observing the phenomenon on a 1 minute time frame – the sequence information/propagation seems to be confirmed on both moments. Nevertheless it is possible to point out some differences between these two moments according to the content of the tweets and, therefore, to their social function. We are going into that aspects in part 3 that will be published in few days.

#terremoto – earthquake

On the night between May 19th and 20th a magnitude 5,9 earthquake struck the northern part of Italy between the provinces of Modena and Ferrara. As a part of our Social network Italia research project we were already monitoring a set of Twitter hashtags and #terremoto (earthquake) was among those. Then we have been able to analyze the tweets sent about the earthquake starting from the very beginning. Today I’m just presenting some preliminary analysis and I’ll publish more in the next few day as soon as we dig deeper into the data.

Figure1 - tweets, retweets and seismic events

At 4.05 am user @Sonjamjao sent the first tweet ( “Earthquake!!! Fear!”) less than two minutes after the earthquake (official time:  4:03:52 am). The tweet has been obviously sent from a mobile device. In order to understand what kind of communication took place we decided to observe how the dynamics of original tweets production and Retweets articulated during the day (figure 1). In order to have a deeper perspective we visualized on the same graph also the many earthquakes that followed the first shake (orange ball, the radius of the ball is proportional to event’s magnitude). A first analysis shows an interesting phenomena:all the major seismic phenomena produced a peak in Twitter activity.  The day was mainly dominated by two major events one – the original and most distructive – happened at 4.03 am while the second one happened at 3,18 pm. Both are clearly visible as peaks in the twitter activity nevertheless the two events show a substantial difference: while the firs was dominated by production of original tweets witnessing the event the second was dominated by the retweet activity. This difference could be explained with the unexpected nature of the first event compared to the second one. In the middle of the night when the first episode happened the informative function (the will to tell that something happened) was more evident while during the second episode we had a more evident propagative function.

 

Busy busy busy…


After some quite time we can now update the list of the upcoming event and presentations. March will be a busy period with a major conference and two very interesting workshops where we are going to presents the new research lines we’re carrying on this year. Between the 12th and the 18th of March we are going to attend the XXXII Sunbelt conference at Redondo Beach, CA. During the conference we’re presenting some new empirical data about on the Multy-Layer Model for SNS analysis.
As soon as we’ll be back in Europe we will attend the 2nd Düsseldorf Workshop on Interdisciplinary Approaches to Twitter Analysis (#diata12) where we will introduce our new research aimed at understanding how the Twitter network structure evolves according to the social interaction that takes place between the users (we hope to be able to post more about this really soon). The last w

Mapping Twitter: conversazioni vs broadcasting

Nel’ultimo anno il dibattito nazionale su Twitter è stato segnato soprattutto dalla sua diffusione tra i personaggi famosi ed una conseguente maggior diffusione anche all’interno di “nuove” fasce della popolazione. In molti hanno fatto notare come l’arrivo dei vip su Twitter (re)introducesse di fatto una logica di tipo broadcasting fatta di pochi leader e da molti follower. Altri hanno messo in evidenza come la distinzione tra pochi vip e molti utenti comuni producesse bizzarri quanto affascinanti fenomeni come l’uso del RT come moneta reputazionale (“Per favore mi retwitti?”).
In realtà, come spesso accade, all’interno delle piattaforme mediali le pratiche sociali tendono a coesistere. Per questo a fianco delle nuove forme neobroadcasting esistono – e sono vive e vegete – le forme conversazionali che siamo più abituati ad associare al web 2.0. Read More »

#risorgiblog, alzati e cammina

Con grande mestiere e scelta di tempo Giovanni ha rianimato il dibattito sulla morte dei blog proprio in concomitanza con il divano post pranzo nataliazio. Cosa c’è di meglio per il blogger appesantito da troppo panettone che scrivere di blog ricordandoci l’eterna autoreferenzialità della blogosfera?! Ovviamente lo spunto è stato raccolto da più parti (qui, qui, qui, qui e poi vi leggete lo storyfy del hashtagr #risorgiblog se ne volete ancora).
Il tutto poi si conclude (?) oggi quando con un colpo da maestro GBA se ne esce su Apogeo Online con un articolo che parla del futuro guardando al passato.. parla di blog, blogger e social media con alcuni che ne sanno. Chapeau! Read More »