Anàlisi dels servidors del Fedivers

Hola!

Volia compartir aquí un anàlisi de dades dels servidors de fedivers que he fet amb l’ajut de l’spla. Potser us sembla interessant i pot fomentar el debat.


Anàlisi dels servidors del Fedivers

Obtenció les dades de usuàries totals i actives dels servidors

L’spla i jo hem estat analitzant una mica dades sobre la població i activitat als servidors del Fedivers. Ell ha obtingut les dades a partir de les APIs dels diferents programaris i jo les he analitzat, generant els gràfics que mostrarem i comentarem en el següent fil. Qualsevol error, comentari o suggerència serà benvinguda!

Les dades en concret que hem fet servir són:

  1. El nombre d’usuaris del servidor.
  2. El nombre d’usuaris actius del servidor.
  3. El programari que fa servir.

Aquí cal fer un comentari important. Mentre que les dades d’usuaris totals i el programari que fan servir són clares i precises, el nombre d’usuaris actius al servidor conté un element de confusió que ha observat l’spla mentre obtenia les dades. En alguns casos hem observat valors majors d’usuaris actius que d’usuaris totals, fet que atribuim a l’inclusió de comptes que han iniciat registre però que han estat eliminats i per tant no es comptabilitzen amb els usuaris totals però sí en els actius. Aquest fet altera la percepció perquè ni ens interessa gaire aquesta activitat ni ens permet calcular un percentatge d’activitat amb sentit (en alguns casos, al dividir actius respecte totals surten percentatges de més del 100%). De moment no hem trobat la manera de filtrar aquesta activitat, així que interpretarem amb cura els valors d’activitat assumint que el problema de l’spam afectarà a tots els servidors de manera homogènia (cosa que no tenim clara).

Distribució de servidors per mida

Primer de tot analitzarem la distribució de les mides dels servidors. Al primer gràfic superior, on es mostra aquesta distribució podem comprovar que la majoria dels servidors són molt petits: la meitat té 4 o 5 usuaris només. Tanmateix, degut a que els pocs que tenen molts usuaris en tenen molts, la major part de les usuàries del Fedivers s’allotgen en servidors de bastant més de 1000 usuaris (la meitat s’allotgen en instàncies que superen els 100.000 comptes).


Figura 1. Gràfic superior) Distribució dels servidors en funció del nombre d’usuàries (eix de les X). El gràfic de caixa representa les mètriques de centralització següents: els extrems de la caixa representen el percentil 25% i 75% i la línia al mig representa la mediana. També es representen alguns outliers. Gràfic inferior) Distribució dels usuàris en funció de la mida del seu servidor en número d’usuaris.

Si enlloc de fer servir el total d’usuàries per servidor fem servir el nombre de usuàries actives, la imatge és semblant. La major part de les usuàries actives s’allotgen en servidors on n’hi ha més de 1000. Aquí cal anar amb cura, però. Sense poder filtrar els registres SPAM, pot ser que els servidors grans estiguin inflats d’usuaris actius. Al ser més visibles, poden ser millors dianes. És una hipòtesi només ja que no sabem quina és la distribució dels registres SPAM entre els servidors.


Figura 2. Gràfic superior) Distribució dels servidors en funció del nombre d’usuàries actives (eix de les X). El gràfic de caixa representa les mètriques de centralització següents: els extrems de la caixa representen el percentil 25% i 75% i la línia al mig representa la mediana. També es representen alguns outliers. Gràfic inferior) Distribució dels usuàris en funció de la mida del seu servidor en número d’usuaris actius.

Correlació de mida amb activitat

El següent gràfic (Figura 3) representa la correlació entre la mida del servidor en nombre d’usuaris (eix de les X) i el percentatge d’usuàries actives (a l’eix de les Y). Tot i el possible biaix dels registres SPAM, el gràfic suggereix que hi ha una correlació negativa entre ambdues variables: els nodes petits tenen un percentatge de comptes actius majors, mentre que els nodes grans tendeixen a tenir-lo més baix.


Figura 3. Gràfic de punts representant la correlació entre la mida del servidor en número de usuàries i el % de usuàries actives per servidor. La línia representa la regressió lineal i el servidor mastodont.cat està marcat en vermell.

És important tenir en compte aquesta distribució a l’hora de valorar el ratio d’usuaris actius respecte del total d’un node ja que la conclusió pot variar en funció de la seva mida. Per exemple, mastodont.cat està a mitja taula en el comput global, però és un dels nodes amb una freqüència de comptes actius més alta de la seva franja!

La possible explicació per a aquesta tendència té a veure amb el fet que moltes de les usuàries que aterren a les instàncies més grans no saben molt bé com funciona la federació i hi arriben per la visibilitat que tenen fora del fedivers. Tanmateix, algunes d’aquestes novelles marxen del fedivers mentre que d’altres migren a instàncies més petites buscant quelcom més específic o una comunitat més local. Tot i així, cal recordar que la majoria d’usuàries actives ho són en nodes grans, així que moltes s’hi queden.

Anàlisi per programari

Finalment, hem volgut analitzar els diferents programaris del fedivers per separat. El programari amb més usuàries és mastodon amb diferència, seguit de diaspora, peertube, pixelfed i pleroma. Tanmateix, quan ho comparem amb l’activitat d’aquests nodes (Figura 4), podem veure que alguns programaris tenen un 0% d’usuaris actius (writefreely, plume, mobilizon, wordpress, simple social network, akkoma), però es trata d’un artefacte perquè l’API no facilita aquesta mètrica. Ho he pogut comprovar gràcies a la taula que ha elaborat l’spla:


Figura 4. Percentatge de usuàries actives en funció de programari utilitzat. La mida del punt és proporcional al nombre total de usuàries.

Aprofundint una mica en la distribució del nombre d’usuaris totals i el % d’actius per servidor i programari (Figura 5) podem observar que alguns programaris tenen distribucions semblants de servidors. Mastodon, pixelfed o pleroma tenen bastants servidors petits i una cua decreixent de servidors més grans. En canvi, destaquen diaspora i en menor mesura lemmy tenint servidors més grans en general. Tanmateix, també destaquen per tenir índex d’activitat menors. Finalment, destaca també la quantitat de servidors unipersonals o amb pocs usuaris del programari writefreely!


Figura 5. Distribució de les usuàries totals (esquerra) i usuàries actives (dreta) per servidor en funció del programari utilitzat.

La Figura 6 mostra la distribució dels programaris en funció del nombre de servidors que el tenen instal·lat i la mitjana d’usuaries per servidor (la mida del punt fa referència al nombre total d’usuàries que fan servir el programari). Una vegada més, mastodon destaca pel nombre de servidors que el tenen instal·lat, seguit de lluny per peertube i pleroma. Tanmateix, com ja hem vist en la distribució anterior diaspora és el programari amb una certa base d’usuàries que té més tendència a trobar-se en servidors grans.


Figura 6. Gràfic de punts que representa el nombre de servidors (eix de les Y) respecte la mediana de usuàries per servidor (eix de les X) per a cada programari. La mida del punt és proporcional al nombre total de usuàries.

I fins aquí el meu anàlisi amb les dades que ha pogut obtenir l’spla. No sé si esteu d’acord amb les meves interpretacions o en trobeu d’altres. El debat serà benvingut!

Salut!

3 Likes