Ha caigut el Pleroma

Hola,

El Pleroma ha caigut. Ja va passar l’altre dia, però vaig reiniciar l’nginx i la base de dades i va tornar a arrancar. Fins que no arribi a casa no ho puc aixecar.

@tuttle , hauríem de fer-hi un cop d’ull…

He reiniciat els serveis i torna a estar actiu. Però ho hem de solucionar…

torna a estar caigut!

quins errors dona, què diuen els logs?

1 'M'agrada'

Doncs estic mirant:

Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]: ** (DBConnection.ConnectionError) connection not available and request was dropped from queue after 136ms. This means requests are coming in and your connection pool cannot serve them fast enough. You can address this by:
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:   1. Ensuring your database is available and that you can connect to it
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:   2. Tracking down slow queries and making sure they are running fast enough
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:   3. Increasing the pool_size (albeit it increases resource consumption)
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:   4. Allowing requests to wait longer by increasing :queue_target and :queue_interval
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]: See DBConnection.start_link/2 for more information
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:     (db_connection 2.4.0) lib/db_connection.ex:784: DBConnection.run/3
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:     (stdlib 3.12.1) gen_server.erl:637: :gen_server.try_dispatch/4
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:     (stdlib 3.12.1) gen_server.erl:711: :gen_server.handle_msg/6
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]:     (stdlib 3.12.1) proc_lib.erl:249: :proc_lib.init_p_do_apply/3
Nov 23 22:16:12 pleroma-bcn-social pleroma[10314]: Last message: :poll

@tuttle , podem provar d’actualitzar, però no sé si…

Què tal va de recursos la màquina en general? Se li poden assignar més al postgres?

(I afegeixo)

Els logs del postgres donen alguna informació?
Hi ha algunes maneres de seguir quines són les consultes pesades, a veure que no hi hagi res estrany:

En Tuttle és dins. Punxa la base de dades, sembla. Està mirant el repo i no sé què diu d’un pool-size… Seguirem informant :slight_smile:

Uns minuts després…

Hem canviat la configuració de la base de dades i ara apaguem i reiniciem… Aviam…

Uns minuts després…

Doncs no ha colat… Recomencem i tornem a mirar això del pool-size…

Uns minuts després…

Hem revertit els canvis que s’havien fet i canviat coses de la config de Pleroma però no ens tira el bitxo :_(
(Pausa per fer en paral·lel una instal·lació GNU/Linux en un altre ordi i seguim amb el Pleroma).

Uns minuts després…

Hem toquetejat la configuració de nou però no acaba de anar bé del tot la cosa… Remirem una estona més aviam si ho arreglem del tot però no prometem res.

Uns minuts després…

No acaba de rular del tot, segueix donant errors però ja és una mica tard i pleguem veles.
O sigui, que funciona, però una mica a pedals i ho hem de mirar aviat més a fons.

Agraïm d’avançat la paciència i disculpeu les molèsties. Bona nit! :slight_smile:

2 'M'agrada'

pool size, com piscina. És la quantitat de fils d’execució en paraŀlel que poden haver-hi. Bé, molts ànims i gràcies per la feina!

2 'M'agrada'

Gràcies per la feina, @tuttle i @titi !

Quines configuracions heu provat? Alguna d’aquí?

Nov 24 03:52:02 pleroma-bcn-social pleroma[1606]:   3. Increasing the pool_size (albeit it increases resource consumption)
Nov 24 03:52:02 pleroma-bcn-social pleroma[1606]:   4. Allowing requests to wait longer by increasing :queue_target and :queue_interval

Doncs ara no t’ho sé dir… Després li pregunto a en Tuttle i et dic :slight_smile:

Per cert, miraculosament sembla que es va arreglar i ja no surt l’error en vermell aquell 500 internal server o algo així… Aviam si dura! jeje

1 'M'agrada'

Deu ser que mica en mica s’ha anat “desaturant” la base de dades. Al matí arribaven publicacions de feia varies hores, a mesura que s’anaven processant (suposo).

Ara sembla que ja està al dia, tot i que encara va lent la càrrega de notificacions. Alguna cosa hi tindrà a veure…

Continua fallant el 500 :frowning:

1 'M'agrada'

Ha tornat a caure.

Sóc fora de BCN fins diumenge. @tuttle , hi pots entrar en algun moment?

He provat de conectar-me des del mòbil, però està desactivat l’accés amb contrassenya. Així que no hi puc fer res fins diumenge…

Tranqui, Marcel. Així fem una mica de DeTox, hehe.
Tu disfruta del finde :slight_smile:

He reiniciado el servidor desde el panel de Sacelway, ya que no podía, y todovía, no puedo hacer un login via ssh. Que raro. @marcelcosta cuando puedas a veure si tu pots.

De moment el Pleroma tira.

1 'M'agrada'

Ha vuelto a caer. Maldita sea. Ahora no puedo mirarlo.

1 'M'agrada'

Hola,

He intentat entrar en la màquina per la consola de Scaleway. No em surt. ¿pot se que et surti a tu @marcelcosta ?
Si no podam entrar, no veig opció que no sigui fer una instal·lació nova i recuperar la base de dades.

Com ho fem? Prefereixo no fer-ho sols. Avui es diumenge, pot ser dilluns o dimecres? Mes tard ja no, que soc fora.

:face_exhaling:

ah. he deixat una copia de la ultima copia de seguretat en el núvol de LaLoka.

1 'M'agrada'

Ei! Torno avui a la nit. Ens ho mirem demà a les 19?

Salut!

He pogut entrar sense problemes.

He reiniciat el pleroma, nginx i postgres i ara funciona… més o menys.

Demà, si m’ho confirmes, podem donar-hi un cop d’ull.