Cómo hacer un backup de tus mensajes en MediaVida

B

(Varias personas lo han preguntado así que voy a responder:)

Sí, mis mensajes pre-2017 son todos iguales: el vídeo del pesao y tres frases random. Concretamente, 6666 mensajes.

LA RAZÓN

En 2016 deseé retirar esta cuenta. Por aquel entonces, todavía no había un botón de BORRAR CUENTA (o me había pasado con los porros, que podría ser). Pensé, también, en una forma de hacer un backup de todos mis mensajes. El caso es que para llevar acabo la tarea decidí picar una herramienta. La llamé MVScribus.

CLASES

Un script en Ruby. Dos clases encapsuladas en una que las controla.

  • MVscribus. Toma los argumentos y crea la base de datos (100% novedad).
  • Crawler. Repasa cada subforo, cada página de cada subforo, cada hilo y cada página de cada hilo en busca de tus mensajes. Se vale de una pequeña base de datos en SQLite para guardarlos en local. Puedes indicarle en qué página del subforo empezar, así que puede recuperar el ritmo si el backup se queda a medias.
  • Writter. Utiliza la base de mensajes guardados por Crawler para visitar cada uno de tus mensajes y editarlos con un mensaje generado aleatoriamente.

USO

Si quieres hacer un backup, tendrás que indicar tu nick y los slugs de los subforos que quieras guardarte:

ruby mvscribus.rb capture [nick] [forum] [start-page]
ruby mvscribus.rb capture Letto off-topic feda

Si quieres limpiar tus posts sin destruir tu usuario:

ruby mvscribus.rb override [nick]
ruby mvscribus.rb override Letto

Y os pedirá la contraseña sin mostrar lo caracteres cuando la metáis.

NOTAS

  • La herramienta está pensada para servirte de forma discreta, no para atacar el foro. Se prevale de un simulador de navegador sin JavaScript (gem 'mechanize') que no carga ni emponzoña las métricas de los publicistas (más allá de los GET y POST, es ciego a trackers), y respeta los tiempos de la web contra DoS. No te flipes; solo hubo un 0z4m4.
  • El programa tiene bastantes dependencias (mvscribus.rb, 8.13). ruby no suele dar problemas por multiplataforma, salvo nokogiri y active_record, que os la pueden liar en GNU/Linux.
  • La herramienta es LENTA. Mi recomendación es que la metáis en un Raspberry y la dejéis corriendo. Creo que a mí me tardó dos semanas, aunque había calculado dos meses.
  • Si no le dices foros, irá a por 'off-topic', 'feda', 'juegos' y 'mediavida'.

ERRORES

  • La web ha cambiado su front-end. Son ligeros retoques pero lo suficiente como para que se rompa. Si quieres usarla, tendrás que arreglar eso. Es cuestión de Nokogiri y más Nokogiri.
  • Si escribes en Windows y lo ejecutas en GNU/Linux, seguramente tendrás que usar el rvm (Ruby Version Manager) para gestionar la intercompatibilidad.

DESCARGA

WeTransfer
Pastebin - MVScribus.rb
Pastebin - alt_message_generator.rb

EPÍLOGO

No soy picateclas (ni siquiera ingeniero). Cuando mires el código podrían arderte los ojos. Cógelo con pinzas y úsalo para lo que sirve.

~ Happy Hacking

4
1 comentario moderado
Kaiserlau

que loco xdxd

salu2

pd: Pense hacer algo parecido en python hace time. Manica.

1
Ninja-Killer

WTF? Muy chido, mis dies. Habrá que probarlo.

Lo de la optimización ya para otro día, pero ahora no es lo importante xD

Una duda: Igual que puedes hacer backup de tus mensajes, puedes hacer los de cualquier usuario? Puede ser interesante para stalkear a otros users 😈

NickNack

y no sería más fácil y dejaría mucha menos huella en los servidores tirar directamente de la lista de hilos de tu perfil?

Ya tienes los hilos listados ahi, para que vas a scrapear todos xD

7 3 respuestas
A

Según la RGDP si pides todos los datos que tengan sobre ti al responsable del fichero de MV te los tiene que dar en un plazo de un mes y eso incluye los mensajes, los likes, firmas, privados, etc.

Más sencillo y completo que eso no va a poder ser

2 respuestas
FUNnn

#6 cuando estás escribiendo anónimamente... No sé si se podrá decir que esos datos son tuyos

2 respuestas
Prava

#6 Es que no tienen datos sobre ti, hasta donde yo sé.

3 respuestas
Mirtor

#5 Creo que sería lo más sensato, igual con eso no tardaba mil años xDDDD

Aunque de implementarlo ni idea, de programar sé lo justo.

1
Ulmo

Patearse cada página, de cada hilo, de cada subforo. La eficiencia hecha script.

Si todos se ponen a hacer eso, petan la web.

1 1 respuesta
B

La mejor ejemplificacion de la expresión matar moscas a cañonazos.

1
Kimura

Por que querría hacer un backup de chascarrillos no muy allá, comentarios de bar y/o/u batiburrillo de comentarios transfomisogiracistas? :man_shrugging:

hda

Uno de los usos de esta herramienta es entrenar a una red neuronal con tus mensajes si es que son suficientes.

Personalmente, no tengo un lugar con más texto mío que mediavida. Si quisiera que una red se expresara como yo lo hago sería de este modo.

Este es un proyecto que le comenté a @beavis hace unos 6 meses.

2 3 respuestas
Ulmo

Sinceramente y aunque se pueda hacer, no se yo si la web está preparada para que ahora 100 usuarios se pongan a hacer llamadas al servidor para descargar millones de páginas de miles de hilos. Supongo que @Beavis sabrá como de robusta es la web, pero no creo que una herramienta de fuerza bruta como esta le haga ningún bien si se empieza a repartir por OT tan alegremente.

PD: Al menos podrías haber usado la opción de filtrado de usuario por hilo.

1 respuesta
hda

Obviamente, la única opción es lo que comenta el compañero de #5

Aunque lo ideal sería una opción propia de la web que permitiese descargar todo.

Un fallo de #1 es que no capturaría el texto bajo spoiler.

1 respuesta
HeXaN

#14 La web se traga lo que le eches.

YokeseS

#13 podre vivir eternamente gracias a mediavida!

A

#8 #7 Los datos que tu generas son tuyos, y no escribes anónimamente sino bajo un pseudónimo. Les afecta de igual forma que a Twitter, Instagram, Google o tu compañía de teléfono.

Tanto es así que hasta en las condiciones de uso hacen mención a ello cuando hablan de que les cedes una licencia a perpetuidad. Si no fueran tuyos no podrías ceder una mierda.

Prava

#13 Ostia tú, qué curioso. Sería muy interesante hacer un experimento. Lástima no tener los conocimientos ni el tiempo porque seguro que es un currazo del copón, pero para los que tenemos cuentas viejas y muchos mensajes podría ser curioso.

B

#5 +1000 xD El que vale, vale. Seguro que ya estaba esa vista implementada por aquel entonces (como lo de borrar cuenta). Además con los emoticonos de las secciones se podría filtrar por subforos. Creo que ni la consideré. Aunque no sé por qué partí de la premisa de que no se podían filtrar los mensajes de un usuario con facilidad (esto sí lo recuerdo); creo que porque la estructura se centra en los hilos, no en los usuarios (realmente no se pueden desasociar posts de usuarios, solo ocultar, porque su indexación ordinal tiene como referencia el hilo, no el usuario -o sea, que dices "hilo tal, mensaje tal, de usuario cual", no "usuario tal, mensaje tal, que va en hilo cual"); esa paja mental la recuerdo...

Este es lento pero te permite leer todo el foro. A malas serviría para copiarse todo. A mí me sirvió para pensar que el RaspberryPi no merecía acabar en WallaPop.

#7 #8 Los mensajes van asociados a una IP. Si además has dicho cosas sobre ti o puesto fotos... Hay algún mod que no lo entiende (que el otro día me instó a denunciar a MV, por cierto xD... ese es el nivel); pero sí que conozco un caso de "si me vas a meter ban, me estás incapacitando para acceder a la información que he depositado, así que me das acceso o me borras del todo"... y que le borrasen del todo. Sabemos que en Internet las cosas duran pero la UE se inclina por el "derecho al olvido".

#10 Nah. Si ya lo pongo arriba. No sirve para romper el foro. Necesitarías una botnet con muchos haciéndolo a la vez, y en ese caso el script no marcaría la diferencia (entre un scrappeo y querys aleatorias). Además tienes ventanas de tiempo; edita un post cada varios minutos.

#15 De hecho es un fallo del script. Muy agudo. (Se me ha olvidado ponerlo en las notas).

El experimento de las NN ya se ha hecho antes, ¿verdad? Yo tenía en mente hacer un chatbot con el mismo principio, aunque ahora mismo ni tiempo, ni conocimiento, ni ganas xD Pero la idea es apasionante. Imagino reinvenciones parlantes de los muertos en los cementerios. #BlackMirror

1 respuesta
HeXaN

La red neuronal ya la hice yo hace unos meses con mi cuenta xD

1 respuesta
R

Vamos a probar cuanto aguanta la web sin caerse?

NickNack

#13 respondiendo a tu pregunta, no, no son suficientes (ni probablemente lo consistentes que necesitan ser, esto ya depende del usuario) para que la red neuronal sea medianamente realista.

Tampoco es muy viable utilizar el conjunto de interacciones entre los usuarios para crear una red neuronal que sea capaz de responder a los mensajes ya que la recursión del propio contexto es muy gorda en los hilos, y si solo usas #1 y sus respuestas directas no tienes suficientes datos, mientras que si atiendes a cada usuario y a sus respuestas el conjunto es muy caótico.

Creo que me he expresado como la mierda, pero es lo que hay que estoy modo siesta después de comer. Lo comento por que ya lo he intentado.

(Pls no ban ty)

B

todos sabemos que eres de los que usa una interfaz gráfica para detectar IPs. No vayas de jaquer.

dranreb

Pa que kiero esto jaja salu2

1
gogogo

#8 mínimo, mínimo, tu correo electrónico asociado a tu nick es un dato sobre ti que tienen obligación de eliminar de sus ficheros.

Tu propio nick y tus mensajes diría que también, pero no estoy seguro.

B

El resultado de una NN de MediaVida podría parecerse a Tay, la IA de Microsoft que se volvió nazi.

Algo que compusiese líneas del estilo:

  • "El capitalismo es un gimnasio de fitness que el fascismo quiere votar para un mercado de repeticiones" —set: Sephirox
  • "BRUTAL Gran Hermano en Mediaset amigos BRUTAL no hay bolsa atrás" —set: Serpentino
fuNN

Para qué quiero saber ésto?

1 respuesta
YokeseS

#28 pues para hacer una IA que controle el mundo. Ignorante

Zerokkk

Si hacemos la NN esa de la que habláis con los posts de @BLACKXILL, yo creo que se crea SkyNet por arte de magia o algo.

3 1 respuesta

Usuarios habituales