Cómo averiguamos qué tweets son creíbles

Los investigadores del Instituto de Tecnología de Georgia han desarrollado un nuevo modelo de lenguaje que muestra qué palabras y frases influyen positiva o negativamente en la credibilidad de los eventos mundiales informados en Twitter.

El estudio, que escaneó 66 millones de tweets sobre casi 1.400 eventos del mundo real, sugiere que las palabras de millones de personas en las redes sociales pueden ofrecer información considerable sobre la credibilidad de un evento, incluso cuando un evento aún está en curso.

“Se han realizado muchos estudios sobre la credibilidad de las redes sociales en los últimos años, pero se sabe muy poco sobre qué tipos de palabras o frases crean percepciones de credibilidad durante eventos que se desarrollan rápidamente”, dijo Tanushree Mitra, doctora en tecnología de Georgia. candidato que dirigió la investigación.

El equipo estudió tweets sobre eventos mundiales en 2014 y 2015, incluida la aparición del ébola en África occidental, el ataque de Charlie Hebdo en París y la muerte de Eric Garner en la ciudad de Nueva York.

Los investigadores pidieron a las personas que juzgaran las publicaciones en función de su credibilidad (de "ciertamente exacto" a "ciertamente inexacto"). Luego, el equipo introdujo las palabras en un modelo que las dividió en 15 categorías lingüísticas diferentes. Las clasificaciones incluyeron emociones positivas y negativas, coberturas y refuerzos y ansiedad.

La computadora de Georgia Tech luego examinó las palabras para juzgar si los tweets eran creíbles o no. Coincidió con las opiniones de los humanos alrededor del 68 por ciento de las veces, un porcentaje significativamente más alto que la línea de base aleatoria del 25 por ciento.

"Los tuits con palabras de refuerzo, como 'innegable', y términos de emoción positiva, como 'ansioso' y 'fantástico', se consideraron altamente creíbles", dijo Mitra. “Las palabras que indicaban un sentimiento positivo pero que se burlaban de la impracticabilidad del evento, como 'ja', 'sonríe' o 'bromea', se consideraron menos creíbles. También lo eran las palabras de cobertura, incluidos 'cierto nivel' y 'sospechosos' ".

Un mayor número de retuits se asoció con puntuaciones de credibilidad más bajas.Se creía que las respuestas y los retweets con mensajes de mayor longitud eran más creíbles.

“Podría ser que los mensajes de mayor longitud proporcionen más información o razonamiento, por lo que se consideran más confiables”, dijo. "Por otro lado, un mayor número de retuits, que obtuvo una puntuación más baja en credibilidad, podría representar un intento de obtener un razonamiento colectivo en tiempos de crisis o incertidumbre".

Aunque el modelo aún no se puede implementar, los investigadores dicen que eventualmente pueden desarrollar una aplicación que pueda calcular la confiabilidad percibida de un evento a medida que se desarrolla en las redes sociales.

"Cuando se combina con otras señales, como temas de eventos o información estructural, nuestro resultado lingüístico podría ser un componente importante de un sistema automatizado", dijo el Dr. Eric Gilbert, asesor de Mitra y profesor asistente en la Escuela de Computación Interactiva de Georgia Tech.

“Twitter es parte del problema de la difusión de noticias falsas en línea. Pero también puede ser parte de la solución ".

Fuente: Instituto de Tecnología de Georgia

!-- GDPR -->