Unos investigadores de la universidad de Michigan en Estados Unidos, en conjunto con unos investigadores de Ámsterdan en los
países bajos, fueron capaces de crear un algoritmo que realmente es capaz de
identificar en forma automática si las noticias en internet presentan un
contenido falso.
Cabe señalar que este algoritmo solo se encarga en identificar si las
noticias son falsas o reales, para posteriormente analizarlas a través de un
proceso de lenguaje natural como por ejemplo el (NLP System), el cual es el que se encarga únicamente de comparar
rápidamente las diferencias lingüísticas.
Estos investigadores han podido establecer algunos aspectos necesarios
que les permitirán separar completamente el contenido real y el falso dentro de
las noticias, entre estos se encuentra el tener disponibles tanto ejemplos
veraces como engañosos para poder realizar las comparaciones rápidamente, si
las noticias realmente se encuentran en formato de texto digital, para recoger previamente contenido que tenga una
verdadera base verificable, como a su vez que los textos a comparar de verdad
mantengan una solida extensión y estructura similares o por lo menos el poder
considerar de cierta manera los factores
lingüísticos y culturales, ya que en algunos casos se pueden modificar el
propio contenido de una publicación.
Una vez que se tengan listos los propios parámetros de identificación, estos irán a parar posiblemente a dos
bases de datos, las cuales fueron diseñadas para registrar aquellas noticias
que sirven para el algoritmo, por ejemplo la primera base de datos es la que va
a contener noticias verdaderas de seis temáticas, las cuales serán de deporte,
de negocios, de entretenimiento, sobre política, de tecnología y sobre
educación, este tipo de noticas serán procedentes de medios de comunicación con
muy buena reputación en todo el sector como CNN, New York Times, entre otros similares, que los propios
investigadores comprobaron de "forma natural", además esta base de
datos también tendrán noticias falsas que procederán de la comunidad de Amazon Mechanical Turk (AMT), los
cuales se encargaron de tomar algunas de las noticias verdaderas y retocarlas,
de tal manera que ellos fueron tergiversando el contendido mediante el cual
fueron a su vez dejando el mismo lenguaje y estructura periódica.
La otra base de datos estará netamente integrada solo con contenido de
la web, principalmente de aquellas cuentas de compañías y personalidades famosas.