Desarrollan una fórmula universal para desvelar códigos ocultos

Proteínas, textos antiguos y hasta pasos de danza pueden esconder mensajes secretos.


Un equipo de investigadores oriundos de Italia ha desarrollado una forma genérica para interpretar mensajes ocultos en los símbolos. El hecho de tener un método general para extraer la información de cualquier tipo de secuencia de símbolo sería de gran utilidad para descifrar los datos codificados. Esta investigación se dará a conocer a través de la revista Physical Review Letters. Por Guillermo E. Melis


Guillermo Melis
08/10/2010

Cada nudo pertenece a una de las 15 comunidades que están marcadas con diferentes colores y números. La mayoría de las comunidades pueden estar asociadas a un dominio funcional. Foto: Roberta Sinatra, et ál.
Un grupo de científicos de Italia ha perfeccionado un método genérico que permitirá desarrollar patrones diversos para descifrar los mensajes ocultos en los símbolos. Este es el resultado que arrojó un reciente estudio, que se hará público en la revista Physical Review Letters.

El trabajo, llevado a cabo por tres profesionales de la Universidad de Catania y la Escuela Superior Di Catania (Roberta Sinatra, Daniele Condorelli y Vito Latora, presenta una forma genérica capaz de extraer información de cualquier tipo de datos de secuencia de símbolos, aún cuando un “diccionario de secuencias” no las reconoce. “Creo que es interesante el hecho de que se pueda construir un léxico para cada colección no aleatoria de datos simbólicos, simplemente por medio de métodos estadísticos”, sostuvo la investigadora Roberta Sinatra.

Toda la información se puede representar por símbolos. Con el objetivo de extraer esa información incrustada, el grupo de científicos tomó los símbolos y las normas que rigen su formación y secuencia para luego develar y explicar su comportamiento.

Por otro lado, el equipo sostuvo que hay una gran variedad de ejemplos de información que residen en los símbolos. El más conocido de los resultados es, probablemente, el lenguaje escrito.

Por ejemplo, además de las secuencias de letras que forman palabras y las secuencias de palabras que forman oraciones, hay reglas léxicas y gramaticales que rigen la forma en que las letras y las palabras se pueden combinar, respectivamente, de modo que no todas las secuencias de letras y palabras son posibles

Algunos de los muchos modelos donde la información tiene que ser extraída a partir de secuencias de símbolos, es posible encontrarlos en las proteínas, los nucleótidos del ADN, el sistema notación musical, los movimientos de la danza, textos escritos en un idioma desconocido, entre otros ejemplos. Tener un método general para extraer la información en cualquier tipo de secuencia de símbolos sería de gran utilidad para descifrar los datos codificados.

Una red de motivos

El trabajo expone tres conjuntos de datos diferentes: el proteoma humano (el equivalente a la proteína del genoma), los sistemas dinámicos y mensajes de redes sociales como Twitter.

El proteoma celular es la totalidad de proteínas expresadas en una célula particular bajo condiciones de medioambiente y etapa de desarrollo, como lo puede ser la exposición a estimulación hormonal. También el proteoma puede ser conceptualizado como las proteínas de todas las variedades de proteomas celulares. Es, aproximadamente, el equivalente proteínico del genoma.

El sistema dinámico es un sistema complejo que presenta un cambio o evolución de su estado en un tiempo. El comportamiento en dicho estado se puede caracterizar determinando los límites del sistema, los elementos y sus relaciones; de esta forma se puede elaborar modelos que buscan representar la estructura del mismo sistema.

Para la investigadora Sinatra, la información compacta se deriva de un conjunto completo de secuencias, al igual que todas las proteínas de una especie, en un sólo objeto: la red de motivos. “Uno podría estudiar con gran detalle una secuencia, por ejemplo, una proteína o un mensaje y tener un conocimiento completo de la información de los medios de proteínas. Pero esto sería equivalente a la lectura de una sola frase de un libro entero: ¿qué se puede entender desde una sola frase, si un libro se compone de miles de ellos? Esta es la razón por la que se lee el resumen de la contraportada de un libro. Bueno, la red de motivos juega exactamente la misma función: es un resumen de todo el conjunto de secuencias, proporcionando información sobre cuál es el mensaje principal”, informó.

Según los expertos, las secuencias de una red de cadenas importantes son llamadas “motivos”, que son el equivalente a las palabras de un idioma. Cuando se convierte en una red, estos motivos forman los nudos de la red. Por ejemplo, si “el” y “fin” fueron dos nudos, probablemente habría un vínculo dirigido entre ellos para representar la frase común “el final” o “el fín”.

En el ejemplo de la proteoma, las comunidades de la red con motivos pueden identificar las partes de las proteínas (secuencias de aminoácidos) llamadas “dominios funcionales”, que especifican la función de las proteínas. En estos sistemas y otros, el enfoque de red con motivos puede ser muy útil para el procesamiento de información de muy grandes cantidades de datos simbólicos.

Mediante el análisis de la red de motivos, los investigadores lograron identificar patrones significativos y extraer información importante codificada en los datos originales, simplemente desde la estructuración de la red. En particular, la información acerca de las estructuras de la comunidad de la red, es decir, los grupos de nudos que están estrechamente relacionados entre sí y débilmente conectados con el resto de la red, resultaron útiles para la extracción de mensajes codificados.

Códigos ocultos

El avance tecnológico también cumple un papel excepcional en el desarrollo de nuevos métodos capaces de desentrañar códigos, jeroglíficos y hasta lenguas antiguas. Este es el caso de un grupo de investigadores del MIT, en colaboración con la Universidad del Sur de California, que ha logrado descifrar, gracias a un software, gran parte de la antigua lengua semítica ugarítica.

Según publicó esta misma revista, el trabajo del equipo norteamericano no sólo ayudará a los arqueólogos a develar las lenguas más antiguas del mundo, sino que, además, podría ampliar el número de lenguas que los sistemas de traducción automática (como Google Translate|en|) pueden manejar.

Al mismo tiempo, un nuevo estudio, llevado a cabo por el doctor Jay Kennedy de la Universidad de Manchester, publicado el mes pasado por El Universal, reveló un código secreto en la obra La República de Platón.

Según el diario mexicano, el filósofo utilizó un patrón regular de símbolos, heredado de antiguos seguidores de Pitágoras, para dar a sus libros una estructura musical. Estos códigos musicales demuestran cómo Platón se anticipó a la revolución científica dos mil años antes que Isaac Newton.



Guillermo Melis
Artículo leído 22777 veces



Más contenidos