Más confiabilidad para el almacenamiento en moléculas de ADN

  • Noticias y Actualidad

datos seguridad bigdata

Científicos de Singapur y Estados Unidos han estudiado las principales causas de errores de bits en las tecnologías de almacenamiento en ADN que están siendo desarrolladas por los académicos y la industria. Su investigación ha revelado ciertos factores clave que influyen en este problema, y esperan que sirva para reducir la elevada tasa de errores actual en el almacenamiento molecular.

Uno de los problemas inherentes al almacenamiento en ADN es la elevada tasa de errores que se producen en los procesos de lectura de datos, algo que están lastrando la adopción de los distintos enfoques que se han ido desarrollando en los últimos años. Las promesas de esta tecnología son muchas, pero es vital reducir las elevadas tasas de error actuales. Para lograrlo, un equipo de investigadores de la Universidad Nacional de Singapur y la Universidad de Illinois Urbana-Champaign ha realizado una investigación sobre las causas de estos errores.

En el artículo que han publicado en la revista arXiv explican la investigación que han realizado sobre la posibilidad de recuperar con éxito un bit en cualquier sistema de almacenamiento en ADN. Afirman que lograrlo depende en gran medida de la ubicación física de cada bit dentro de la molécula de ADN, lo que revela cómo ciertas partes de las moléculas son más confiables que otras. Afirman que esta diferencia en la confiabilidad conduce a un uso muy ineficiente de los recursos de corrección de errores. Así, las técnicas más utilizadas actualmente, como la corrección de errores desigual, no sirven para reducir las deficiencias de confiabilidad.

Para resolver estos problemas los investigadores proponen dos enfoques diferentes. Uno es de carácter más general y se puede aplicar a todo tipo de datos. Se basa en dividir los datos y las palabras en código ECC en las moléculas de ADN de una forma particular, haciendo que los efectos de los errores se distribuyan de forma más uniforme entre las diferentes palabras en código y las moléculas. Esto elimina de forma efectiva el sesgo del medio de almacenamiento subyacente.

El otro enfoque es más específico de cada aplicación, y se basa en aprovechar el sesgo de confiabilidad subyacente mediante el uso de un mapeo consciente de la aplicación de datos en moléculas de ADN. Así, los datos que requieren una mayor confiabilidad se almacenan en las ubicaciones más confiables, y los datos que no requieren tanta confiabilidad se almacenan en las partes de las moléculas más propensas a errores. Los investigadores dicen que estos enfoques permiten reduje las tasas de error e implementar un modelo que denominan “almacenamiento aproximado en ADN”.