martes, 13 de noviembre de 2012

Redes Neuronales - Extra

Tema: Locating protein-coding regions in human DNA sequences by a multiple sensor-neural network approach

Por: Edward C. Uberbacher & Richard J. Mural
University of Tennessee-Oak
Introducción
Muchos de los análisis que se hacen en la medicina necesitan cientos de regiones contables por tan solo un pequeño porcentaje de alguna proteína gen, etc. Para la identificación dentro de una muestra de ADN no caracterizada es decir no conocida, es una tarea difícil y es hoy en día donde se centran muchos esfuerzos de la investigación.

En esta investigación se describe un método de calculo fiable para la localización de codificación de la proteína de genes en la secuencia de un ADN no conocido.
Este concepto combina un conjunto de algoritmos de sensores y una red neuronal para localizar las regiones codificantes.

Este módulo muestra un método con aplicabilidad general a los problemas de reconocimiento de patrones de secuencia y está disponible para los esfuerzos de investigación actuales.

Aplicando la Red Neuronal en la medicina 

Los principales esfuerzos de cumputacionales en la medicina, esta dirigido hacia la identificación y localización de los genes de enfermedades humanas. Por lo cual se necesita acelerar el proceso de la gran cantidad de datos de secuencias que se generan por cada ADN analizado y para que una cura sea aprobada se necesita procesar muchas pruebas de ADN.

Algo que menciona el pdf es sobre que es fácil y existen muchos algoritmos que son predictoras de las regiones de ADN, pero no son suficientemente robustos para ser útiles para la búsqueda de genes en datos anónimos en una secuencia de ADN de eucariotas superiores. 

¿Cómo se hace?

-Reconocimiento de patrones en una secuencia de datos en el ADN como un problema análogo del medio ambiente.
-Múltiples algoritmos. 
- Se produce un entorno de acuerdo a sensores, como cámaras, lacer, etc
-Integración optima de las salidas desde los sensores.
-Aprendizaje de la maquina
-Para integrar las salidas del sensor y para predecir la ubicación de los las regiones de codificación.

Después de un procedimiento de entrenamiento adecuado, la neural red aprende a interpretar las salidas de los sensores y, cuando se le proporcionan los datos del sensor de una secuencia de prueba, puede tomar decisiones precisas sobre la ubicación de la codificación del ADN.

Los diversos tipos de información de entrada están integrados, de una manera no sesgada, por algoritmos de aprendizaje de máquina (es decir, la red neuronal de entrenamiento).



Representación esquematica de la red neuronal
En ese diagrama podemos ver que cada posición de prueba en una secuencia ADN los algoritmos de sensores que son siete son en texto. Son evaluados en base 99 y las salidas de los sensores proporciona a la red neuronal para la evaluación. La salida de la red neuronal representa la salida integrado de la CRM y refleja la probabilidad de que la posición debe estar en una codificación.

Caracteristicas

Una red neuronal de propagación hacia atrás se construyo para integrar la salida de los algoritmos de sensores siete. esta red consiste 7 nodos de entrada, dos capas ocultas de 14 y 5 nodos, y un nodo de salida. De entrada a la red neuronal para entrenamiento y equipos de prueba consiste en un vector que contiene el valores de los algoritmos de sensores siete  calculado para las posiciones a intervalos de 10 bases a lo largo de las secuencias.

Entrenamiento

Para el entrenamiento la red también está provista de la valor de salida correcto (1 para la codificación, 0 para no codificante) para cada uno posición. Durante el aprendizaje de la red compara su estimación del potencial de codificación en la posición actual con la adecuada salida de valor para la posición actual y utiliza esta información para reajustar sus pesos de parámetros internos. Esta evaluación continua del error de salida permite que la red optimizar su rendimiento.
El papel de la red neural en esta solicitud es claramente diferente de aplicaciones en las redes han sido entrenado para examinar los datos de secuencia directa.



Conclusión

Segun el pdf esta red neuronal tiene una fiabilidad de un 95% . Presumiblemente, las Secuencias con alto potencial de des codificación also Tendra Una Alta probabilidad de servicios Únicos (no repetitivas) Secuencias, what HACE aires Candidatos párrafo Sitios etiquetados de la Secuencia. En su forma actual, el CRM representación Una Poderosa Herramienta Que debería Ayudar en gran Medida de los esfuerzos Experimentales localizar importantes Humanos genes.

1 comentario: