Instrumento para comprensión de idiomas raros
- DARPA
- 26 ene 2016
- 4 Min. de lectura
La comprensión de los idiomas locales es esencial para el conocimiento de la situación en operaciones militares y, en particular, en las de asistencia y socorro humanitarios que requieren coordinación inmediata y cercana con las comunidades locales. Con más de 7.000 lenguas habladas en el mundo, el Ejército de Estados Unidos suele encontrarse con idiomas donde los traductores son escasos y no se dispone de capacidad de traducción automática. Precisamente para cambiar esta situación, se ha concebido el programa Low Resource Languages for Emergent Incidents (LORELEI), para proporcionar información esencial en tiempo real en cualquier idioma y apoyar misiones de asistencia humanitaria o de socorro. "La diversidad global de los idiomas hace que sea prácticamente imposible asegurar que seremos capaces de comprender la situación sobre el terreno cuando entramos en una situación nueva", dijo Boyan Onyshkevych, director del programa de DARPA. "A través de LORELEI, pretendemos un sistema que pueda recoger rápidamente información, elementos clave como nombres, acontecimientos, sentimientos y noticias de origen público o de los medios de comunicación social, en cualquier idioma, basado en un sistema de comprensión de otros idiomas. El objetivo es proporcionar la conciencia situacional inmediata y continua que ayude a los decisores a evaluar y responder, tan inteligentemente como sea posible, a las situaciones dinámicas y difíciles ". El sistema convencional de desarrollo de la tecnología automática, que requiere años de esfuerzo y decenas de millones de dólares para traducir manualmente, transcribir y anotar las palabras y frases individuales para cada lenguaje automatizado, es adecuado para las lenguas en uso generalizado o en alta demanda. No es lo suficientemente flexible para satisfacer las necesidades, en constante cambio, de nuevos idiomas ni lo suficientemente especializado para los desafíos específicos de comunicación de los que participan en todas las respuestas emergentes. LORELEI busca avanzar drásticamente en la lingüística computacional y en las tecnologías del lenguaje humano para identificar los elementos que las diferentes lenguas tienen en común, y utilizar ese conocimiento para permitir un desarrollo rápido y de bajo coste de las capacidades lingüísticas automatizadas. El programa aplicaría estas capacidades a través de una interfaz fácil de usar que asimilará, integrará y analizará datos de incidentes en tiempo real en el idioma local. El sistema previsto proporcionaría material útil, relacionado con la respuesta, 24 horas después de que ocurra un incidente y capacidades de lenguaje totalmente automatizadas en cuestión de días o semanas después. Mientras que las tecnologías LORELEI podrían incluir el reconocimiento de voz, parcial o totalmente automatizado y / o la traducción automática, el programa no busca como objetivo principal la traducción integral de idiomas raros al Inglés. En cambio, proporcionaría el conocimiento de la situación mediante la identificación y correlación de elementos de información en la lengua origen y fuentes inglesas. Sería aplicable a cualquier incidente en el que surja una repentina necesidad de asimilación de la información por las entidades del gobierno de Estados Unidos, en una región del mundo donde se hablen idiomas de poco uso. "Nuestro objetivo con LORELEI no es la traducción basada en librerías, sino proporcionar la comprensión idiomática de la lengua como un todo y, en concreto, el vocabulario de respuesta en situaciones de desastres para mejorar la cooperación y la velocidad de respuesta a las situaciones peligrosas en todo el mundo", dijo Onyshkevych. La fase 1 del programa se adjudicó recientemente a diez universidades y dos organismos con los que se planea explorar tres áreas técnicas principales: • Algorithm Research and Development Environment: LORELEI tiene como objetivo la investigación y desarrollo de la tecnología del lenguaje humano, que reduciría la actual dependencia de enormes volúmenes traducidos, transcritos y anotados manualmente. En cambio, aprovechará lo que las lenguas relacionadas y no relacionadas tienen en común, así como una amplia gama de recursos específicos del idioma. El programa también busca desarrollar el LORELEI Technology Development Environment (LTDE), que sintetizará datos de lenguaje y los integraría con los servicios Web, que proporcionarán el reconocimiento de la entidad, localizarán temas y otras capacidades de la tecnología del lenguaje. • Run-time Framework Development: El programa tiene como objetivo desarrollar una herramienta prototipo, el LORELEI Run-Time Framework (LTRF), que pueda reunir datos en inglés de fuentes abiertas y enviar esta recopilación a través los servicios en Internet de la LTDE. Los resultados procesados regresarán al Framework, donde numerosas herramientas de análisis los pueden agregar, resumir y organizar. El LRTF no produciría informes o documentos de conciencia situacional de forma automática, sino que presentaría a los usuarios resúmenes, visualizaciones y otros productos útiles que ayudarían en gran medida en la creación de este tipo de documentos fáciles de entender. El Marco sería capaz de generar resultados iniciales 24 horas después de un incidente y proporcionar resultados progresivamente más detalladas a intervalos de una semana y un mes. • Linguistic Resource Creation:El plan de LORELEI es recoger, crear y anotar recursos lingüísticos en varios idiomas para apoyar el trabajo en las dos primeras áreas técnicas mencionadas anteriormente. Estos recursos incluyen los del lenguaje estándar (diccionarios, etc.), temas específicos (terminología de alivio de desastres, etc.) y otras investigaciones que permitan el desarrollo y evaluación de datos.

Comments