lunes, 23 de enero de 2017

El arca de la ciencia

Los científicos estamos ahogándonos en un diluvio universal de datos.

Acumulamos ingentes cantidades de información, pero es dudoso que esa estrategia conduzca a ganar conocimiento.

Los científicos, que no se chupan el dedo, son conscientes de la coyuntura. Y buscan modos de simplificar y lograr ver algo entre la densa cortina de agua para impedir una terrorífica colisión en cadena.

Existen diversos intentos en marcha dirigidos a encontrar orden en el caos.

Un ejemplo es NeuroSynth, que ya comentamos en este blog. Los BigData se están aplicando para obtener patrones que iluminen el camino por el que creemos transitar. El grupo de investigación que está detrás de NeuroSynth sigue trabajando en esa misma línea, pero si los datos son de calidad cuestionable pueden encontrarse con una BigShit.

Hay más aproximaciones en las que se combinan datos genéticos, cerebrales y conductuales. El Brain Genomics Superstruct Project es un ejemplo. ENIGMA (Enhancing Neuro Imaging Genetics Thorugh Meta Analysis) es otro.

Aplicar la fuerza bruta puede estrangular el bebé, en lugar de conseguir que suelte un inocente eructo, deje de llorar y se quede plácidamente dormido en su cunita.

Hace unas semanas hicimos aquí una reseña sobre esta inundación de datos que podríamos haber titulado ‘Here Comes The Flood’. Resulta verdaderamente sobrecogedor tomar conciencia del acúmulo de datos cuya cantidad es descomunal y cuya calidad está por comprobar.

A mi juicio, y seguro que no estoy solo en esta valoración, necesitamos pensar sosegadamente sobre cuál es el siguiente paso que deseamos dar. Pero, por desgracia, la dinámica en la que estamos metidos dificulta aplicar la estrategia de mirar tranquilamente cuáles son nuestras posesiones antes de optar por la siguiente inversión.

Ya estamos bastante ocupados gestionando nuestros niveles de productividad, preparando compulsivamente grant applications, cuestionando el índice h, revisando researcher IDs y ORCIDs, preocupándonos por la (falta de) reproducibilidad de nuestros estudios, o usando (después de comprar, naturalmente) sistemas informatizados de detección de ‘plagios’, como para, encima, reservar un tiempo para pensar.

Está claro que necesitamos que el divino creador –es una metáfora, no se inquieten—promueva un cataclismo de descomunales proporciones para vernos obligados a elegir, a separar el polvo de la paja.


Los científicos del mundo conocido deberíamos recibir un mensaje de correo electrónico, remitido por Yahveh, en el que se nos conminase a elegir los datos que salvaríamos de la catástrofe, la evidencia que seleccionaríamos para ser admitida en un arca (de Noé) de la ciencia. Teniendo en cuenta, eso sí, que el espacio es limitadísimo.

O, ahora que está de moda, un benefactor –por ejemplo Amancio Ortega, por qué no—podría financiar la reunión de un puñado de científicos de referencia en sus respectivos campos, en algún lugar de la Mancha –de cuyo nombre todos querríamos acordarnos—para elegir entre los datos candidatos a ingresar en ese arca.

Seguidamente aislaríamos a nuestros mejores cerebros dentro de ese lugar mítico del Antiguo Testamento para que pusiesen orden en la evidencia empírica salvada del diluvio universal.

Finalmente, regresarían a una Tierra renovada en la que no quedaría nada del pasado (delete *.*). Solo podrían usar los modelos que hubieran derivado de los datos seleccionados, de esas perlas que no veíamos porque estaba ocultas dentro de gruesos caparazones.

¿A que suena absurdo?

De hecho, es delirante, pero pienso, seriamente, que es una bonita ilusión.

Y de ilusión también se vive.

¿No creen?

-->

2 comentarios:

  1. Sugerentes reflexiones, Roberto. Racón tienes. En lingüística ya hace tiempo que se sabe que el exceso de información es ruido.

    ResponderEliminar
  2. Así es, Félix. Pero separar la señal del ruido es complicado.

    ResponderEliminar