14/07/2025 Opinión

El CREAF abre su ciencia para no volver a la caverna

Técnica en Gestión del Conocimiento y Ciencia Abierta

Florencia Florido

Ex traductora de inglés, graduada en Conservación y Restauración de Bienes Arqueológicos por la ESCRBCC, máster en Diagnóstico del Estado de Conservación del Patrimonio Histórico por la UPO y máster

Del 26 de mayo al 4 de junio, el CREAF celebró el curso “Caring for your data: Ensuring quality and protection”, la primera formación interna sobre gestión de datos organizada desde la nueva oficina de Ciencia Abierta y Gestión del Conocimiento . Enmarcado por el programa Watering Talents del centro y financiado por Fundae, este curso de ocho horas se estructuró en tres sesiones de tipo masterclass que concentraban el conocimiento más actual y las tendencias en la gestión de datos en investigación con la integridad y calidad científicas como trasfondo .

Las sesiones, que fueron dirigidas por colaboradores de la Universidad de Barcelona (UB), el Instituto de Análisis Económico del CSIC (IAE-CSIC) y la Barcelona School of Economics (BSE), se adentraban en aspectos filosóficos, legales y prácticos para dar una respuesta holística a cuestiones como: ¿por qué reproducir los resultados científicos? ¿Sabemos tratar un dato sensible? ¿Cómo planificamos la gestión de datos?

Quizás te preguntes por qué hacer una formación tan intensa y qué pinta la caverna de Platón. Hagamos una cata previa:

  • La mayoría de resultados científicos no se pueden reproducir. Nos adentraremos en las causas y consecuencias de este fenómeno.
  • ¿Hay solución ante esta crisis ? Pista: hacer autocrítica.

¡Cogete, que te lo contamos!

La irreproductibilidad de la ciencia

Como nos recordó Oriol Pujol, catedrático del departamento de Matemáticas e Informática de la UB y colaborador del curso, el conocimiento científico se crea sobre conclusiones que se basan en y se pueden comprobar con resultados reproducibles, los cuales son válidos independientemente de quien los informa y los verifica. Desgraciadamente, la mayoría de los investigadores son incapaces de reproducir los resultados científicos publicados por sus colegas y más de la mitad no pueden ni reproducir los propios. Ésta es la conclusión de un estudio publicado en 2016 que hace referencia a un fenómeno que tiene sus raíces a mediados del siglo XX : la crisis de reproducibilidad .

Alimentada por la presión académica para publicar , fallos en el sistema de revisión por pares y el sesgo editorial que filtra los resultados negativos y poco golosos, la acumulación de literatura científica errónea y mutilada nos está llevando a construir una base de conocimiento falso (es decir, a volver a la caverna). Por ejemplo, entre 1996 y 2010 se publicaron varios artículos sobre la navegación de las abejas que se basaban en datos duplicados y manipulados y errores de cálculo . Estos artículos, publicados en revistas como Science, PNAS o PLOS Biology, se citaron más de 1000 veces. María Ángeles Oviedo-García, catedrática del departamento de Administración de Empresas y Marketing de la Universidad de Sevilla es clara : “Otras investigadoras basarán su investigación en esta información falsa, lo que es aterradora”. Todo ello hace tambalear la credibilidad en la ciencia e inflama las narrativas negacionistas.

Meme_perro

En llamas. Fuente: KC Green

Las vigilantes de la ciencia

El prestigio tanto de los llamados popes científicos como los de las revistas donde publican deslumbra y cautiva, pero se les ve el plumero gracias al crecimiento de la revisión postpublicación y la metaciencia forense. En 2023 se tuvieron que retractar más de 10.000 artículos científicos , de los que 8.000 se publicaron por la editorial Wiley. Todos los días, vigilantes como RetractionWatch desvelan casos de datos inventados, cherry-picking, compraventa de autorías, controles de calidad inexistentes, etc. Estas prácticas no son ajenas a investigadores/as de influencia que llegan a ocupar cargos de alta responsabilidad y que publican en revistas como Science o Nature y tienen repercusión en los medios de comunicación. Éste es el caso de una investigadora de ética en investigación que, irónicamente, falsificó datos. Como subrayaba Oriol en su sesión, “Afirmar que algo es cierto basándonos en nuestra experiencia no es suficiente”. Parafraseándolo, podríamos decir que afirmar que algo es cierto porque se ha publicado en una revista de supuesto alto impacto o renombre tampoco es suficiente.

Oriol_Pujol_UB

Afirmar que algo es cierto basándonos en nuestra experiencia no es suficiente.

Oriol Pujol

Evidentemente que no todo es fraude o mala praxis; también existen errores y sesgos inconscientes. Por ejemplo, según un estudio con ecólogos/as, frente a los mismos datos las investigadoras pueden llegar a conclusiones opuestas, lo que se explica por las decisiones subjetivas que toma cada una durante el análisis. Esto no hace más que reforzar el proverbio ruso que dice “Confía, pero verifica”, puesto que las retracciones no resuelven el problema, sobre todo porque menos del 5% de los artículos retractados se señalan como tal .

Reproducir vs. replicar

Cuando hablamos de confirmar los resultados de un estudio científico, debemos distinguir dos conceptos: reproducibilidad y replicabilidad. Por un lado, la reproducibilidad hace referencia a la posibilidad de utilizar los mismos datos y métodos para llegar a igual resultado. Por otra parte, la replicabilidad aparece cuando se llega a un resultado igual o similar (con un margen de diferencia razonable) utilizando datos y método nuevos, datos nuevos y el mismo método que el original o los mismos datos con un método nuevo. Como nos explicó Joan Llull, catedrático de Economía del IAE-CISC y la BSE y colaborador del curso, las revistas verifican la reproducibilidad para que la comunidad científica busque la replicabilidad . Y añade: "El impacto se deriva del hecho de que otros puedan construir en base a lo que nosotros hemos investigado. Por eso debemos facilitar la replicabilidad de los datos con la máxima claridad y detalle posibles".

Joan_Llull

El impacto se deriva del hecho de que otros puedan construir en base a lo que nosotros hemos investigado. Por eso debemos facilitar la replicabilidad de los datos con la máxima claridad y detalle posibles.

Joan Llull

Para contribuir con conocimiento de calidad y de impacto científico y ayudarnos a nosotros mismos, Joan nos enseñó las reglas básicas para crear un paquete de reproducibilidad siguiendo un estándar de disponibilidad de datos y código . Desde compartir datos en bruto (o raw, en inglés) a ofrecer documentación detallada, ¡la regla fundamental es que seamos empáticas! Debemos hacer todo lo posible para que los y las usuarias de nuestro paquete de reproducibilidad entiendan bien lo que hemos hecho.

El espectro de la ciencia abierta

Con el mantra “Tan abierta como sea posible, tan cerrada como sea necesario”, la Ciencia Abierta nos anima a que la investigación sea accesible para reutilizarla en equilibrio con lo que hay que proteger.

Por ejemplo, las coordenadas geográficas o las imágenes de satélite de los hábitats críticos o los registros de presencia de especies amenazadas son datos de interés científico, a la vez que una puerta de entrada a actividades que pongan en peligro su conservación, como la extracción ilegal de madera o la caza limitada en la misma. repositorio de confianza -como el CORA RDR - con acceso restringido y con sus metadatos en abierto.

También hay técnicas o software específico para identificar y anonimizar datos personales o para gestionar el consentimiento . colaborador del curso, nos desmontó un mito: "No es cierto que la normativa de protección de datos no nos deje hacer nada. La norma lo que quiere es que los datos se utilicen, que se muevan, pero dentro de unos límites de seguridad y confianza". arbitrarias, bien argumentados tienen todo el sentido del mundo. Para navegar esta complejidad, el CREAF cuenta con el buzón de consultas de la Delegada de Protección de Datos: dpo@creaf.uab.cat

"No es cierto que la normativa de protección de datos no nos permita hacer nada. Lo que quiere la norma es que los datos se utilicen, que se muevan, pero dentro de unos límites de seguridad y confianza", comentó Ruben Ortiz, de la Universidad de Barcelona.

Otros casos que necesitarían una protección especial tienen que ver con la propiedad intelectual . Es clave asignar licencias de uso a nuestras creaciones para proteger la autoría e indicar qué uso se permite. Además, debe planificarse la publicación de resultados de una invención potencialmente patentable para no adelantarse al proceso de registro de la patente.

Por último, existen alternativas como publicar datos sintéticos o simulados o utilizar Data Sharing Agreements (DSA) , unos acuerdos que permiten realizar intercambio de datos con cláusulas sobre derechos de propiedad intelectual, propósito, restricciones, seguridad, etc. para prevenir un mal uso y diseminación no autorizada.

La receta de un plan de gestión de datos

Ahora que ya sabemos qué necesitamos para garantizar que nuestros resultados se puedan reproducir y proteger, arremangémonos con el plan de gestión de datos ( Data Management Plan, DMP , en inglés).

Un DMP es un documento vivo que nos ayuda a organizar los datos de nuestra búsqueda de principio a fin. Como una receta de cocina, en un DMP encontramos:

  • Ingredientes: descripción de los datos que recogeremos o reutilizaremos.
  • Instrucciones de preparación: indicaciones de los métodos, herramientas y estándares que utilizaremos para recoger y procesar los datos con integridad.
  • Emplatado y conservación: detalles sobre cómo compartir o almacenar con los datos con seguridad y sobre cómo y durante cuánto tiempo serán accesibles.

¿Datos cocidos? ¡No, gracias, las prefiero crudas!

Gollum from Lord of the Rings meme

Fotograma modificado de la película El Señor de los Anillos. Fuente: tooomanysteves

La veintena de personas participantes de la formación, entre personal investigador y gestor, aprendieron que realizar una práctica científica con ética y rigor requiere que cuestionemos nuestros procesos . Este ejercicio no quita valor ni deslegitima la ciencia, sino que mejora su exactitud, eficiencia y utilidad.

Meritxell Batalla y Agustí Escobar , técnicos de investigación del CREAF, valoran el curso coincidiendo en la importancia de cuidar los datos que se manipulan y gestionan en el mundo científico. Agustí comenta que “es algo que puede comportar trabajo adicional, pero que aporta beneficios muy tangibles a la larga ”. Meritxell añade: “Si hubiera sido consciente de ello cuando empecé, ¡me habría ahorrado muchos sobreesfuerzos en el futuro!”. Por su parte, Laura Force , técnica de Ciencia Ciudadana y Educación ambiental del CREAF reflexiona que "la formación nos ha ayudado, aún más, a reforzar el hecho de que cuando personas fuera del CREAF entran en escena -como las voluntarias y voluntarios en proyectos de ciencia ciudadana-, debemos tener especial cuidado de sus datos personales y los datos".

La alegoría de la caverna de Platón nos recuerda que la ciencia abierta y su obsesión por la calidad, y la responsabilidad y la colaboración rompe las cadenas del acceso al conocimiento.