Recursion Pharma con Splunk
y el aprendizaje automático

Categoría:

Resumen

La empresa Recursion Pharmaceuticals, con sede en Salt Lake City, se fijó un objetivo: descubrir nuevos tratamientos para 100 enfermedades genéticas antes de 2025 mediante una innovadora combinación de biología, automatización y aprendizaje automático. En la actualidad, Recursion utiliza microscopios robóticos para capturar decenas de miles de imágenes de cultivos celulares, generando terabytes de datos a diario. Como una empresa emergente de rápido crecimiento con sólo unos pocos empleados, se enfrentó a los desafíos en el registro de los procedimientos y el seguimiento de los datos operativos. Desde la implementación de Splunk Enterprise, la empresa ha visto beneficios como:

  • Tiempo de valoración en tres días, con la adopción de laboratorio completo en tan sólo tres meses.
  • La visibilidad en todas las partes del proceso de producción informa a los experimentos de detección de enfermedades.

¿Por qué la elección de Splunk?

En el pasado, Recursion tuvo dificultades para gestionar grandes cantidades de datos de series temporales recopilados de instrumentos controlados por el procesador y secuencias de vídeo generadas por las cámaras del laboratorio. La estrategia inicial de gestión de datos apenas se ajustaba a las ambiciones de alto volumen de la empresa: los microscopios de su laboratorio producen en la actualidad 700.000 archivos TIFF cada semana, lo que representa un aumento del 800% de la productividad en 10 meses. Mientras la empresa consideraba alternativas de código abierto,
Ben Miller, Director de Operaciones Científicas de alto rendimiento, vio el papel fundamental que podía desempeñar Splunk Enterprise a medida que Recursion aumentaba sus capacidades. “Estaba obteniendo valor de Splunk Enterprise en unos tres días”, comenta Miller. Recursion ha construido un sistema de aprendizaje automático propio de clase mundial que analiza terabytes de datos de imágenes experimentales a diario para descubrir nuevos tratamientos para enfermedades críticas. Este sistema se integra con Splunk Enterprise a través del SDK de Splunk para Python, que pasa los datos operativos de nuevo en los procesos de diseño de experimentos, y Splunk DB Connect para enriquecer los datos de registro con métricas de calidad. A partir de ahí, el Splunk Machine Learning Toolkit facilita la apariencia de estas métricas operativas de alto nivel para obtener nuevos conocimientos sobre los procesos de laboratorio, en palabras de Miller, para “manejar grandes cantidades de datos y entender qué correlaciones están sucediendo mientras están ocurriendo, no meses después”.

Industria
• Sector salud
Casos de uso de Splunk
• Analítica empresarial
• Internet de las cosas
Desafíos
• El rápido crecimiento y el enorme volumen de datos requieren una escalabilidad mayor
• El objetivo de 100 nuevos tratamientos requiere visibilidad en tiempo real de los experimentos
• Reunir información esencial de diferentes fuentes e instrumentos de prueba
• Diversos usuarios y requisitos, desde científicos que programan en Python hasta ejecutivos y técnicos que navegan por el panel de control.

Impacto empresarial

• Tiempo inicial de valor en sólo tres días, con un complejo laboratorio que se pone en marcha en sólo tres meses
• Escala masiva mientras se gestiona un volumen de datos de 700.000 archivos TIFF semanales
• La visibilidad oportuna de todas las partes de la instalación de producción informa los experimentos
• Plataforma sólida para la gestión y revisión centralizada
de registros. También flexible en el movimiento de información dentro y fuera de la base de código de los científicos de datos
• El kit de herramientas de aprendizaje automático proporciona información que de otro modo quedaría oculta en los experimentos
• Ahorro sustancial de costos en comparación con el software de gestión de información de laboratorio especializado

Fuentes de datos

• Archivos de registro de los equipos de programación
(sistemas que gobiernan todos los instrumentos controlados por el equipo)
• Archivos de registro de instrumentos individuales como:
• Dispensadores acústicos de gotas (dispositivos que añaden reactivos a las placas de células)
• Fluorímetros de placas
• Microscopios robóticos

Productos Splunk

• Splunk Enterprise
• Splunk DB Connect
• Splunk Machine Learning Toolkit
• Splunk SDK para Pytho

Utilizar la inteligencia artificial (IA) y la bioinformática

En cierto modo, el enfoque de Recursion es más bien paralelo que serial. En lugar de estudiar una diana molecular particular relacionada con una enfermedad específica, la empresa genera y analiza a diario miles de cultivos celulares en presencia de siRNA —un compuesto que “apaga” en específico genes seleccionados para crear un modelo de enfermedad genética— y compuestos farmacológicos, utilizando un algoritmo de aprendizaje profundo para procesar los resultados y la IA para ayudar a determinar qué fármacos merecen un estudio más a fondo. La plataforma Splunk fue puesta en marcha en apenas tres meses, la cual desempeña dos funciones críticas en el funcionamiento y la mejora de un laboratorio tan complejo.
Splunk Enterprise ayuda a supervisar y diagnosticar problemas en tiempo real con los complejos instrumentos de laboratorio, detectando anomalías en las operaciones automatizadas, lo que permite al equipo científico de alto rendimiento construir cuadros de mando para medir la calidad de tiempo. También sirve como una plataforma de gestión de datos que alimenta los datos de la máquina y los envía de vuelta a los científicos de datos que trabajan con Complementos de Splunk como con Splunk DB Connect, lo que permite al equipo compartir el conocimiento descubierto.

Seguimiento del Internet de las cosas

Las tres grandes células de trabajo automatizadas de la empresa están construidas en torno a brazos robóticos que mueven placas de células y reactivos de un instrumento a otro.
Cada célula de trabajo se comunica a través de su propia subred, con cada instrumento se alimenta los registros y otros datos a la plataforma Splunk, por lo que el equipo puede recopilar análisis y obtener información sobre cómo está funcionando el proceso tan complejo.
Por ejemplo, los dispensadores acústicos de Recursion toman miles de mediciones de los volúmenes de las placas fuente de fármacos y ARNsi cada hora, lo que permite un seguimiento cuidadoso de estos valiosos reactivos. Los científicos de Recursion pueden hacer un seguimiento de las tasas de evaporación e hidratación de estos pozos fuente para controlar de manera más eficaz su concentración durante la experimentación y reducir los residuos. Además, pueden planificar y ejecutar experimentos de
forma más efectiva sin verse sorprendidos por una espera de cuatro a seis semanas y un cargo de 5000 dólares por una nueva placa preparada por un fabricante externo.

“Splunk Enterprise nos proporciona esa visibilidad en todas las partes de la planta de producción de una manera muy oportuna para ayudar a informar nuestro próximo conjunto
de experimentos”.

John Pereira,

Director de Operaciones, Recursion Pharmaceuticals.

“Sería imposible realizar de manera manual la velocidad y la escala con la que trabajamos en la actualidad. En cuanto a la captura de los datos y lo que hacemos con ellos, simplemente no sería posible”.
Ben Miller

Director de Operaciones HTS, Recursion Pharmaceuticals.

Hacer posible el plan de negocio
Cuando se le pide que calcule cuánto tiempo se ha ahorrado la empresa con la implantación de Splunk Enterprise, Miller
comenta: “Si se combina la cantidad de datos que estamos recogiendo con la velocidad y la escala a la que trabajamos, sería imposible realizar todo de manera manual. Splunk es más que un recurso para nuestro equipo, es un requisito”.
Los cuadros de mando de Splunk se han convertido en lo primero que miran los técnicos de HTS antes de empezar el
trabajo del día, para asegurarse de que hay suficiente volumen de placas de origen para continuar y, después de cada ejecución, para confirmar que las decenas de miles de transferencias
de fármacos y siRNA planificadas se ejecutaron de manera correcta.
Miller describe una estación de trabajo de microscopio que venía con su propio software. Era más rápido mirar la información de registro a través de la interfaz de Splunk que aprender
a utilizar el software del microscopio para ver los datos de registro.
En un futuro, Recursion anticipa que las soluciones de Splunk ayudarán con todo, desde la planificación de la futura expansión y las decisiones de compra para mantener el ritmo vertiginoso de la empresa hacia su objetivo de 100 nuevos tratamientos para 2025.
“En la industria de la biotecnología, hay una categoría de software llamada LIMS (por sus siglas en inglés) Software de
Gestión de Información de Laboratorio, y todo ello es caro e inflexible en comparación con Splunk. Creo que las empresas de biotecnología y farmacéuticas deberían tener muy en cuenta a Splunk cuando busquen un sistema LIMS externo. Esta es la segunda empresa de biotecnología en la que lo he implementado y vale la pena”.

Ben Miller
Director de Operaciones HTS, Recursion Pharmaceuticals

Contamos con las certificaciones necesarias para cubrir procesos de alta criticidad e importancia estratégica.