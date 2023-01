L’edizione 2022 di BioTechX, il piú importante congresso europeo in ambito pharma/biotech, che si tiene annualmente al Centro Congressi di Basilea, ha visto la presentazione di numerose soluzioni, in particolare Image Analysis, AI in Drug Development e NLP [...]

Guglielmo Iozzia Associate Director - ML/AI/Computer Vision presso MSD

Image Analysis, AI in Drug Development e NLP sono i temi salienti dell’edizione 2022 di BioTechX, il piú importante congresso europeo in ambito pharma/biotech, tenutasi dall’8 al 10 novembre al Centro Congressi di Basilea (Svizzera). Chi scrive ha avuto l’occasione di essere presente come spettatore, ma anche l’onore di essere invitato come speaker.

Ritengo utile condividere con i lettori di Ai4business la mia esperienza su questo importante evento.

BioTechX, breve cenno storico

BioTechX è il più importante congresso in ambito europeo che tratta tematiche relative alla diagnostica, alla medicina di precisione e alla trasformazione digitale nei settori farmaceutico, biotech e healthcare. Originariamente conosciuto con il nome di Bio Data World Congress, a partire dal 2022 ha subito un rebranding: nel recente passato era ormai diventato sede di tre eventi distinti (Bio Data World Congress, Genomics Live e Cheminformatics Live), a cui, per il moltiplicarsi di iniziative di AI applicata a casi d’uso in ambito farmaceutico, se ne era ultimamente aggiunto anche un quarto (PharmAI); motivo per cui gli organizzatori hanno accorpato tali eventi in uno solo, denominato BioTechX, all’interno del quale sussistono diverse track tematiche che ricalcano la struttura degli eventi originali.

L’edizione 2022 ha fatto registrare circa 4000 partecipanti, più di 300 speaker appartenenti a quasi tutte le grandi e medie aziende del settore farmaceutico e alcune start-up e circa 100 aziende espositrici. La scelta della sede di Basilea (Svizzera) non è casuale, in quanto la zona è uno dei più importanti hub europei in termini di innovazione tecnologica in ambito pharma/biotech/genomics.

Poiché il mio campo di expertise è l’AI (e faccio parte di un’azienda farmaceutica), focalizzerò il mio contributo sulle tre sub-track PharmAI, in particolare: Image Analysis e AI in Drug Development, con qualche puntata nella NLP.

Image Analysis a BiotechX

Il nome Image Analysis non deve trarre in inganno: questa sub-track in realtà includeva applicazioni di AI-based computer Vision e relative tematiche nelle più svariate aree di business di competenza delle aziende del settore farmaceutico.

La patologia digitale ha avuto un ruolo da protagonista nelle PharmAI track. L’interesse su questa tematica è un comune denominatore tra diverse aziende farmaceutiche. Un campo che presenta parecchie sfide non banali, dovute soprattutto al tipo di immagini in esame, che sono di dimensioni notevoli (non di rado intorno ai 4 GB l’una), con un alto indice di variabilità e quasi sempre prive di etichette, e alla difficoltà di poter implementare modelli interpretabili.

Di seguito una selezione dei talk di BiotechX più interessanti o innovativi.

Casi d’uso

Un caso d’uso interessante e di successo in questo campo è stato presentato dalla dott.ssa Radha Krishnan di MSD: l’implementazione di una pipeline AI per l’analisi di immagini cloud-based e che include la supervisione degli esperti di dominio, rapida, flessibile, consistente, scalabile e soprattutto facile da usare da parte di personale medico. La prima applicazione reale basata su tale piattaforma ha riguardato la predizione della Chromosomal Instability (CIN), un tipo di marker usato per misurare il progresso di diversi tipi di tumori.

Simili iniziative, nate con l’intento di rendere più agevole la vita dei medici, sono state presentate anche da George Lee di Bristol, Myers and Squibb e Adrien Rousset di Amgen, ma focalizzate più su uno specifico caso d’uso, a differenza della presentazione di MSD, che metteva in evidenza anche l’ottimo lavoro di Data e software Engineering svolto per l’implementazione della piattaforma e non solo Image Analysis e AI.

Nell’ambito della patologia digitale merita una menzione anche la presentazione di Rick Salmon di FFEI Life Science, riguardante i problemi legati alle non trascurabili differenze di scale cromatiche in WSI (Whole Slide imaging) dovute a diversi modelli di dispositivi di scanning. Dipendentemente dal costruttore e dal modello, l’utilizzo di diversi sensori e lenti, unito a diverse calibrazioni e meccanismi di image processing, causa questo problema, identificato ufficialmente dalla FDA e che penalizza l’implementazione di soluzioni Ai di patologia digitale. FFEI è stata parte attiva nella individuazione di uno standard denominato SIERRA per correggere il colore digitale e ricreare un “ground-truth colour” di riferimento per i modelli di AI.

Conseguentemente al rilascio di AlphaFold da parte di Deepmind sono partite tantissime iniziative (non solo a livello accademico, ma anche da parte di Big Pharma e nuove start-up del settore) per l’implementazione di modelli sia open che closed source per la predizione di strutture proteiche e atti ad accelerare il processo di Drug Discovery. Ovviamente non sono mancate presentazioni su questo argomento durante BioTechX 2022 (più di una di AstraZeneca in particolare, ma non solo), ma purtroppo si è avuta l’impressione che attualmente ci sia un generale sbilanciamento di investimenti ed interesse verso iniziative di AI nelle diverse fasi del ciclo di vita di farmaci e vaccini: maggiori verso la Drug Discovery, in crescita nell’area formulation ma non ancora comparabili con quelli per DD, minori in particolare nell’ambito della produzione in scala e del packaging.

Pochissimi i talk su questi ultimi argomenti: due di notevole interesse riguardanti l’ispezione visuale. Il primo caso d’uso presentato da Adam Kozak e Radoslaw Regula di Roche sull’implementazione di un sistema di ispezione visuale facente uso di modelli di Deep learning per l’individuazione di dispositivi medicali difettosi.

Il secondo presentato da chi scrive (MSD) riguarda un sistema di ispezione visuale automatica che utilizza modelli di Deep Learning non solo per la individuazione e la classificazione di difetti nei vaccini (sia a livello di prodotto che del contenitore), ma anche per la generazione di immagini sintetiche di prodotti difettosi per poter bilanciare i dataset per il training supervisionato dei modelli sopra citati.

Un talk interessante su una problematica comune a tutti i progetti di Image Analysis e/o AI-based Computer vision è stato quello di Jan Baumann dell’azienda tedesca Merck Group. Il moltiplicarsi di casi d’uso basati su immagini (quali ad esempio gene and protein expression, cell painting, clinical imaging, cell analysis, etc.) insieme alla frammentazione dell’ecosistema di dispositivi per la acquisizione delle stesse nei formati più disparati (proprietari o open), rende difficile creare trasparenza riguardo le possibilità e le competenze in questo campo tra le varie aree di business all’interno di una media o grande azienda. Questa situazione, fra le altre cose, impedisce la collaborazione fra esperti in materia ed è spesso causa di duplicazione di progetti (e quindi anche di sforzi e costi).

Per ovviare a queste situazioni, successivamente a un lavoro notevole di stretta collaborazione con gli utenti finali, si è giunti alla conclusione di implementare internamente a Merck Healthcare R&D due piattaforme cloud-based: una basata su CTERA per lo storage, caching e interoperabilità dei vari software di acquisizione immagini e Image Analysis e un’altra basata su AWS per la implementazione di funzionalità extra condivise. In questo modo il gruppo ha potuto raggiungere gli obbiettivi prefissati, in particolar modo la completa collaborazione fra tutti i pool di esperti e la semplificazione e standardizzazione del processo di creazione di dataset di immagini pronte per casi d’uso basati su AI.

AI in Drug Development a BiotechX

La sub-track AI in Drug Development includeva casi d’uso che spaziavano dalla Drug Discovery fino alla produzione e commercializzazione di farmaci e vaccini.

Tutti i vari talk su questo argomento hanno avuto come comune denominatore le Graph neural Network (GNN), architetture fondamentali per questo tipo di task, vista la natura dei dati in questione. Ma, come evidenziato nel suo talk da Thierry Dorval di Servier, l’attività di predizione può beneficiare di una significativa accelerazione solo se si affianca un approccio “in silico” (cioè con l’ausilio di computer modeling e simulation) a tecniche “in vivo” e “in vitro”. E per ciò risulta necessario disporre di una piattaforma software dedicata a dati rappresentabili come grafi e al training di modelli di GNN robusta e flessibile in termini di data storage e capacità di calcolo, quale Pegasus, quella proposta dal gruppo di ricerca con cui egli collabora.

Una iniziativa veramente innovativa è stata presentata da Raquel Rodriguez-Perez di Novartis, riguardo la possibilità di sostituire gli esperimenti ADME (Absorption, Distribution, Metabolism and Excretion) nel processo di Drug Discovery con machine learning. I risultati di tale lavoro hanno consentito non solo di capire che algoritmi di ML/DL sono in grado di trovare pattern chimici o strutturali che sono correlati con specifiche proprietà ADME, ma anche in quali situazioni utilizzare un modello locale o globale, come poter ridurre la possibilità di classificazioni errate e migliorarne la precisione (in modo da renderla confrontabile con la riproducibilità sperimentale) e in molti casi ridurre il numero di test sperimentali o quantomeno permettere una più accurata selezione degli stessi. Inoltre, una collaborazione con Microsoft Research ha permesso di implementare, a partire dal lavoro descritto in precedenza, un workflow di chimica generativa fruibile da personale specializzato nell’area MedChem tramite interfacce grafiche user-friendly.

Infine, quello di Martin Heitmann di D-Fine è stato un talk unico nel suo genere all’interno di questo congresso, in cui lo speaker individuava nella mancanza di un linguaggio comune fra diversi attori all’interno delle aree di business, governance e technology la principale causa di fallimento di progetti IA nel settore farmaceutico. Nella seconda parte del talk, lo speaker identificava le caratteristiche che deve avere un framework per la AI Governance per ogni ruolo coinvolto (embedded data governance per il DPO, completa tracciabilità dei dati e riproducibilità degli esperimenti per l’area QA, libertà di sperimentazione per i data scientist, explanability by design per gli esperti di dominio e model performance e data drift monitoring per gli Operations teams). Tutte caratteristiche per l’automazione dello sviluppo e della QA di progetti AI che altrimenti vengono identificate come MLOps.

Conclusioni

Decisamente BioTechX è l’evento per eccellenza per poter capire lo stato attuale di maturità digitale del settore pharma/biotech/genomics in Europa, verso il quale, a differenza di altri settori, non c’è spesso lo stesso interesse da parte dei media e dove i big player non hanno l’apertura mentale di rendere noti all’esterno i progressi fatti tramite l’utilizzo di dati e AI.

Un evento da non perdere per gli addetti del settore ed esperti in diversi domini, non solo data science e ML/AI.

Tutti i casi d’uso di AI presentati a questo congresso erano reali, non banali, andati in produzione o in corso d’opera (non solo ricerca fine a se stessa quindi) e i vari speaker ne hanno condiviso le lezioni imparate, le sfide incontrate (sia quelle risolte che quelle ancora da risolvere) e che tipo di valore è stato realizzato (soprattutto dal punto di vista dei pazienti) attraverso tali iniziative.

Dal quadro complessivo osservato all’edizione 2022 si può evincere che il settore è molto maturo in Europa (anche se a velocità diverse da Paese a Paese) e ho avuto l’impressione che esso non abbia molto da invidiare attualmente ad altre zone geografiche solitamente sotto i riflettori e maggiormente ricoperte di elogi.

Tutti i grandi player del settore farmaceutico erano presenti al BioTechX Congress. Non ho potuto fare a meno, purtroppo, di notare l’assenza, almeno nelle track di mia competenza, di talk relativi a iniziative concepite in Italia o da parte di aziende farmaceutiche a capitale italiano; aspetto che a mio parere stride con la non trascurabile rappresentanza di speaker, contributor ai progetti presentati e addetti ai lavori partecipanti all’evento, di nazionalità italiana, ma facenti parte di aziende di altri Paesi europei o nordamericane.