Machine learning pakt medische big data aan

07 december 2017

Ook in de medische wereld wordt ingezet op ‘machine learning’ om snel zinvolle inzichten te destilleren uit explosief groeiende datavolumes, in de dagelijkse zorgverstrekking.

  • Hans De Clercq & Hans Danneels

Vandaag worden patiënten en andere zorgbehoevenden steeds vaker 24/24 en 7/7 opgevolgd door één of meerdere toestellen. Dat zowel binnen ziekenhuizen en andere verzorgingsinstellingen, als gewoon in het dagelijkse leven met behulp van mobiele toestellen. De voordelen hiervan zijn legio, maar het is een uitdaging om die aanzwellende datastromen snel en zinvol te interpreteren, zowel voor onmiddellijke ‘alerts’ (zoals bij hartproblemen, epilepsie aanvallen…) als voor diagnose doeleinden. ‘Machine learning’ moet hiervoor een oplossing bieden.

Niet nieuw…

Bondig gesteld vormt ‘machine learning’ een tak van de computerwetenschap die bestudeert hoe ‘computers kunnen leren zonder hiervoor specifiek te worden geprogrammeerd’. Vaak wordt dit ook gekoppeld aan studies rond kunstmatige intelligentie (AI), waar de term overigens zijn oorsprong vond, en dat al lang geleden. Immers, ‘machine learning’ werd voor het eerst vermeld door een AI pionier bij IBM in 1959, in casu Arthur Lee Samuel (in gaming software om het bordspel dammen te spelen). Concreet voorziet machine learning in de mogelijkheid om op basis van (grote) data-hoeveelheden modellen te creëren die in de praktijk helpen om datasets en -stromen te interpreteren en daarop in te spelen (bijvoorbeeld: voer in een computer duizenden concrete schaakspelletjes en -posities in, als basis voor een model dat een computer kan hanteren om daadwerkelijk een spelletje schaak te spelen…). Doorheen de jaren is machine learning ook gelinkt aan ontwikkelingen als gegevenspakhuizen (datawarehouses, data mining, decision support systems), neurale netwerken en dies meer.

Byteflies en Google

Momenteel heeft machine learning de wind in de zeilen dank zij krachtige ictinfrastructuren (zoals de cloud) en de mogelijkheden om grote datasets en -stromen te verwerken (opslag, ver werking in werkgeheugen). Vanzelfsprekend denk je daarbij meteen ook aan de Amazons, Googles et alii van deze wereld, aangezien datagerichte analyse precies het DNA van die bedrijven uitmaakt.

Het is dan ook een mooi succes voor Byteflies – een medisch sensorbedrijf uit Antwerpen, met kantoor in Berkeley (CA) – om deel te nemen aan Google Launchpad Studio. “Het betreft een programma waar startups met Google experten gedurende zes maanden samenwerken om Google’s machine learning expertise te combineren met de toepassingen van de startups,” aldus Hans De Clercq, CTO en medeoprichter van Byteflies.

Voor Byteflies gaat het om de interpretatie van de datastromen gegenereerd door hun product, de Sensor Dot, die een spectrum aan (niet-invasieve) sensor-mogelijkheden biedt. Vandaag omvatten die al PPG (photoplethysmografie), EDA (electrodermale activiteit), ECG (electrocardiogram), EMG (electromyografie), beweging en ademhaling, Die datastromen kunnen worden gecombineerd met het oog op specifieke toepassingen. “Vandaag is Byteflies actief in het SeizeIT consortium. Daarin wordt samengewerkt door UCB en de KULeuven met oog op de ontwikkeling van een epilepsieproduct.” Het doel is om verschillende indicatoren (hartritmestoringen etc.) te combineren voor een effectiever monitoring systeem.

Dergelijke datasets en -stromen in de cloud verwerken op zoek naar relevante biomarkers. dat is een kernactiviteit van Byteflies. “Door samen te zitten met de experten kunnen we van elkaar leren. Google zoekt nieuwe markten voor zijn machine learning technologie. Wij doen de vertaalslag naar onze wereld,” voor betere en snellere resultaten.

De looptijd van de samenwerking met Google is voorzien op 6 maanden, en in die periode zal Byteflies een viertal werksessies van een week bij Google doorbrengen (waarvan al één achter de rug). Na 6 maanden worden dan de resultaten van de samenwerking geëvalueerd. Om nadien nog door te gaan? “Het is nog wat vroeg dag om dat te zeggen…”

Nog heel wat uitdagingen

De toekomst van machine learning in de medische wereld lijkt al verzekerd, maar de uitdagingen zijn nog legio en stevig. Zo werd begin 2017 een IBM Watson project rond oncologie bij het M.D. Anderson Cancer Center (verbonden aan de U of Texas) gestaakt. En dat na 4 jaar inspanningen en een investering van meer dan 62 miljoen dollar. Het doel was om – naast het aanwenden van machine learning – een Oncology Expert Advisor te ontwikkelen als hulp voor artsen.

De hoofdredenen voor dit falen blijken vooral ‘klassiekers’ te zijn als ‘project scope creep’ (de focus van het project verandert doorheen de tijd, terwijl de omvang en complexiteit groeit), management fouten en zeker ook een kwestie van ‘over promising and under delivering’ (waarbij met de vinger naar de marketingafdeling van IBM wordt gewezen). Maar tevens waren er een rist perikelen met het machine learning aspect. Zo waren er problemen met incompatibele datasets (twee generaties van elektronische patiënten dossiers), met uiteindelijk te weinig data als gevolg. Bovendien vergde de input van data veel inspanningen van experten wegens nood aan structuur. Voorts bleek Watson enkel in staat conclusies te trekken op basis van het ‘corpus’ van data waarop het systeem was getraind, en was dat niet mogelijk over verschillende corpora heen.

Nog andere klachten over Watson en zijn toepassingen in oncologie (‘Watson on Oncology’), waren het uitblijven van ‘nieuwe kennis’, terwijl het systeem ook onvoldoende kijk bood op hoe een inzicht/conclusie/advies tot stand was gekomen. En tevens klaagde men in een aantal landen over de eenzijdigheid van de adviezen door de basisinput van het Memorial Sloan Kettering Cancer Center, NY (met vooral aandacht voor Amerikaanse methoden).

Een en ander betekent zeker niet de dood van Watson (gooi het kind niet met het badwater weg!), maar het vormt wel een ‘reality check’ op weg naar realistische (big) datagesteunde toepassingen in de medische wereld. De blog van Health-Affairs trekt hieruit een viertal lessen. Mik met machine learning op het automatiseren van routineuze interpretatietaken waaraan zorgverleners nu teveel tijd verliezen. Vergroot de aanvaarding van machine learning toepassingen bij het medisch personeel door hen nauwer te betrekken bij de (iteratieve) ontwikkeling van reële producten, en niet zozeer bij research. Zorg voor een verscheidenheid aan databronnen en leveranciers van analytics oplossingen. Toets de machine learning gesteunde toepassingen op hun bijdrage aan een betere zorg (en standaardiseer de informatie over het bereiken van concrete doelstellingen in die zorg).

Datakwaliteit hoogst belangrijk

Toegegeven, het machine learning aspect van Watson is van een ander kaliber dan voor het verwerken van datastromen uit sensoren. Maar het benadrukt hoe belangrijk de datasets wel zijn, zowel wat de kwantiteit als de kwaliteit van die data betreft. “GIGO, alias ‘garbage in, garbage out’” citeert Hans De Clercq het aloude adagio….

Het genereren van kwalitatieve datastromen is het vakgebied van Byteflies. Vanuit hun academische achtergrond hebben de oprichters Hans Danneels en Hans De Clercq naast een elektronica-basis ook een stevige affiniteit met de medische wereld. “Veel nieuwe technologieën hebben nog geen ingang gevonden in de medische wereld. Wij vormen de brug tussen die werelden,” aldus De Clercq, “met de ontwikkeling van een platform. Zo’n platform biedt al zeg maar 80 procent van de basis voor een medische oplossing, waarna de klanten van die platformen tekenen voor de 20 procent specifieke toepassingsexpertise. Zij moeten dan geen jaren tijd en resources investeren in de ontwikkeling en validering van eigen hardware en software.” Kortom, Byteflies doet niet de hele toepassing, maar is een partner die een breed gamma van toepassingen onderbouwt.

Belangrijk is het garanderen van kwaliteitsvolle sensormetingen, ook in de gewenste frequentie van metingen (zelfs in milliseconde stappen) naargelang de aard van de patronen die men wenst te vinden. “We zijn nu in de laatste fase om te voldoen aan de ISO 13485 standaard,” in casu de standaard betreffende kwaliteitsbeheersystemen en medische toestellen, klinkt het. Met de beschikbaarheid van producten als Sensor Dot moeten ontwikkelaars van medische ‘wearable’ toepassingen ook geen beroep meer doen op dubieuze consumenten producten.

Byteflies biedt vandaag zijn combinatie van hardware (Sensor Dot) en software aan, een ‘exploratie kit’, evenals tools voor het opzetten en opvolgen van experimenten. Die producten worden vandaag al getest aan de KU Leuven en in Case Western Reserve University (Cleveland, Ohio). Als doelpubliek wordt gemikt op farmaceutische en technologie bedrijven, evenals researchinstellingen. De combinatie van Sensor Dot metingen en de Byteflies verwerking van datastromen maakt het mogelijk voor organisaties om naast de klassieke medische validatie-processen snel en makkelijk nog meer testresultaten te boeken (niet onbelangrijk in een wereld die steeds meer ‘evidence based’ wil zijn). Producten en diensten – in casu ook algoritmen van machine learning – kunnen omgekeerd zo ook worden gevalideerd tegen studies conform de klinische standaarden. “Overigens mag je niet vergeten dat België nummer 3 is wat aantallen klinische studies betreft, na de VS en Zwitserland,” aldus De Clercq. Niet alleen vertegenwoordigt dit een klantenpotentieel, maar tevens herbergt ons land ook veel data.

Voor Byteflies is de Google samenwerking een welkome hulp bij het opschalen van hun aanbod. Immers, in 2018 gaan niet alleen de leveringen van de Sensor Dot van start, maar mikt Byteflies ook op een inkomstenmodel uit diensten (signaalverwerkingsdiensten per patiënt).

Bij dit alles wordt ook aandacht besteed aan security. Data worden versleuteld op basis van de AES-encryptie standaard, en er wordt voldaan aan de beveiligingsvoorwaarden van de Amerikaanse HIPAA wetgeving. “Onze datastroom is overigens gescheiden van de patiënten informatie in het deel van de toepassing bij artsen, ziekenhuizen en anderen,” aldus De Clercq. En ja, ook met de nieuwe Europese privacywetgeving wordt al rekening gehouden “by design!”

Sensorless

Natuurlijk bulkt de wereld van mobiele gezondheidszorg van snelle ontwikkelingen. Naast Byteflies met de eigen Sensor Dot, zijn er eveneens bedrijven die zich toeleggen mobiel monitoring met gebruik van beschikbare middelen, zonder gespecialiseerde sensoren. Zo monitort FibriCheck uit Hasselt het hartritme van personen met behulp van de camera in een standaard smartphone – een toestel dat steeds meer personen op zak hebben. Bedreigt dat niet de markt voor producten als de Sensor Dot? Toch niet, meent De Clercq, “FibriCheck is één toepassing voor één probleem. Wij bieden een platform aan voor verschillende toepassingen, met diensten.”

Voorts is elke oplossing een afwegen van verschillende factoren: maximale nauwkeurigheid/datakwaliteit, kosten, patiënten comfort; naast verschillen tussen leeftijdsgroepen (acceptatie bereidheid), meer of minder actieve levensstijl (sport etc.); de frequentie van metingen en dies meer. Ook is er ruimte voor verschillende ‘verpakkingsvormen’ van sensoren, zoals een ‘patch’ (onder meer de Sensor Dot) maar ook draagbare modellen (zoals een soort hoorapparaat, tot en met ‘in ear’ modellen). Kortom, mobiele gezondheidszorg zal zeker geen geval zijn van ‘one solution fits all’, met dus zeker ruimte voor een hele rist spelers.

Guy Kindermans