Clouds retten Leben und helfen bei der Heilung

Cloud technologies help save lives


Was haben Clouds, Big Data und die Onkologie gemeinsam? Wie können Cloud-Technologien beim Bekämpfen von ernsthaften Erkrankungen helfen? Eine Verbindung gibt es: der Einsatz von Cloud-Technologien beim Sequenzierung des Genoms erlaubt es, gefährliche Erkrankungen früher zu diagnostizieren und die richtigen Entscheidungen zu treffen.


Cloud-Technologien haben den Schleier des Geheimnisses verloren und wurden zu einem gewöhnlichen innovativen Werkzeug, ohne welches ein modernes Unternehmen schwer vorstellbar ist. Natürlich hat die Menschheit noch nicht in vollem Umfang die Vorteile der Verwendung von Clouds zu schätzen gelernt und ist nicht immer in der Lage zu bestimmen, wie nützlich sie sein können. Der angewandte Wert von Cloud-Lösungen hat jedoch vor kurzem ein weiteres sehr klares Beispiel gefunden – den Kampf gegen schwere Krankheiten, allem in der Onkologie. Versuchen wir doch zu verstehen, was Medizin und Cloud-Technologien verbindet ist und was die Aussichten dieser Allianz sind.

Ein paar Worte zur Genomik

Beginnen wir mit den Naturwissenschaften. Wie es bekannt ist (und wem ist es nicht bekannt ist - Google ist schnell zu Hilfe), war vor mehr als fünfzehn Jahren der Traum von allen Genetikern, Ärzten und idealistischen Visionären aller Welt wahr geworden: in 2001, nach der veröffentlichten Forschung des US-amerikanischer Genetikers Craig Venter, gelang eine lang erwartete Entschlüsselung des menschlichen Genoms. In 2003, im Rahmen desgrößten internationalen Bioinformations-Projekts "Human Genome" (das menschliche Genom-Projekt, HGP) wurde eine Sequenz von 92% Nukleotide ausgelesen(bisher nur ein kleiner Teil, von 4% bis 9% des Genoms bleibt nicht entschlüsselt). Dies öffnete den Weg für die Diagnose des Zustands des Organismus auf der Ebene der Gen-Analyse.

Was bedeutet das? Dass man mit Hilfe einer speziellen Technologie herausfinden kann, ob jemand eine genetische Anfälligkeit oder, im Gegenteil, Intoleranz gegenüber Medikamenten oder Substanzen (Anästhetika, Antibiotika, bestimmten Proteinen, Alkaloiden usw.) hat. Fragen können endlich beantwortet werden, warum man eben diesen Körper hat und warum einige Diäten für einen nichts bringen und für den anderen eine fast magische Wirkung haben. Schließlich kann die Wahrscheinlichkeit erblicher Krankheiten basierend auf der DNA-Analyse berechnet und die optimale Behandlungsmethode gewählt werden. Zum Beispiel nutze der berühmte Hollywood-Star Angelina Jolie in 2013 nutzte die DANN-Sequenzierung und beschloss sich, nachdem die Ergebnisse vorlagen, zu einer präventiven Doppel-Brustamputation: in ihrem Genom wurde ein mutiertes Gen BRCA1 entdeckt, das zu Krebserkrankungen führt, wobei die Wahrscheinlichkeit eines Tumors ich ihrem Fall bei über 87% lag. Ihr Beispiel hat viele Menschen dazu inspiriert, Gen-Sequenzierung durchzuführen, um genaue Informationen über den Zustand des Körpers zu erhalten, und Angelina wurde zu einem Symbol des Erwachens und der bewussten Wahrnehmung der Zukunft.


Prediktive Medizin (basierend auf der Prognose der Wahrscheinlichkeit der Krankheitsentwicklung) ist das bekannteste Anwendungsgebiet, wo die Analyse des sequenziertes Genoms bereits verwendet wird - aber das Einzige. Das sequenzierte Genom des Patienten erlaubt es, die Wirksamkeit der angewendeten Behandlung und die Wirkungen der Medikationen auf den Körper herauszufinden. Es kommt vor, dass die Menschen mit der Krankheit seit Jahren kämpfen unter Anwendung verschiedener Mittel und Methoden der Therapie - doch vergeblich. Dies geschah mit Eric Dishman, Leiter des US-Forschungsprogramms „All of us“ („alle von uns“) am National Institutes of Health (NIH): im Alter von 19 Jahren erfuhr er, dass er an einer seltenen Form von Nierenkrebs erkrankt war, und willigte ein, sich an einer experimentellen Behandlung zu beteiligen. Zwanzig Jahre lang kämpfte der Mann vergeblich mit der Krankheit und wechselte gehorsam eine unwirksame Behandlung nach der anderen. Während dieser Zeit verringerten sich die Kosten der Genomsequenzierung allmählich und erreichten schließlich das Niveau, das für Eric verfügbar wurde. Nachdem er die Ergebnisse der Entschlüsselung seiner DNA erhielt, war er erstaunt: wie sich herausstellte, waren 92% der Medikamente, die in seiner Therapie verwendet wurden, einfach wirkungslos, was die Ärzte nicht wussten nicht vorhersehen konnten, bevor das Genom des Patienten schließlich entschlüsselt werden konnte. Heute ist Eric Dishman einer der glühendsten Unterstützer der Sequenzierungstechnologie, fördert sie aktiv in der globalen Weltgemeinschaft und befürwortet weitere Senkung der Kosten für dieses recht teure Verfahren, um es für jedermann zugänglich zu machen.

Warum der Preis so hoch ist

In 2001 wurde das Genom eines Menschen entschlüsselt. Trotz des erhöhten Interesses an neuen Möglichkeiten, die die Technologie der Sequenzierung offenbarte, wuchs die Zahl der glücklichen, die ihre "Tiefe Essenz" in den Nukleotid-DNA-Ketten offenlegten, nur sehr langsam an – der zweite Fall eines vollständigen Sequenzierung wurde erst 2007 erfasst. Der verstorbene Apple-Gründer Steve Jobs beschloss, einen Teil seiner Gene zu sequenzieren - nach der Krebsdiagnose, die ihm gestellt wurde – und wurde nur der zwanzigste Mensch auf der Welt, deren Genom gelesen wurde. Leider waren in seinem Fall auch die Entschlüsselung der Tumor-DNA und die darauf basierende Behandlung machtlos.


Doch woran liegt es, dass eine sehr vielversprechende Technologie keine breite Anwendung finden konnte? Auf der einen Seite ist die Erklärung recht banal: der Preis ist sehr hoch.


Clouds will save lives

Senkung der durchschnittlichen Kosten für die Sequenzierung des Genoms; Quelle: https://www.genome.gov/


Das Diagramm zeigt, wie stark in den letzten zehn Jahren die durchschnittlichen Kosten für die Sequenzierung gesunken sind: zu Beginn des Jahrhunderts belief er sich auf mehr als 100 Millionen Dollar (nach anderen Daten, lagen die Kosten in 2003 bei 2,7 Milliarden Dollar), bis 2007 sank der Preis signifikant, und bereits gegen Ende 2008 sank er auf 500, 000 Dollar und sinkt kontinuerlich. Heute, Ende 2017, ist es möglich, Ihr Genom für 1000 Dollar zu entschlüsseln. Mit anderen Worten, wenn vor zehn Jahren der Preis der DNA-Entschlüsselung mit dem Preise eines guten SUV (und früher buchstäblich mit einem Privatjet) vergleichbar war, liegt er heutzutage etwa beim Preis eines iPhone X. Und die kühnen Prognosen einiger Hersteller belegen, dass die Kosten in den nächsten paar Jahren weiter senken werden.


Allerdings ist die deutliche Preisseknung nur eine Seite der Münze. Die Geschwindigkeit der Sequenzierung wurde ebenfalls drastisch erhöht: in der Anfangsphase nahm die Technologie viel Zeit in Anspruch, da eine Vielzahl von Daten analysiert werden mussten. Die Entschlüsselung dauerte jahrelang. Wie oben erwähnt, wurde einer der DNA-Entdecker James Watsons in 2007 erst der zweite Mensch auf der Welt, dessen Genom vollständig sequenziert wurde. Noch in 2013 schilderte englische Journalistin und Schriftstellerin Carole Cadwalladr in einem großen und faszinierenden ihre persönliche Erfahrung: sie musste für die Ergebnisse der DNA-Entschlüsselung fast ein Jahr lang warten. Jetzt dauert die Sequenzierung lediglich bis zu ein paar Tagen.


Viele Startups und große Unternehmen stürzten sich in den Wettbewerb, wer den schnellste und erschwingliche Seuenator erschafft. Was ist also der Grund für das Wachstum der DNA-Analysegeschwindigkeit und die Kostensenkung? Hier wird es interessant: es sind die Clouds und die Verwendung von großen Datenanalyse-Tools, die dazu beitragen. Durch die Integration von Ansätzen in der künstlichen Intelligenz, Big Data und Cloud Computing mit fortschrittlichen DNA-Analyse-Techniken kann die Sequenzierung des Genoms günstiger und schneller als je zuvor erfolgen.


Big Data help save lives

Big, Big Data…

Groß sind diese Daten nun tatsächlich. Sehr groß:

  • In jedem Genom gib es 6,4 Milliarden Basispaaren.
  • Entschlüsselungsergebnisse «wiegen» von 200 Gb bis zu 0,5 Tb
  • The Cancer Genome Atlas enthält ungefähr 5 Petabyte an Daten – das sind Ergebnisse der Untersuchungen aus 14,5 Tausend Fällen.
  • In der größten Datenbank BRCA Exchange, wo die Information der Mutation von BRCA1 und BRCA2 enthalten ist (Milchdrüsen- und Prostatakrebserreger), sind 17 800 Genomvariationen enthalten.
  • Auf einem Symposium zur Sequenzierung von DNA, veranstaltet in 2013 von der Firma Illumina, dem unbestrittenen Marktführer bei der Produktion von Sequenzierungsmaschinen, wurde interessante Statistik der Big Data bei der Genom-Analyse präsentiert: das Unternehmen entschlüsselte zu diesem Zeitpunkt 1 600 Pathogene, die in den Genomen von 47 Menschen, die bei der Veranstaltung anwesend waren an dem Testverfahren teilnahmen, wurden 1 221 Variationen entdeckt; dann haben die Experten des Unternehmens 23 144 Varianten der möglichen Verhaltens-Rollen von Genen in den gegebenen Bedingungen bewertet und sind zu dem Schluss gekommen, dass 65 davon wahrscheinlich patogen werden und  eine bestimmte Rolle bei Auftreten von Krankheit spielen können.


Der Umfang dieser Zahlen lässt darüber nachdenken, mit welchen Mitteln man damit arbeiten kann. Für diese Daten benötigt man natürlich auch ein Speicher - zuverlässig, sicher, vor Bedrohungen der Privatsphäre geschützt und gleichzeitig für den Datenaustausch innerhalb des Analyseteams verfügbar. Vor siebzehn Jahren solche Rechenleistung, die Speichermenge, die Schutzmechanismen des IT-Sicherheit und der damit verbundene Verkehr zu gewährleisten, war einerseits technisch unmöglich, und auf der anderen Seite extraorbitant teuer.  Genauer gesagt, wie das Bauen eines ganzen Flugplatzes - mit all seinen Start- und Landebahnen, Türmen, Hangars, Wetterstationen und anderen Infrastrukturen.


Tatsächlich wird eine lokale Analyse sogar auf einem Supercomputer in einem wissenschaftlichen Zentrum den Prozess für eine lange Zeit verzögern - und es würde zu teuer kosten.


Wenn die Daten in die Cloud verschoben werden, können mehrere Ziele erreicht werden:

  • zuverlässige Speicherung aller Daten im Projekt;
  • Beschleunigung der Verarbeitung einzelner Genomdaten und Vergleich mit Statistiken;
  • Flexible Konfiguration (im Prozess der Sequenzierung wird eine große Rolle von RAM gespielt, und die Anzahl der Kerne des Prozessors ist fast ohne Bedeutung);
  • Verwendung von Rechenleistung in dem Moment, wenn sie erforderlich ist (im Gegensatz zu Supercomputern in der wissenschaftlichen Zentren, wo die Wissenschaftler teilweise auf freie Kapazitäten warten müssen);
  • Interaktion der Projektgruppe bis zum internationalen Maßstab;
  • Zugriff auf Projektdaten zu jedem beliebigen Zeitpunkt von überall auf der Welt.


Auch wichtig: die Frage der Ausrüstungskosten und deren Wartung wird in der Cloud richtig gelöst. Die aktive Nutzung von PaaS, IaaS, Saas-Funktionalität ermöglicht es, das Projekt in den Richtungen zu skalieren, die auf der einen oder anderen Stufe benötigt werden. Zum Beispiel ist es für die Verarbeitung von Statistiken über Mutationen von einigen Genen und Berechnung der Wahrscheinlichkeit der pathogenen Entwicklung erforderlich, spezialisierte Software einzusetzen, recht einfach in die Cloud integriert werden kann.

Wohin steuern die Clouds?

Die Arbeit mit der Datenbank der entschlüsselten Genome wird durch die Verwendung von Clouds ebenfalls vereinfacht. Je größer der Umfang, desto besser werden die Forscher in der Lage sein, die Faktoren vieler schwerer Krankheiten zu untersuchen und neue Methoden der Vorbeugung und Behandlung zu entwickeln. Glaubt man dem CEO von Illumina Jay Flatley, ist es bei der Untersuchung einer so komplexen Erkrankung wie Krebs notwendig, Hunderttausende Genomen eingehend zu analysieren - und mit Hilfe moderner Technologien wird es möglich.


Das ist nicht etwa Science Fiction – es ist unsere Realität. So arbeiten bereits viele Unternehmen. AWS verfügt sogar über eine separate Funktionalität, die speziell für Genomik-Teams entwickelt wurde (z. b. das Broad Institute in Cambridge und das Institut für Genommedizin an der Seoul National Medical University), und Amazon forscht ebenfalls aktiv in diese Richtung: es werden eigenen Lösungen erstellt, die auf der Grundlage der Analyse der Interaktion mit ähnlichen Projekten entstehen. Auch die Einbindung von Projekten und deren Teilen in unterschiedliche Clouds ist möglich.


Die Verwendung von Clouds, Big Data, AI, Genanalyse wird bereits in absehbarer Zukunft die Menschheit zur Schaffung von personalisierten Medizin führen, wenn viele Krankheiten eliminiert werden noch bevor sie zu Gefahr werden. Neben der Genomforschung gibt es ein großes Potenzial für diese Technologien in solchen Branchen wie Bioinformatik, Biochemie, Pharmakologie, Biotechnologie, etc.


Vor diesem Hintergrund machen viele Nachrichten Hoffnungen – wie zuletzt von Illumina im Januar 2017, auf der Konferenz zum Thema Biotechnologien in San Francisco: neue Ausrüstung der Sequenziergeräte, Novaseq, wird es für im nächsten Jahrzehnt ermöglichen, Kosten für die Entschlüsselung des Genoms von 1 000 Dollar pro Bestellung bis zu 100 Dollar pro Verfahren zu reduzieren. Im Vergleich zu ihren Vorgänger, führen diese Geräte nur 8 Schritte in der Analyse statt 38 aus, ermöglichen es, schnell die Korrektheit der geladenen Daten zu  kontrollieren und führen das Analyse-Verfahren sechsmal schneller.


Mit anderen Worten, wird die Frage der Genomsequenzierung nicht mehr eine finanzielle sein – sie wird vielmehr eine Frage des Gesundheitsverständnisses eines jeden Menschen sein. Schließlich ist die Gesundheitsvorsorge eine persönliche Sache.


Doch bereits heute können wir mit Gewissheit sagen, dass Cloud-Technologien tatsächlich unsere Welt verändern und die Lebensqualität deutlich verbessern. Man kann sogar den Schluss ziehen, dass Clouds Leben retten und die Gesundheit der Menschheit bewahren – wahrscheinlich die bedeutendsten Beispiele, um die Wichtigkeit und das Potenzial dieser Technologie zu unterstreichen.



Quellen, die beim Vorbereiten des Artikels genutzt wurden:


Autor: Alisa Kandeeva

Teilen Sie diesen Artikel