no-cover

Bwa betriebswirtschaftliche auswertung Muster

Like
15
0
Wednesday, 15 July 2020

In diesem Beitrag befürworten wir eine High-Level-Programmiermethodik für NgS-Ausrichtungstools der nächsten Generation für Produktivität und absolute Leistung. Wir analysieren das Problem der parallelen Ausrichtung und überprüfen die Parallelisierungsstrategien der beliebtesten Ausrichtungswerkzeuge, die alle zu einem einzigen parallelen Paradigma abstrahiert werden können. Wir vergleichen diese Tools mit ihrer Portierung auf das FastFlow-Muster-basierte Programmierframework, das Programmierern parallele Level-Muster bietet. Durch die Verwendung eines High-Level-Ansatzes werden Programmierer von allen komplexen Aspekten der parallelen Programmierung befreit, wie z. B. Synchronisationsprotokolle und Aufgabenplanung, wodurch mehr Möglichkeiten für eine nahtlose Leistungsoptimierung erhalten. In dieser Arbeit zeigen wir einige Anwendungsfälle, in denen es durch die Verwendung eines high-level-Ansatzes zur Parallelisierung von NGS-Tools möglich ist, eine vergleichbare oder sogar bessere absolute Leistung für alle verwendeten Datensätze zu erzielen. Wie im nächsten Abschnitt gezeigt, vereinfacht die Einführung eines technischen Master-Worker-Musters die Arbeit, garantiert die Portabilität der Anwendung und bietet der Anwendung eine gute Leistung. Diese Annahme wurde auf zwei Aligner angewendet, Bowtie2 und BWA-MEM. Um definitiv zu behaupten, dass das vorgeschlagene Muster das beste für jeden Aligner ist, sollten wir es auf jedem Werkzeug testen.

Es ist schwierig wegen ihrer ständig steigenden Zahl, aber wir können sagen, dass dieses Muster aufgrund seiner Natur dazu beiträgt, sowohl den Parallelisierungsprozess als auch weitere Optimierungen zu vereinfachen. Parallele Entwurfsmuster haben das Potenzial, eine radikale Veränderung des parallelen Programmierszenarios herbeizuführen, so dass ein neues paralleles Programm in der Lage sein wird, die hohe Parallelität der Hardwarehersteller auszunutzen [32]. Parallele Entwurfsmuster machen Programmieraufgaben einfacher und der gesamte Anwendungsentwicklungsprozess effizienter. Sie bieten erprobte und effiziente Parallelitätsnutzungsmuster als kompositorische Bausteine, ohne Dasszusgung, Abstimmung und Aufrechterhaltung von Ad-hoc-Lösungen erforderlich sind. Dem Programmierer wird somit ein höheres Maß an Abstraktion in Bezug auf den traditionelleren HPC-Ansatz angeboten. Diese Variante wurde von Mutect2 und VarDict für BWA und Minimap2 gehustet. Das scheint ein Muster für beide Datensätze zu sein: Die meisten Strelka2 FN wurden sowohl von Mutect2 als auch von VarDict gehustet (konsequent im Fall BWA und Minimap2). Es gibt eine dramatische Änderung der Abdeckungsgleichmäßigkeit, wenn Aligner dieselben Daten (simuliert von einem einzelnen Chromosom) dem gesamten Genom zuordnen (siehe Abb.

4A). Wir können ein nahezu gleiches Muster synchroner leseerschöpfter Bereiche (Lücken) für alle Aligner beobachten. Die Lücken haben eine charakteristische Länge von 1–10 kpb (siehe Abb. 5). Und der Unterschied zwischen gewöhnlichen und “zuverlässigen” Verteilungen wurde viel geringer (Abb. 4B). Wir portierten Bowtie2 und BWA zusätzlich zum musterbasierten FastFlow-Parallel-Programmierframework für C++. Die Portierung erforderte die Änderung einiger Codezeilen (von mehreren zehntausend) mit einem geschätzten Programmieraufwand von wenigen Tagen.

Comments are closed.