uu.seUppsala universitets publikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
BAMSI: a multi-cloud service for scalable distributed filtering of massive genome data
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Tillämpad beräkningsvetenskap.ORCID-id: 0000-0002-6212-539X
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Tillämpad beräkningsvetenskap.ORCID-id: 0000-0003-0302-6276
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Tillämpad beräkningsvetenskap.ORCID-id: 0000-0001-7273-7923
Visa övriga samt affilieringar
2018 (Engelska)Ingår i: BMC Bioinformatics, ISSN 1471-2105, E-ISSN 1471-2105, Vol. 19, s. 240:1-11, artikel-id 240Artikel i tidskrift (Refereegranskat) Published
Ort, förlag, år, upplaga, sidor
2018. Vol. 19, s. 240:1-11, artikel-id 240
Nationell ämneskategori
Programvaruteknik Genetik
Identifikatorer
URN: urn:nbn:se:uu:diva-360033DOI: 10.1186/s12859-018-2241-zISI: 000436517200001PubMedID: 29940842OAI: oai:DiVA.org:uu-360033DiVA, id: diva2:1246661
Projekt
eSSENCETillgänglig från: 2018-06-26 Skapad: 2018-09-09 Senast uppdaterad: 2019-11-11Bibliografiskt granskad
Ingår i avhandling
1. Efficient computational methods for applications in genomics
Öppna denna publikation i ny flik eller fönster >>Efficient computational methods for applications in genomics
2019 (Engelska)Licentiatavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

During the last two decades, advances in molecular technology have facilitated the sequencing and analysis of ancient DNA recovered from archaeological finds, contributing to novel insights into human evolutionary history. As more ancient genetic information has become available, the need for specialized methods of analysis has also increased. In this thesis, we investigate statistical and computational models for analysis of genetic data, with a particular focus on the context of ancient DNA.

The main focus is on imputation, or the inference of missing genotypes based on observed sequence data. We present results from a systematic evaluation of a common imputation pipeline on empirical ancient samples, and show that imputed data can constitute a realistic option for population-genetic analyses. We also discuss preliminary results from a simulation study comparing two methods of phasing and imputation, which suggest that the parametric Li and Stephens framework may be more robust to extremely low levels of sparsity than the parsimonious Browning and Browning model.

An evaluation of methods to handle missing data in the application of PCA for dimensionality reduction of genotype data is also presented. We illustrate that non-overlapping sequence data can lead to artifacts in projected scores, and evaluate different methods for handling unobserved genotypes.

In genomics, as in other fields of research, increasing sizes of data sets are placing larger demands on efficient data management and compute infrastructures. The last part of this thesis addresses the use of cloud resources for facilitating such analysis. We present two different cloud-based solutions, and exemplify them on applications from genomics.

Ort, förlag, år, upplaga, sidor
Uppsala University, 2019
Serie
IT licentiate theses / Uppsala University, Department of Information Technology, ISSN 1404-5117 ; 2019-006
Nationell ämneskategori
Beräkningsmatematik Genetik
Forskningsämne
Beräkningsvetenskap
Identifikatorer
urn:nbn:se:uu:diva-396409 (URN)
Handledare
Projekt
eSSENCE
Tillgänglig från: 2019-11-04 Skapad: 2019-11-04 Senast uppdaterad: 2019-11-11Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextPubMed

Personposter BETA

Ausmees, KristiinaToor, Salman Z.Hellander, AndreasNettelblad, Carl

Sök vidare i DiVA

Av författaren/redaktören
Ausmees, KristiinaToor, Salman Z.Hellander, AndreasNettelblad, Carl
Av organisationen
Avdelningen för beräkningsvetenskapTillämpad beräkningsvetenskap
I samma tidskrift
BMC Bioinformatics
ProgramvaruteknikGenetik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
pubmed
urn-nbn

Altmetricpoäng

doi
pubmed
urn-nbn
Totalt: 471 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf