uu.seUppsala universitets publikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Efficient computational methods for applications in genomics
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Tillämpad beräkningsvetenskap.ORCID-id: 0000-0002-6212-539x
2019 (Engelska)Licentiatavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

During the last two decades, advances in molecular technology have facilitated the sequencing and analysis of ancient DNA recovered from archaeological finds, contributing to novel insights into human evolutionary history. As more ancient genetic information has become available, the need for specialized methods of analysis has also increased. In this thesis, we investigate statistical and computational models for analysis of genetic data, with a particular focus on the context of ancient DNA.

The main focus is on imputation, or the inference of missing genotypes based on observed sequence data. We present results from a systematic evaluation of a common imputation pipeline on empirical ancient samples, and show that imputed data can constitute a realistic option for population-genetic analyses. We also discuss preliminary results from a simulation study comparing two methods of phasing and imputation, which suggest that the parametric Li and Stephens framework may be more robust to extremely low levels of sparsity than the parsimonious Browning and Browning model.

An evaluation of methods to handle missing data in the application of PCA for dimensionality reduction of genotype data is also presented. We illustrate that non-overlapping sequence data can lead to artifacts in projected scores, and evaluate different methods for handling unobserved genotypes.

In genomics, as in other fields of research, increasing sizes of data sets are placing larger demands on efficient data management and compute infrastructures. The last part of this thesis addresses the use of cloud resources for facilitating such analysis. We present two different cloud-based solutions, and exemplify them on applications from genomics.

Ort, förlag, år, upplaga, sidor
Uppsala University, 2019.
Serie
IT licentiate theses / Uppsala University, Department of Information Technology, ISSN 1404-5117 ; 2019-006
Nationell ämneskategori
Beräkningsmatematik Genetik
Forskningsämne
Beräkningsvetenskap
Identifikatorer
URN: urn:nbn:se:uu:diva-396409OAI: oai:DiVA.org:uu-396409DiVA, id: diva2:1367712
Handledare
Projekt
eSSENCETillgänglig från: 2019-11-04 Skapad: 2019-11-04 Senast uppdaterad: 2019-11-11Bibliografiskt granskad
Delarbeten
1. An empirical evaluation of genotype imputation of ancient DNA
Öppna denna publikation i ny flik eller fönster >>An empirical evaluation of genotype imputation of ancient DNA
2019 (Engelska)Rapport (Övrigt vetenskapligt)
Serie
Technical report / Department of Information Technology, Uppsala University, ISSN 1404-3203 ; 2019-008
Nationell ämneskategori
Beräkningsmatematik Genetik
Identifikatorer
urn:nbn:se:uu:diva-396336 (URN)
Projekt
eSSENCE
Tillgänglig från: 2019-11-04 Skapad: 2019-11-04 Senast uppdaterad: 2019-11-11Bibliografiskt granskad
2. Evaluation of methods handling missing data in PCA on genotype data: Applications for ancient DNA
Öppna denna publikation i ny flik eller fönster >>Evaluation of methods handling missing data in PCA on genotype data: Applications for ancient DNA
2019 (Engelska)Rapport (Övrigt vetenskapligt)
Serie
Technical report / Department of Information Technology, Uppsala University, ISSN 1404-3203 ; 2019-009
Nationell ämneskategori
Beräkningsmatematik Genetik
Identifikatorer
urn:nbn:se:uu:diva-396346 (URN)
Projekt
eSSENCE
Tillgänglig från: 2019-11-04 Skapad: 2019-11-04 Senast uppdaterad: 2019-11-11Bibliografiskt granskad
3. BAMSI: a multi-cloud service for scalable distributed filtering of massive genome data
Öppna denna publikation i ny flik eller fönster >>BAMSI: a multi-cloud service for scalable distributed filtering of massive genome data
Visa övriga...
2018 (Engelska)Ingår i: BMC Bioinformatics, ISSN 1471-2105, E-ISSN 1471-2105, Vol. 19, s. 240:1-11, artikel-id 240Artikel i tidskrift (Refereegranskat) Published
Nationell ämneskategori
Programvaruteknik Genetik
Identifikatorer
urn:nbn:se:uu:diva-360033 (URN)10.1186/s12859-018-2241-z (DOI)000436517200001 ()29940842 (PubMedID)
Projekt
eSSENCE
Tillgänglig från: 2018-06-26 Skapad: 2018-09-09 Senast uppdaterad: 2019-11-11Bibliografiskt granskad
4. SWEEP: Accelerating scientific research through scalable serverless workflows
Öppna denna publikation i ny flik eller fönster >>SWEEP: Accelerating scientific research through scalable serverless workflows
Visa övriga...
2019 (Engelska)Ingår i: Companion Proc. 12th International Conference on Utility and Cloud Computing, New York: ACM Press, 2019, s. 43-50Konferensbidrag, Publicerat paper (Refereegranskat)
Ort, förlag, år, upplaga, sidor
New York: ACM Press, 2019
Nationell ämneskategori
Programvaruteknik
Identifikatorer
urn:nbn:se:uu:diva-396405 (URN)10.1145/3368235.3368839 (DOI)978-1-4503-7044-8 (ISBN)
Konferens
UCC 2019
Projekt
eSSENCE
Tillgänglig från: 2019-12-02 Skapad: 2019-11-04 Senast uppdaterad: 2019-12-05Bibliografiskt granskad

Open Access i DiVA

fulltext(507 kB)61 nedladdningar
Filinformation
Filnamn FULLTEXT02.pdfFilstorlek 507 kBChecksumma SHA-512
e5af0468d2dcd81a8ba3be4fa7e0c0b89d07346dd22aca8162861e168446ab0e7b845a2dbbac18606a38c8c74b7c4c6f3709712af6413a17a648222d68f0bf15
Typ fulltextMimetyp application/pdf

Personposter BETA

Ausmees, Kristiina

Sök vidare i DiVA

Av författaren/redaktören
Ausmees, Kristiina
Av organisationen
Avdelningen för beräkningsvetenskapTillämpad beräkningsvetenskap
BeräkningsmatematikGenetik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 61 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 356 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf