uu.seUppsala universitets publikasjoner
Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Techniques for finite element methods on modern processors
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Tillämpad beräkningsvetenskap.
2015 (engelsk)Licentiatavhandling, med artikler (Annet vitenskapelig)
Abstract [en]

In this thesis, methods for efficient utilization of modern computer hardware for numerical simulation are considered. In particular, we study techniques for speeding up the execution of finite-element methods.

One of the greatest challenges in finite-element computation is how to efficiently perform the the system matrix assembly efficiently in parallel, due to its complicated memory access pattern. The main difficulty lies in the fact that many entries of the matrix are being updated concurrently by several parallel threads. We consider transactional memory, an exotic hardware feature for concurrent update of shared variables, and conduct benchmarks on a prototype processor supporting it. Our experiments show that transactions can both simplify programming and provide good performance for concurrent updates of floating point data.

Furthermore, we study a matrix-free approach to finite-element computation which avoids the matrix assembly. Motivated by its computational properties, we implement the matrix-free method for execution on graphics processors, using either atomic updates or a mesh coloring approach to handle the concurrent updates. A performance study shows that on the GPU, the matrix-free method is faster than a matrix-based implementation for many element types, and allows for solution of considerably larger problems. This suggests that the matrix-free method can speed up execution of large realistic simulations.

sted, utgiver, år, opplag, sider
Uppsala University, 2015.
Serie
IT licentiate theses / Uppsala University, Department of Information Technology, ISSN 1404-5117 ; 2015-001
HSV kategori
Forskningsprogram
Beräkningsvetenskap
Identifikatorer
URN: urn:nbn:se:uu:diva-242186OAI: oai:DiVA.org:uu-242186DiVA, id: diva2:782743
Veileder
Prosjekter
UPMARCeSSENCETilgjengelig fra: 2015-01-18 Laget: 2015-01-22 Sist oppdatert: 2018-01-11bibliografisk kontrollert
Delarbeid
1. Using hardware transactional memory for high-performance computing
Åpne denne publikasjonen i ny fane eller vindu >>Using hardware transactional memory for high-performance computing
Vise andre…
2011 (engelsk)Inngår i: Proc. 25th International Symposium on Parallel and Distributed Processing Workshops and PhD Forum, Piscataway, NJ: IEEE , 2011, s. 1660-1667Konferansepaper, Publicerat paper (Fagfellevurdert)
sted, utgiver, år, opplag, sider
Piscataway, NJ: IEEE, 2011
HSV kategori
Identifikatorer
urn:nbn:se:uu:diva-158551 (URN)10.1109/IPDPS.2011.322 (DOI)978-1-61284-425-1 (ISBN)
Konferanse
IPDPS Workshop on Multi-Threaded Architectures and Applications
Prosjekter
eSSENCEUPMARC
Tilgjengelig fra: 2011-09-01 Laget: 2011-09-10 Sist oppdatert: 2018-01-12bibliografisk kontrollert
2. Matrix-free finite-element operator application on graphics processing units
Åpne denne publikasjonen i ny fane eller vindu >>Matrix-free finite-element operator application on graphics processing units
2014 (engelsk)Inngår i: Euro-Par 2014: Parallel Processing Workshops, Part II, Springer, 2014, s. 450-461Konferansepaper, Publicerat paper (Fagfellevurdert)
sted, utgiver, år, opplag, sider
Springer, 2014
Serie
Lecture Notes in Computer Science ; 8806
HSV kategori
Identifikatorer
urn:nbn:se:uu:diva-238380 (URN)10.1007/978-3-319-14313-2_38 (DOI)000354785000038 ()978-3-319-14312-5 (ISBN)
Konferanse
7th Workshop on Unconventional High-Performance Computing
Prosjekter
UPMARCeSSENCE
Tilgjengelig fra: 2014-12-11 Laget: 2014-12-11 Sist oppdatert: 2018-01-11bibliografisk kontrollert

Open Access i DiVA

fulltext(1418 kB)467 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 1418 kBChecksum SHA-512
143e9b56c442d9b99cb686f163239105f1d9b251dae9fd9499d816116a2fc7a839a0bfc16577a8e418104c2205d4bb1e0694e61f5920fdbc680566211b0847fa
Type fulltextMimetype application/pdf

Personposter BETA

Ljungkvist, Karl

Søk i DiVA

Av forfatter/redaktør
Ljungkvist, Karl
Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 467 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 1355 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf