uu.seUppsala universitets publikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Techniques for finite element methods on modern processors
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Tillämpad beräkningsvetenskap.
2015 (Engelska)Licentiatavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

In this thesis, methods for efficient utilization of modern computer hardware for numerical simulation are considered. In particular, we study techniques for speeding up the execution of finite-element methods.

One of the greatest challenges in finite-element computation is how to efficiently perform the the system matrix assembly efficiently in parallel, due to its complicated memory access pattern. The main difficulty lies in the fact that many entries of the matrix are being updated concurrently by several parallel threads. We consider transactional memory, an exotic hardware feature for concurrent update of shared variables, and conduct benchmarks on a prototype processor supporting it. Our experiments show that transactions can both simplify programming and provide good performance for concurrent updates of floating point data.

Furthermore, we study a matrix-free approach to finite-element computation which avoids the matrix assembly. Motivated by its computational properties, we implement the matrix-free method for execution on graphics processors, using either atomic updates or a mesh coloring approach to handle the concurrent updates. A performance study shows that on the GPU, the matrix-free method is faster than a matrix-based implementation for many element types, and allows for solution of considerably larger problems. This suggests that the matrix-free method can speed up execution of large realistic simulations.

Ort, förlag, år, upplaga, sidor
Uppsala University, 2015.
Serie
IT licentiate theses / Uppsala University, Department of Information Technology, ISSN 1404-5117 ; 2015-001
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Forskningsämne
Beräkningsvetenskap
Identifikatorer
URN: urn:nbn:se:uu:diva-242186OAI: oai:DiVA.org:uu-242186DiVA, id: diva2:782743
Handledare
Projekt
UPMARCeSSENCETillgänglig från: 2015-01-18 Skapad: 2015-01-22 Senast uppdaterad: 2018-01-11Bibliografiskt granskad
Delarbeten
1. Using hardware transactional memory for high-performance computing
Öppna denna publikation i ny flik eller fönster >>Using hardware transactional memory for high-performance computing
Visa övriga...
2011 (Engelska)Ingår i: Proc. 25th International Symposium on Parallel and Distributed Processing Workshops and PhD Forum, Piscataway, NJ: IEEE , 2011, s. 1660-1667Konferensbidrag, Publicerat paper (Refereegranskat)
Ort, förlag, år, upplaga, sidor
Piscataway, NJ: IEEE, 2011
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
urn:nbn:se:uu:diva-158551 (URN)10.1109/IPDPS.2011.322 (DOI)978-1-61284-425-1 (ISBN)
Konferens
IPDPS Workshop on Multi-Threaded Architectures and Applications
Projekt
eSSENCEUPMARC
Tillgänglig från: 2011-09-01 Skapad: 2011-09-10 Senast uppdaterad: 2018-01-12Bibliografiskt granskad
2. Matrix-free finite-element operator application on graphics processing units
Öppna denna publikation i ny flik eller fönster >>Matrix-free finite-element operator application on graphics processing units
2014 (Engelska)Ingår i: Euro-Par 2014: Parallel Processing Workshops, Part II, Springer, 2014, s. 450-461Konferensbidrag, Publicerat paper (Refereegranskat)
Ort, förlag, år, upplaga, sidor
Springer, 2014
Serie
Lecture Notes in Computer Science ; 8806
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Identifikatorer
urn:nbn:se:uu:diva-238380 (URN)10.1007/978-3-319-14313-2_38 (DOI)000354785000038 ()978-3-319-14312-5 (ISBN)
Konferens
7th Workshop on Unconventional High-Performance Computing
Projekt
UPMARCeSSENCE
Tillgänglig från: 2014-12-11 Skapad: 2014-12-11 Senast uppdaterad: 2018-01-11Bibliografiskt granskad

Open Access i DiVA

fulltext(1418 kB)468 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1418 kBChecksumma SHA-512
143e9b56c442d9b99cb686f163239105f1d9b251dae9fd9499d816116a2fc7a839a0bfc16577a8e418104c2205d4bb1e0694e61f5920fdbc680566211b0847fa
Typ fulltextMimetyp application/pdf

Personposter BETA

Ljungkvist, Karl

Sök vidare i DiVA

Av författaren/redaktören
Ljungkvist, Karl
Av organisationen
Avdelningen för beräkningsvetenskapTillämpad beräkningsvetenskap
Datavetenskap (datalogi)Beräkningsmatematik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 468 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 1360 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf