uu.seUppsala universitets publikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Multithreaded PDE Solvers on Non-Uniform Memory Architectures
Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för teknisk databehandling. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Numerisk analys. (Software Aspects of High-Performance Computing)
2006 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

A trend in parallel computer architecture is that systems with a large shared memory are becoming more and more popular. A shared memory system can be either a uniform memory architecture (UMA) or a cache coherent non-uniform memory architecture (cc-NUMA).

In the present thesis, the performance of parallel PDE solvers on cc-NUMA computers is studied. In particular, we consider the shared namespace programming model, represented by OpenMP. Since the main memory is physically, or geographically distributed over several multi-processor nodes, the latency for local memory accesses is smaller than for remote accesses. Therefore, the geographical locality of the data becomes important.

The focus of the present thesis is to study multithreaded PDE solvers on cc-NUMA systems, in particular their memory access pattern with respect to geographical locality. The questions posed are: (1) How large is the influence on performance of the non-uniformity of the memory system? (2) How should a program be written in order to reduce this influence? (3) Is it possible to introduce optimizations in the computer system for this purpose?

The main conclusion is that geographical locality is important for performance on cc-NUMA systems. This is shown experimentally for a broad range of PDE solvers as well as theoretically using a model involving characteristics of computer systems and applications.

Geographical locality can be achieved through migration directives that are inserted by the programmer or — possibly in the future — automatically by the compiler. On some systems, it can also be accomplished by means of transparent, hardware initiated migration and replication. However, a necessary condition that must be fulfilled if migration is to be effective is that the memory access pattern must not be "speckled", i.e. as few threads as possible shall make accesses to each memory page.

We also conclude that OpenMP is competitive with MPI on cc-NUMA systems if care is taken to get a favourable data distribution.

Ort, förlag, år, upplaga, sidor
Uppsala: Acta Universitatis Upsaliensis , 2006. , s. 33
Serie
Digital Comprehensive Summaries of Uppsala Dissertations from the Faculty of Science and Technology, ISSN 1651-6214 ; 224
Nyckelord [en]
PDE solver, high-performance, NUMA, UMA, OpenMP, MPI, data migration, data replication, thread scheduling, data affinity
Nationell ämneskategori
Programvaruteknik
Forskningsämne
Beräkningsvetenskap
Identifikatorer
URN: urn:nbn:se:uu:diva-7149ISBN: 91-554-6656-7 (tryckt)OAI: oai:DiVA.org:uu-7149DiVA, id: diva2:168886
Disputation
2006-10-20, Room 2446, Polacksbacken, Lägerhyddsvägen 2D, Uppsala, 10:15 (Engelska)
Opponent
Handledare
Tillgänglig från: 2006-09-28 Skapad: 2006-09-28 Senast uppdaterad: 2018-01-13Bibliografiskt granskad
Delarbeten
1. OpenMP versus MPI for PDE solvers based on regular sparse numerical operators
Öppna denna publikation i ny flik eller fönster >>OpenMP versus MPI for PDE solvers based on regular sparse numerical operators
2006 (Engelska)Ingår i: Future generations computer systems, ISSN 0167-739X, E-ISSN 1872-7115, Vol. 22, s. 194-203Artikel i tidskrift (Refereegranskat) Published
Nationell ämneskategori
Programvaruteknik Beräkningsmatematik
Identifikatorer
urn:nbn:se:uu:diva-47210 (URN)10.1016/j.future.2003.09.004 (DOI)000234408800016 ()
Tillgänglig från: 2006-05-23 Skapad: 2006-05-23 Senast uppdaterad: 2018-01-11Bibliografiskt granskad
2. Performance of PDE solvers on a self-optimizing NUMA architecture
Öppna denna publikation i ny flik eller fönster >>Performance of PDE solvers on a self-optimizing NUMA architecture
2002 (Engelska)Ingår i: Parallel Algorithms and Applications, ISSN 1063-7192, E-ISSN 1029-032X, Vol. 17, s. 285-299Artikel i tidskrift (Refereegranskat) Published
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Identifikatorer
urn:nbn:se:uu:diva-66909 (URN)10.1080/01495730208941445 (DOI)
Tillgänglig från: 2006-05-22 Skapad: 2006-05-22 Senast uppdaterad: 2018-01-10Bibliografiskt granskad
3. Improving Geographical Locality of Data for Shared Memory Implementations of PDE Solvers
Öppna denna publikation i ny flik eller fönster >>Improving Geographical Locality of Data for Shared Memory Implementations of PDE Solvers
2004 (Engelska)Ingår i: Computational Science – ICCS 2004, Berlin: Springer-Verlag , 2004, s. 9-16Konferensbidrag, Publicerat paper (Refereegranskat)
Ort, förlag, år, upplaga, sidor
Berlin: Springer-Verlag, 2004
Serie
Lecture Notes in Computer Science ; 3037
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Identifikatorer
urn:nbn:se:uu:diva-71098 (URN)10.1007/b97988 (DOI)
Tillgänglig från: 2007-03-11 Skapad: 2007-03-11 Senast uppdaterad: 2018-01-10Bibliografiskt granskad
4. Geographical locality and dynamic data migration for OpenMP implementations of adaptive PDE solvers
Öppna denna publikation i ny flik eller fönster >>Geographical locality and dynamic data migration for OpenMP implementations of adaptive PDE solvers
2008 (Engelska)Ingår i: OpenMP Shared Memory Parallel Programming, Berlin: Springer-Verlag , 2008, s. 382-393Konferensbidrag, Publicerat paper (Refereegranskat)
Ort, förlag, år, upplaga, sidor
Berlin: Springer-Verlag, 2008
Serie
Lecture Notes in Computer Science ; 4315
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Identifikatorer
urn:nbn:se:uu:diva-17844 (URN)10.1007/978-3-540-68555-5_31 (DOI)000256573200031 ()978-3-540-68554-8 (ISBN)
Projekt
UPMARC
Tillgänglig från: 2008-09-05 Skapad: 2008-09-05 Senast uppdaterad: 2018-01-12Bibliografiskt granskad
5. Performance modelling for parallel PDE solvers on NUMA-systems
Öppna denna publikation i ny flik eller fönster >>Performance modelling for parallel PDE solvers on NUMA-systems
2006 (Engelska)Rapport (Övrigt vetenskapligt)
Serie
Technical report / Department of Information Technology, Uppsala University, ISSN 1404-3203 ; 2006-041
Nationell ämneskategori
Datavetenskap (datalogi) Beräkningsmatematik
Identifikatorer
urn:nbn:se:uu:diva-81930 (URN)
Tillgänglig från: 2008-02-19 Skapad: 2008-02-19 Senast uppdaterad: 2018-01-13Bibliografiskt granskad

Open Access i DiVA

fulltext(390 kB)790 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 390 kBChecksumma MD5
5a847e95df87a45ee0a4263cfb4afa7770446f29a59db477c220107732143c200029eb34
Typ fulltextMimetyp application/pdf
Köp publikationen >>

Personposter BETA

Nordén, Markus

Sök vidare i DiVA

Av författaren/redaktören
Nordén, Markus
Av organisationen
Avdelningen för teknisk databehandlingNumerisk analys
Programvaruteknik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 790 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

isbn
urn-nbn

Altmetricpoäng

isbn
urn-nbn
Totalt: 1440 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf