uu.seUppsala universitets publikasjoner
Endre søk
Begrens søket
1 - 9 of 9
RefereraExporteraLink til resultatlisten
Permanent link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Treff pr side
  • 5
  • 10
  • 20
  • 50
  • 100
  • 250
Sortering
  • Standard (Relevans)
  • Forfatter A-Ø
  • Forfatter Ø-A
  • Tittel A-Ø
  • Tittel Ø-A
  • Type publikasjon A-Ø
  • Type publikasjon Ø-A
  • Eldste først
  • Nyeste først
  • Skapad (Eldste først)
  • Skapad (Nyeste først)
  • Senast uppdaterad (Eldste først)
  • Senast uppdaterad (Nyeste først)
  • Disputationsdatum (tidligste først)
  • Disputationsdatum (siste først)
  • Standard (Relevans)
  • Forfatter A-Ø
  • Forfatter Ø-A
  • Tittel A-Ø
  • Tittel Ø-A
  • Type publikasjon A-Ø
  • Type publikasjon Ø-A
  • Eldste først
  • Nyeste først
  • Skapad (Eldste først)
  • Skapad (Nyeste først)
  • Senast uppdaterad (Eldste først)
  • Senast uppdaterad (Nyeste først)
  • Disputationsdatum (tidligste først)
  • Disputationsdatum (siste først)
Merk
Maxantalet träffar du kan exportera från sökgränssnittet är 250. Vid större uttag använd dig av utsökningar.
  • 1.
    Ayyalasomayajula, Kalyan Ram
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Learning based segmentation and generation methods for handwritten document images2019Doktoravhandling, med artikler (Annet vitenskapelig)
    Abstract [en]

    Computerized analysis of handwritten documents is an active research area in image analysis and computer vision. The goal is to create tools that can be available for use at university libraries and for researchers in the humanities. Working with large collections of handwritten documents is very time consuming and many old books and letters remain unread for centuries. Efficient computerized methods could help researchers in history, philology and computer linguistics to cost-effectively conduct a whole new type of research based on large collections of documents. The thesis makes a contribution to this area through the development of methods based on machine learning. The passage of time degrades historical documents. Humidity, stains, heat, mold and natural aging of the materials for hundreds of years make the documents increasingly difficult to interpret. The first half of the dissertation is therefore focused on cleaning the visual information in these documents by image segmentation methods based on energy minimization and machine learning. However, machine learning algorithms learn by imitating what is expected of them. One prerequisite for these methods to work is that ground truth is available. This causes a problem for historical documents because there is a shortage of experts who can help to interpret and interpret them. The second part of the thesis is therefore about automatically creating synthetic documents that are similar to handwritten historical documents. Because they are generated from a known text, they have a given facet. The visual content of the generated historical documents includes variation in the writing style and also imitates degradation factors to make the images realistic. When machine learning is trained on synthetic images of handwritten text, with a known facet, in many cases they can even give an even better result for real historical documents.

    Delarbeid
    1. Document binarization using topological clustering guided Laplacian Energy Segmentation
    Åpne denne publikasjonen i ny fane eller vindu >>Document binarization using topological clustering guided Laplacian Energy Segmentation
    2014 (engelsk)Inngår i: Proceedings International Conference on Frontiers in Handwriting Recognition (ICFHR), 2014, 2014, s. 523-528Konferansepaper, Publicerat paper (Fagfellevurdert)
    Abstract [en]

    The current approach for text binarization proposesa clustering algorithm as a preprocessing stage toan energy-based segmentation method. It uses a clusteringalgorithm to obtain a coarse estimate of the background (BG)and foreground (FG) pixels. These estimates are used as a priorfor the source and sink points of a graph cut implementation,which is used to efficiently find the minimum energy solution ofan objective function to separate the BG and FG. The binaryimage thus obtained is used to refine the edge map that guidesthe graph cut algorithm. A final binary image is obtained byonce again performing the graph cut guided by the refinededges on a Laplacian of the image.

    Serie
    Frontiers in Handwriting Recognition, ISSN 2167-6445 ; 14
    Emneord
    Image Processing; Classification; Machine Learning; Graph-theoretic methods.
    HSV kategori
    Forskningsprogram
    Datavetenskap
    Identifikatorer
    urn:nbn:se:uu:diva-238316 (URN)10.1109/ICFHR.2014.94 (DOI)978-1-4799-4335-7 (ISBN)
    Konferanse
    International Conference on Frontiers in Handwriting Recognition (ICFHR),September 1-4, 2014, Crete, Greece.
    Forskningsfinansiär
    Swedish Research Council, 2012-5743
    Tilgjengelig fra: 2014-12-11 Laget: 2014-12-11 Sist oppdatert: 2019-03-19bibliografisk kontrollert
    2. Historical document binarization combining semantic labeling and graph cuts
    Åpne denne publikasjonen i ny fane eller vindu >>Historical document binarization combining semantic labeling and graph cuts
    2017 (engelsk)Inngår i: Image Analysis: Part I, Springer, 2017, s. 386-396Konferansepaper, Publicerat paper (Fagfellevurdert)
    Abstract [en]

    Most data mining applications on collections of historical documents require binarization of the digitized images as a pre-processing step. Historical documents are often subjected to degradations such as parchment aging, smudges and bleed through from the other side. The text is sometimes printed, but more often handwritten. Mathematical modeling of appearance of the text, background and all kinds of degradations, is challenging. In the current work we try to tackle binarization as pixel classification problem. We first apply semantic segmentation, using fully convolutional neural networks. In order to improve the sharpness of the result, we then apply a graph cut algorithm. The labels from the semantic segmentation are used as approximate estimates of the text and background, with the probability map of background used for pruning the edges in the graph cut. The results obtained show significant improvement over the state of the art approach.

    sted, utgiver, år, opplag, sider
    Springer, 2017
    Serie
    Lecture Notes in Computer Science, ISSN 0302-9743 ; 10269
    HSV kategori
    Forskningsprogram
    Datoriserad bildbehandling
    Identifikatorer
    urn:nbn:se:uu:diva-335335 (URN)10.1007/978-3-319-59126-1_32 (DOI)000454359300032 ()978-3-319-59125-4 (ISBN)
    Konferanse
    SCIA 2017, June 12–14, Tromsø, Norway
    Forskningsfinansiär
    Swedish Research Council, 2012-5743Riksbankens Jubileumsfond, NHS14-2068:1
    Tilgjengelig fra: 2017-05-19 Laget: 2017-12-04 Sist oppdatert: 2019-03-19bibliografisk kontrollert
    3. PDNet: Semantic segmentation integrated with a primal-dual network for document binarization
    Åpne denne publikasjonen i ny fane eller vindu >>PDNet: Semantic segmentation integrated with a primal-dual network for document binarization
    2019 (engelsk)Inngår i: Pattern Recognition Letters, ISSN 0167-8655, E-ISSN 1872-7344, Vol. 121, s. 52-60Artikkel i tidsskrift (Fagfellevurdert) Published
    HSV kategori
    Forskningsprogram
    Datoriserad bildbehandling
    Identifikatorer
    urn:nbn:se:uu:diva-366933 (URN)10.1016/j.patrec.2018.05.011 (DOI)000459876700008 ()
    Forskningsfinansiär
    Swedish Research Council, 2012-5743Riksbankens Jubileumsfond, NHS14-2068:1
    Tilgjengelig fra: 2018-05-16 Laget: 2018-11-27 Sist oppdatert: 2019-04-04bibliografisk kontrollert
    4. Feature evaluation for handwritten character recognition with regressive and generative Hidden Markov Models
    Åpne denne publikasjonen i ny fane eller vindu >>Feature evaluation for handwritten character recognition with regressive and generative Hidden Markov Models
    2016 (engelsk)Inngår i: Advances in Visual Computing: Part I, Springer, 2016, s. 278-287Konferansepaper, Publicerat paper (Fagfellevurdert)
    sted, utgiver, år, opplag, sider
    Springer, 2016
    Serie
    Lecture Notes in Computer Science ; 10072
    HSV kategori
    Forskningsprogram
    Datoriserad bildbehandling
    Identifikatorer
    urn:nbn:se:uu:diva-308662 (URN)10.1007/978-3-319-50835-1_26 (DOI)978-3-319-50834-4 (ISBN)
    Konferanse
    ISVC 2016, December 12–14, Las Vegas, NV
    Prosjekter
    q2b – From Quill to Bytes
    Tilgjengelig fra: 2016-12-10 Laget: 2016-11-29 Sist oppdatert: 2019-03-19bibliografisk kontrollert
    5. CalligraphyNet: Augmenting handwriting generation with quill based stroke width
    Åpne denne publikasjonen i ny fane eller vindu >>CalligraphyNet: Augmenting handwriting generation with quill based stroke width
    2019 (engelsk)Manuskript (preprint) (Annet vitenskapelig)
    Abstract [en]

    Realistic handwritten document generation garners a lot ofinterest from the document research community for its abilityto generate annotated data. In the current approach we haveused GAN-based stroke width enrichment and style transferbased refinement over generated data which result in realisticlooking handwritten document images. The GAN part of dataaugmentation transfers the stroke variation introduced by awriting instrument onto images rendered from trajectories cre-ated by tracking coordinates along the stylus movement. Thecoordinates from stylus movement are augmented with thelearned stroke width variations during the data augmentationblock. An RNN model is then trained to learn the variationalong the movement of the stylus along with the stroke varia-tions corresponding to an input sequence of characters. Thismodel is then used to generate images of words or sentencesgiven an input character string. A document image thus cre-ated is used as a mask to transfer the style variations of the inkand the parchment. The generated image can capture the colorcontent of the ink and parchment useful for creating annotated data.

    HSV kategori
    Forskningsprogram
    Datoriserad bildbehandling
    Identifikatorer
    urn:nbn:se:uu:diva-379633 (URN)
    Konferanse
    26th IEEE International Conference on Image Processing
    Merknad

    Currently under review

    Tilgjengelig fra: 2019-03-19 Laget: 2019-03-19 Sist oppdatert: 2019-04-08
  • 2.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Document Binarization Combining with Graph Cuts and Deep Neural Networks2017Konferansepaper (Annet vitenskapelig)
  • 3.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Document binarization using topological clustering guided Laplacian Energy Segmentation2014Inngår i: Proceedings International Conference on Frontiers in Handwriting Recognition (ICFHR), 2014, 2014, s. 523-528Konferansepaper (Fagfellevurdert)
    Abstract [en]

    The current approach for text binarization proposesa clustering algorithm as a preprocessing stage toan energy-based segmentation method. It uses a clusteringalgorithm to obtain a coarse estimate of the background (BG)and foreground (FG) pixels. These estimates are used as a priorfor the source and sink points of a graph cut implementation,which is used to efficiently find the minimum energy solution ofan objective function to separate the BG and FG. The binaryimage thus obtained is used to refine the edge map that guidesthe graph cut algorithm. A final binary image is obtained byonce again performing the graph cut guided by the refinededges on a Laplacian of the image.

  • 4.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Historical document binarization combining semantic labeling and graph cuts2017Inngår i: Image Analysis: Part I, Springer, 2017, s. 386-396Konferansepaper (Fagfellevurdert)
    Abstract [en]

    Most data mining applications on collections of historical documents require binarization of the digitized images as a pre-processing step. Historical documents are often subjected to degradations such as parchment aging, smudges and bleed through from the other side. The text is sometimes printed, but more often handwritten. Mathematical modeling of appearance of the text, background and all kinds of degradations, is challenging. In the current work we try to tackle binarization as pixel classification problem. We first apply semantic segmentation, using fully convolutional neural networks. In order to improve the sharpness of the result, we then apply a graph cut algorithm. The labels from the semantic segmentation are used as approximate estimates of the text and background, with the probability map of background used for pruning the edges in the graph cut. The results obtained show significant improvement over the state of the art approach.

  • 5.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Semantic Labeling using Convolutional Networks coupled with Graph-Cuts for Document binarization2017Konferansepaper (Annet vitenskapelig)
  • 6.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Topological clustering guided document binarization2015Rapport (Annet vitenskapelig)
    Abstract [en]

    The current approach for text binarization proposes a clustering algorithm as a preprocessing stage to an energy-based segmentation method. It uses a clustering algorithm to obtain a coarse estimate of the background (BG) and foreground (FG) pixels. These estimates are usedas a prior for the source and sink points of a graph cut implementation, which is used to efficiently find the minimum energy solution of an objective function to separate the BG and FG. The binary image thus obtained is used to refine the edge map that guides the graph cut algorithm. A final binary image is obtained by once again performing the graph cut guided by the refined edges on Laplacian of the image.

  • 7.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Malmberg, Filip
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    PDNet: Semantic segmentation integrated with a primal-dual network for document binarization2019Inngår i: Pattern Recognition Letters, ISSN 0167-8655, E-ISSN 1872-7344, Vol. 121, s. 52-60Artikkel i tidsskrift (Fagfellevurdert)
    Fulltekst tilgjengelig fra 2020-05-17 16:13
  • 8.
    Ayyalasomayajula, Kalyan Ram
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Nettelblad, Carl
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för beräkningsvetenskap.
    Brun, Anders
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Avdelningen för visuell information och interaktion. Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Feature evaluation for handwritten character recognition with regressive and generative Hidden Markov Models2016Inngår i: Advances in Visual Computing: Part I, Springer, 2016, s. 278-287Konferansepaper (Fagfellevurdert)
  • 9.
    Dhara, Ashis Kumar
    et al.
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Ayyalasomayajula, Kalyan Ram
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Arvids, Erik
    Uppsala universitet, Medicinska och farmaceutiska vetenskapsområdet, Medicinska fakulteten, Institutionen för kirurgiska vetenskaper, Radiologi.
    Fahlström, Markus
    Uppsala universitet, Medicinska och farmaceutiska vetenskapsområdet, Medicinska fakulteten, Institutionen för kirurgiska vetenskaper, Radiologi.
    Wikström, Johan
    Uppsala universitet, Medicinska och farmaceutiska vetenskapsområdet, Medicinska fakulteten, Institutionen för kirurgiska vetenskaper, Radiologi.
    Larsson, Elna-Marie
    Uppsala universitet, Medicinska och farmaceutiska vetenskapsområdet, Medicinska fakulteten, Institutionen för kirurgiska vetenskaper, Radiologi.
    Strand, Robin
    Uppsala universitet, Teknisk-naturvetenskapliga vetenskapsområdet, Matematisk-datavetenskapliga sektionen, Institutionen för informationsteknologi, Bildanalys och människa-datorinteraktion.
    Segmentation of Post-operative Glioblastoma in MRI by U-Net with Patient-specific Interactive Refinement2018Inngår i: Proceedings, Brain Lesion (BrainLes) workshop, 2018Konferansepaper (Fagfellevurdert)
    Abstract [en]

    Accurate volumetric change estimation of glioblastoma is very important for post-surgical treatment follow-up. In this paper, an interactive segmentation method was developed and evaluated with the aim to guide volumetric estimation of glioblastoma. U-Net based fully convolutional network is used for initial segmentation of glioblastoma from post contrast MR images. The max flow algorithm is applied on the probability map of U-Net to update the initial segmentation and the result is displayed to the user for interactive refinement. Network update is performed based on the corrected contour by considering patient specific learning to deal with large context variations among dierent images. The proposed method is evaluated on a clinical MR image databas eof 15 glioblastoma patients with longitudinal scan data. The experimental results depict an improvement of segmentation performance due to patient specific fine-tuning. The proposed method is computationally fast and efficient as compared to state-of-the-art interactive segmentation tools. This tool could be useful for post-surgical treatment follow-upwith minimal user intervention.

1 - 9 of 9
RefereraExporteraLink til resultatlisten
Permanent link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf