Download
P24-Castro-OntoClue_SWAT4HCLS_frl6440397_coverpage.pdf 435,28KB
WeightNameValue
1000 Titel
  • OntoClue, a framework to compare vector-based approaches for document relatedness using the RELISH corpus - Poster
1000 Titelzusatz
  • A comparison on vector-based approaches for document similarity in the RELISH corpus - Poster
1000 Autor/in
  1. Ravinder, Rohitha |
  2. Fellerhoff, Tim |
  3. Dadi, Vishnu Vardhan |
  4. Geist, Lukas |
  5. Rocamora, Guillermo |
  6. Talha, Muhammad |
  7. Rebholz-Schuhmann, Dietrich |
  8. Castro, Leyla Jael |
1000 Erscheinungsjahr 2023
1000 Publikationstyp
  1. Kongressschrift |
1000 Online veröffentlicht
  • 2023-03
1000 Erschienen in
1000 FRL-Sammlung
1000 Übergeordneter Kongress
1000 Lizenz
1000 Verlagsversion
  • https://www.swat4ls.org/workshops/basel2023/scientific-programme-2023/ |
1000 Ergänzendes Material
  • https://github.com/zbmed-semtec/medline-preprocessing |
  • https://github.com/zbmed-semtec/whatizit-dictionary-ner |
  • https://github.com/zbmed-semtec/word2doc2vec-doc-relevance |
  • https://github.com/zbmed-semtec/doc2vec-doc-relevance |
  • https://github.com/zbmed-semtec/hybrid-dictionary-ner-doc2vec-doc-relevance |
  • https://github.com/zbmed-semtec/bert-embeddings-doc-relevance |
1000 Publikationsstatus
1000 Begutachtungsstatus
1000 Sprache der Publikation
1000 Abstract/Summary
  • The continuous increase of biomedical scholarly publications makes it challenging to construct document recommendation algorithms to navigate through literature, an important feature for researchers to keep up with relevant publications. Understanding semantic relatedness and similarity between two documents could improve document recommendations. The objective of this study is performing a comparative analysis of vector-based approaches to assess document similarity in the RELISH corpus. Here we present our approach to compare five different techniques to generate vectors representing the text in the documents. These techniques employ a combination of various Natural Language Processing frameworks such as Word2Vec, Doc2Vec, dictionary-based Named Entity Recognition as well as state-of-the-art models based on BERT.
1000 Sacherschließung
lokal Named Entity Recognition
lokal Document similarity
lokal Word embeddings
1000 Fächerklassifikation (DDC)
1000 DOI 10.4126/FRL01-006440397 |
1000 Liste der Beteiligten
  1. https://frl.publisso.de/adhoc/uri/UmF2aW5kZXIsIFJvaGl0aGE=|https://orcid.org/0000-0002-8725-1317|https://orcid.org/0000-0002-3082-7522|https://orcid.org/0000-0002-2910-7982|https://frl.publisso.de/adhoc/uri/Um9jYW1vcmEsIEd1aWxsZXJtbw==|https://frl.publisso.de/adhoc/uri/VGFsaGEsIE11aGFtbWFk|https://orcid.org/0000-0002-1018-0370|https://orcid.org/0000-0003-3986-0510
1000 Label
1000 Förderer
  1. Deutsche Forschungsgemeinschaft |
  2. Gemeinsame Wissenschaftskonferenz (GWK-Bonn) |
  3. Bundesministerium für Bildung und Forschung |
1000 Fördernummer
  1. 407518790; NFDI 34/1
  2. -
  3. 031A532B; 031A533A; 031A533B; 031A534A; 031A535A; 031A537A; 031A537B; 031A537C; 031A537D; 031A538A
1000 Förderprogramm
  1. STELLA project; NFDI4DataScience project
  2. NFDI4DataScience project
  3. German Network for Bioinformatics Infrastructure (de.NBI) Cloud
1000 Dateien
1000 Förderung
  1. 1000 joinedFunding-child
    1000 Förderer Deutsche Forschungsgemeinschaft |
    1000 Förderprogramm STELLA project; NFDI4DataScience project
    1000 Fördernummer 407518790; NFDI 34/1
  2. 1000 joinedFunding-child
    1000 Förderer Gemeinsame Wissenschaftskonferenz (GWK-Bonn) |
    1000 Förderprogramm NFDI4DataScience project
    1000 Fördernummer -
  3. 1000 joinedFunding-child
    1000 Förderer Bundesministerium für Bildung und Forschung |
    1000 Förderprogramm German Network for Bioinformatics Infrastructure (de.NBI) Cloud
    1000 Fördernummer 031A532B; 031A533A; 031A533B; 031A534A; 031A535A; 031A537A; 031A537B; 031A537C; 031A537D; 031A538A
1000 Objektart article
1000 Beschrieben durch
1000 @id frl:6440397.rdf
1000 Erstellt am 2023-02-24T11:08:53.439+0100
1000 Erstellt von 25
1000 beschreibt frl:6440397
1000 Bearbeitet von 320
1000 Zuletzt bearbeitet Mon Mar 06 12:02:10 CET 2023
1000 Objekt bearb. Mon Mar 06 12:01:57 CET 2023
1000 Vgl. frl:6440397
1000 Oai Id
  1. oai:frl.publisso.de:frl:6440397 |
1000 Sichtbarkeit Metadaten public
1000 Sichtbarkeit Daten public
1000 Gegenstand von

View source