Loading…
Dissertation/ Thesis
Non-negative matrix factorization for integrative clustering
Brdar Sanja
Saved in:
Title | Non-negative matrix factorization for integrative clustering |
---|---|
Authors | Brdar Sanja |
Publication Year |
2016
|
Description |
Integrative approaches are motivated by the desired improvement ofrobustness, stability and accuracy. Clustering, the prevailing technique forpreliminary and exploratory analysis of experimental data, may benefit fromintegration across multiple partitions. In this thesis we have proposedintegration methods based on non-negative matrix factorization that can fuseclusterings stemming from different data sets, different data preprocessingsteps or different sub-samples of objects or features. Proposed methods areevaluated from several points of view on typical machine learning data sets,synthetics data, and above all, on data coming form bioinformatics realm,which rise is fuelled by technological revolutions in molecular biology. For avast amounts of 'omics' data that are nowadays available sophisticatedcomputational methods are necessary. We evaluated methods on problemfrom cancer genomics, functional genomics and metagenomics.
Предмет истраживања докторске дисертације су алгоритми кластеровања,односно груписања података, и могућности њиховог унапређењаинтегративним приступом у циљу повећања поузданости, робустности наприсуство шума и екстремних вредности у подацима, омогућавања фузијеподатака. У дисертацији су предложене методе засноване на ненегативнојфакторизацији матрице. Методе су успешно имплементиране и детаљноанализиране на разноврсним подацима са UCI репозиторијума исинтетичким подацима које се типично користе за евалуацију новихалгоритама и поређење са већ постојећим методама. Већи деодисертације посвећен је примени у домену биоинформатике која обилујехетерогеним подацима и бројним изазовним задацима. Евалуација јеизвршена на подацима из домена функционалне геномике, геномике рака иметагеномике. Predmet istraživanja doktorske disertacije su algoritmi klasterovanja,odnosno grupisanja podataka, i mogućnosti njihovog unapređenjaintegrativnim pristupom u cilju povećanja pouzdanosti, robustnosti naprisustvo šuma i ekstremnih vrednosti u podacima, omogućavanja fuzijepodataka. U disertaciji su predložene metode zasnovane na nenegativnojfaktorizaciji matrice. Metode su uspešno implementirane i detaljnoanalizirane na raznovrsnim podacima sa UCI repozitorijuma isintetičkim podacima koje se tipično koriste za evaluaciju novihalgoritama i poređenje sa već postojećim metodama. Veći deodisertacije posvećen je primeni u domenu bioinformatike koja obilujeheterogenim podacima i brojnim izazovnim zadacima. Evaluacija jeizvršena na podacima iz domena funkcionalne genomike, genomike raka imetagenomike. |
Document Type |
Thesis
|
Language |
English
|
Publisher Information |
Univerzitet u Novom Sadu, Fakultet tehničkih nauka u Novom Sadu; University of Novi Sad, Faculty of Technical Sciences at Novi Sad, 2016.
|
Subject Terms |
clustering, ensemble clustering, non-negative matrix factorization, datafusion, bioinformatics, кластеровање података, интегративно кластеровање, ненегативнафакторизација матрице, фузија података, биоинформатика, klasterovanje podataka, integrativno klasterovanje, nenegativnafaktorizacija matrice, fuzija podataka, bioinformatika
|