Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-1612
Authors: Wiebringhaus, Thomas
Title: Topological aspects of the human protein interaction network
Online publication date: 18-Dec-2009
Year of first publication: 2009
Language: english
Abstract: It is currently widely accepted that the understanding of complex cell functions depends on an integrated network theoretical approach and not on an isolated view of the different molecular agents. Aim of this thesis was the examination of topological properties that mirror known biological aspects by depicting the human protein network with methods from graph- and network theory. The presented network is a partial human interactome of 9222 proteins and 36324 interactions, consisting of single interactions reliably extracted from peer-reviewed scientific publications. In general, one can focus on intra- or intermodular characteristics, where a functional module is defined as "a discrete entity whose function is separable from those of other modules". It is found that the presented human network is also scale-free and hierarchically organised, as shown for yeast networks before. The interactome also exhibits proteins with high betweenness and low connectivity which are biologically analyzed and interpreted here as shuttling proteins between organelles (e.g. ER to Golgi, internal ER protein translocation, peroxisomal import, nuclear pores import/export) for the first time. As an optimisation for finding proteins that connect modules, a new method is developed here based on proteins located between highly clustered regions, rather than regarding highly connected regions. As a proof of principle, the Mediator complex is found in first place, the prime example for a connector complex. Focusing on intramodular aspects, the measurement of k-clique communities discriminates overlapping modules very well. Twenty of the largest identified modules are analysed in detail and annotated to known biological structures (e.g. proteasome, the NFκB-, TGF-β complex). Additionally, two large and highly interconnected modules for signal transducer and transcription factor proteins are revealed, separated by known shuttling proteins. These proteins yield also the highest number of redundant shortcuts (by calculating the skeleton), exhibit the highest numbers of interactions and might constitute highly interconnected but spatially separated rich-clubs either for signal transduction or for transcription factors. This design principle allows manifold regulatory events for signal transduction and enables a high diversity of transcription events in the nucleus by a limited set of proteins. Altogether, biological aspects are mirrored by pure topological features, leading to a new view and to new methods that assist the annotation of proteins to biological functions, structures and subcellular localisations. As the human protein network is one of the most complex networks at all, these results will be fruitful for other fields of network theory and will help understanding complex network functions in general.
Es ist mittlerweile anerkannt, dass das Verständnis komplexer Zellfunktionen einen integrierten netzwerktheoretischen Ansatz und nicht die isolierte Sichtweise der Funktion einzelner Faktoren bedingt. Ziel dieser Arbeit war es, topologische Methoden zu überprüfen und zu entwickeln, die bekannte biologische Aspekte widerspiegeln, indem das Netzwerk mit graphen- und netzwerktheoretischen Methoden dargestellt wird. Das hier vorgestellte Netzwerk ist ein partielles menschliches Interaktom mit 9222 Proteinen und 36324 Interaktionen, bestehend aus einzelnen Interaktionen, welche aus begutachteten wissenschaftlichen Veröffentlichungen extrahiert wurden. Generell kann man auf intra- oder intermodulare Charakteristiken fokussieren, wobei ein funktionelles Modul als "eine diskrete Einheit dessen Funktion von der anderer Module verschieden ist" definiert wird. Es wurde gefunden, dass das untersuchte menschliche Netzwerk skaleninvariant und hierarchisch organisiert ist, wie zuvor für Hefenetzwerke gezeigt wurde. Das Interaktom weist Proteine mit einer hohen betweenness und einer niedrigen Konnektionierung auf, welche hier zum ersten Mal biologisch als Shuttlingproteine zwischen Organellen analysiert und interpretiert wurden (z.B. ER zu Golgi, interne ER-Proteintranslokation, peroxisomaler Transport, Import/ Export durch nukleäre Poren). Als Optimierung für das Auffinden von Proteinen, die Module konnektionieren, wurde eine neue Methode entwickelt, die auf Proteine basiert, die zwischen hochvernetzten und nicht hochkonnektionierten Regionen lokalisiert sind. Als Nachweis der Methode, wurde der Mediatorkomplex an erster Stelle gefunden, das beste Beispiel für einen Konnektorkomplex. Auf intramodulare Aspekte bezogen, unterscheidet die Methode der k-clique communities überlappende Module. Zwanzig der größten identifizierten Module sind detailliert analysiert und bekannten biologischen Strukturen zugeordnet worden (z.B. Proteasom, NFκB-, TGFβ-Komplex). Zusätzlich wurden zwei große und hochvernetzte Module für Signaltransduktions und Transkriptionsproteine gefunden, die durch bekannte Shuttlingproteine getrennt sind. Diese Proteine weisen auch die höchste Anzahl an redundanten shortcuts auf (durch Berechnung des skeletons), haben die höchste Anzahl an Interaktionen und könnten hochvernetzte aber räumlich getrennte rich-clubs, entweder für Signaltransduktions- oder Transkriptionsfaktoren darstellen. Dieses Designprinzip ermöglicht vielseitige regulatorische Möglichkeiten, um Signale zu translozieren und eine hohe Diversität an Transkriptionsmöglichkeiten im Nukleus mit einer geringen Anzahl von Proteinen umzusetzen. Zusammenfassend lässt sich sagen, dass biologische Aspekte über bloße topologische Eigenschaften widergespiegelt werden, dies führt zu einer neuen Sichtweise und zu neuen Methoden, die bei der Zuordnung von Proteinen zu biologischen Funktionen, Strukturen und subzellulärer Lokalisation assistieren. Da das menschliche Proteinnetzwerk eines der komplexesten Netwerke überhaupt ist, werden diese Ergebnisse gewinnbringend für andere Bereiche der Netzwerktheorie sein und dabei helfen komplexe Netzwerke generell zu verstehen.
DDC: 500 Naturwissenschaften
500 Natural sciences and mathematics
Institution: Johannes Gutenberg-Universität Mainz
Department: FB 10 Biologie
Place: Mainz
ROR: https://ror.org/023b0x485
DOI: http://doi.org/10.25358/openscience-1612
URN: urn:nbn:de:hebis:77-21589
Version: Original work
Publication type: Dissertation
License: In Copyright
Information on rights of use: https://rightsstatements.org/vocab/InC/1.0/
Appears in collections:JGU-Publikationen

Files in This Item:
  File Description SizeFormat
Thumbnail
2158.pdf9.18 MBAdobe PDFView/Open