Hopp til innhold

Dendrogram

Fra Wikipedia, den frie encyklopedi

Et dendrogram (fra gresk dendro «tre» og gramma «tegn») er en grafisk framstilling i form av forgreininger som viser arrangeringen av fenomener som kan ordnes hierarkisk. Dendrogrammer brukes ofte i statistisk biologi for å vise likhet og ulikhet i gensekvenser og kalles da ofte et kladogram.

Et eksempel på hierarkisk data, der forskjellen mellom datapunktene er representert ved avstand mellom punkter i et koordinatsystem:

Raw data

Et hierarkisk ordnet dendrogram av de samme dataene vil kunne se slik ut

Traditional representation

Den øverste rekken representerer data (individuelle observasjoner), linjene lengre ned representerer klynger som enkeltdataene tilhører, og pilene representerer avstand (forskjeller).

Avstanden mellom klynger av sammenslåtte data øker jevnt med det hierarkiske nivået på klyngene. Høyden på hver node er proporsjonal med verdien av forskjellene mellom dattergruppene.

Autoritetsdata