<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="cs">
	<id>https://infopedia.cz/index.php?action=history&amp;feed=atom&amp;title=Klastrov%C3%A1n%C3%AD</id>
	<title>Klastrování - Historie editací</title>
	<link rel="self" type="application/atom+xml" href="https://infopedia.cz/index.php?action=history&amp;feed=atom&amp;title=Klastrov%C3%A1n%C3%AD"/>
	<link rel="alternate" type="text/html" href="https://infopedia.cz/index.php?title=Klastrov%C3%A1n%C3%AD&amp;action=history"/>
	<updated>2026-05-20T17:57:29Z</updated>
	<subtitle>Historie editací této stránky</subtitle>
	<generator>MediaWiki 1.44.2</generator>
	<entry>
		<id>https://infopedia.cz/index.php?title=Klastrov%C3%A1n%C3%AD&amp;diff=23042&amp;oldid=prev</id>
		<title>Filmedy: Nahrazení textu „\*\*([^ ][^*]*)\*\*“ textem „&#039;&#039;&#039;$1&#039;&#039;&#039;“</title>
		<link rel="alternate" type="text/html" href="https://infopedia.cz/index.php?title=Klastrov%C3%A1n%C3%AD&amp;diff=23042&amp;oldid=prev"/>
		<updated>2026-01-05T01:35:59Z</updated>

		<summary type="html">&lt;p&gt;Nahrazení textu „\*\*([^ ][^*]*)\*\*“ textem „&amp;#039;&amp;#039;&amp;#039;$1&amp;#039;&amp;#039;&amp;#039;“&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;cs&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Starší verze&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Verze z 5. 1. 2026, 03:35&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l35&quot;&gt;Řádek 35:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Řádek 35:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;[[Hierarchické shlukování]] (Hierarchical Clustering):&amp;#039;&amp;#039;&amp;#039;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;[[Hierarchické shlukování]] (Hierarchical Clustering):&amp;#039;&amp;#039;&amp;#039;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Vytváří hierarchii klastrů, která může být reprezentována dendrogramem (stromovou strukturou). Existují dva hlavní přístupy:&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Vytváří hierarchii klastrů, která může být reprezentována dendrogramem (stromovou strukturou). Existují dva hlavní přístupy:&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;**&lt;/del&gt;* &#039;&#039;&#039;Aglomerativní (zdola nahoru):&#039;&#039;&#039; Každý [[data|datový bod]] začíná jako samostatný klastr, a poté jsou postupně spojovány nejbližší klastry.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&#039;&#039;&#039;&lt;/ins&gt;* &#039;&#039;&#039;Aglomerativní (zdola nahoru):&#039;&#039;&#039; Každý [[data|datový bod]] začíná jako samostatný klastr, a poté jsou postupně spojovány nejbližší klastry.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;**&lt;/del&gt;* &#039;&#039;&#039;Divizivní (shora dolů):&#039;&#039;&#039; Všechny [[data|datové body]] začínají v jednom klastru, který je postupně rozdělován na menší klastry.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&#039;&#039;&#039;&lt;/ins&gt;* &#039;&#039;&#039;Divizivní (shora dolů):&#039;&#039;&#039; Všechny [[data|datové body]] začínají v jednom klastru, který je postupně rozdělován na menší klastry.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Nevyžaduje předem znát počet klastrů, vizuálně interpretovatelné dendrogramem.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Nevyžaduje předem znát počet klastrů, vizuálně interpretovatelné dendrogramem.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Výpočetně náročné pro velké [[datový set|datové sady]], jednou vytvořené spojení/rozdělení nelze vrátit.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Výpočetně náročné pro velké [[datový set|datové sady]], jednou vytvořené spojení/rozdělení nelze vrátit.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Filmedy</name></author>
	</entry>
	<entry>
		<id>https://infopedia.cz/index.php?title=Klastrov%C3%A1n%C3%AD&amp;diff=2340&amp;oldid=prev</id>
		<title>Filmedy: založena nová stránka s textem „{{K rozšíření}} {{Infobox Statistika | Název = Klastrování | Obrázek = Clustering_example.svg | Popis obrázku = Příklad shlukování datových bodů do tří klastrů | Obor = Strojové učení (Učení bez učitele), Statistika, Datová věda | Definice = Úloha seskupování sady objektů tak, aby objekty ve stejném shluku (klastru) byly podobnější než objekty v jiných shlucích. | Typ = Učení bez učitele | C…“</title>
		<link rel="alternate" type="text/html" href="https://infopedia.cz/index.php?title=Klastrov%C3%A1n%C3%AD&amp;diff=2340&amp;oldid=prev"/>
		<updated>2025-05-27T18:24:35Z</updated>

		<summary type="html">&lt;p&gt;založena nová stránka s textem „{{K rozšíření}} {{Infobox Statistika | Název = Klastrování | Obrázek = Clustering_example.svg | Popis obrázku = Příklad shlukování datových bodů do tří klastrů | Obor = &lt;a href=&quot;/index.php/Strojov%C3%A9_u%C4%8Den%C3%AD&quot; title=&quot;Strojové učení&quot;&gt;Strojové učení&lt;/a&gt; (&lt;a href=&quot;/index.php?title=U%C4%8Den%C3%AD_bez_u%C4%8Ditele&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Učení bez učitele (stránka neexistuje)&quot;&gt;Učení bez učitele&lt;/a&gt;), &lt;a href=&quot;/index.php/Statistika&quot; title=&quot;Statistika&quot;&gt;Statistika&lt;/a&gt;, &lt;a href=&quot;/index.php?title=Datov%C3%A1_v%C4%9Bda&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Datová věda (stránka neexistuje)&quot;&gt;Datová věda&lt;/a&gt; | Definice = Úloha seskupování sady objektů tak, aby objekty ve stejném shluku (klastru) byly podobnější než objekty v jiných shlucích. | Typ = &lt;a href=&quot;/index.php?title=U%C4%8Den%C3%AD_bez_u%C4%8Ditele&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Učení bez učitele (stránka neexistuje)&quot;&gt;Učení bez učitele&lt;/a&gt; | C…“&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nová stránka&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{K rozšíření}}&lt;br /&gt;
{{Infobox Statistika&lt;br /&gt;
| Název = Klastrování&lt;br /&gt;
| Obrázek = Clustering_example.svg&lt;br /&gt;
| Popis obrázku = Příklad shlukování datových bodů do tří klastrů&lt;br /&gt;
| Obor = [[Strojové učení]] ([[Učení bez učitele]]), [[Statistika]], [[Datová věda]]&lt;br /&gt;
| Definice = Úloha seskupování sady objektů tak, aby objekty ve stejném shluku (klastru) byly podobnější než objekty v jiných shlucích.&lt;br /&gt;
| Typ = [[Učení bez učitele]]&lt;br /&gt;
| Cíl = Objevování skrytých struktur a vzorců v datech, segmentace, redukce dimenzionality&lt;br /&gt;
| Metody = [[K-means]], [[Hierarchické shlukování]], DBSCAN, GMM, Spektrální shlukování&lt;br /&gt;
| Využití = [[Segmentace zákazníků]], [[Rozpoznávání obrazu|analýza obrazu]], [[bioinformatika]], [[zpracování přirozeného jazyka|NLP]], [[sociální sítě]]&lt;br /&gt;
| Význam = Zjednodušování komplexních dat, personalizace, objevování anomálií&lt;br /&gt;
| Příbuzné pojmy = [[Klasifikace (strojové učení)|Klasifikace]], [[Analýza hlavních komponent|Redukce dimenzionality]], [[Datová věda]], [[Strojové učení]]&lt;br /&gt;
}}&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Klastrování&amp;#039;&amp;#039;&amp;#039; (anglicky &amp;#039;&amp;#039;clustering&amp;#039;&amp;#039;), česky též &amp;#039;&amp;#039;&amp;#039;shlukování&amp;#039;&amp;#039;&amp;#039;, je technika [[strojové učení|strojového učení]] spadající do kategorie [[učení bez učitele]]. Jejím cílem je seskupovat sadu [[objekt|objektů]] nebo [[data|datových bodů]] tak, aby [[objekt|objekty]] v jednom shluku (tzv. &amp;#039;&amp;#039;&amp;#039;klastru&amp;#039;&amp;#039;&amp;#039;) byly navzájem co nejpodobnější, zatímco [[objekt|objekty]] v různých shlucích byly co nejméně podobné. Na rozdíl od [[klasifikace (strojové učení)|klasifikace]] nejsou pro [[klastrování]] předem dány žádné kategorie nebo označení; [[algoritmus]] si je &amp;quot;objevuje&amp;quot; sám na základě vnitřní struktury [[data|dat]].&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Princip a cíle klastrování ==&lt;br /&gt;
Základním principem [[klastrování]] je maximalizace &amp;#039;&amp;#039;vnitřní homogenity&amp;#039;&amp;#039; shluků (tj. podobnost [[objekt|objektů]] uvnitř jednoho klastru) a &amp;#039;&amp;#039;vnější heterogenity&amp;#039;&amp;#039; shluků (tj. nepodobnost [[objekt|objektů]] mezi různými klastry).&lt;br /&gt;
Cíle [[klastrování]] jsou různé:&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Objevování skrytých struktur:&amp;#039;&amp;#039;&amp;#039; Identifikace přirozených skupin v datech.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Zjednodušení dat:&amp;#039;&amp;#039;&amp;#039; Redukce složitosti velkých [[datový set|datových sad]] jejich seskupením.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Segmentace:&amp;#039;&amp;#039;&amp;#039; Rozdělení populace nebo dat do smysluplných segmentů.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Detekce anomálií:&amp;#039;&amp;#039;&amp;#039; [[Objekt|Objekty]], které se nevejdou do žádného klastru nebo jsou do klastru zařazeny jen volně, mohou být anomálie.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Metody klastrování ==&lt;br /&gt;
Existuje mnoho [[algoritmus|algoritmů]] pro [[klastrování]], které se liší v přístupu k definici klastru a způsobu jejich vytváření. Mezi nejběžnější patří:&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[K-means]]:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Jeden z nejpopulárnějších a nejjednodušších [[algoritmus|algoritmů]]. Cílem je rozdělit [[data]] do &amp;#039;&amp;#039;k&amp;#039;&amp;#039; předem definovaných klastrů. Každý [[data|datový bod]] je přiřazen k nejbližšímu centru klastru (centroidu). Centroidy se iterativně přesouvají na průměr všech bodů v daném klastru, dokud se klastry nestabilizují.&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Rychlý, efektivní pro velké [[datový set|datové sady]].&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Vyžaduje předem znát počet klastrů (k), citlivý na [[extrémní hodnota|odlehlé hodnoty]], pracuje nejlépe s kulatými klastry.&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Hierarchické shlukování]] (Hierarchical Clustering):&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Vytváří hierarchii klastrů, která může být reprezentována dendrogramem (stromovou strukturou). Existují dva hlavní přístupy:&lt;br /&gt;
*** &amp;#039;&amp;#039;&amp;#039;Aglomerativní (zdola nahoru):&amp;#039;&amp;#039;&amp;#039; Každý [[data|datový bod]] začíná jako samostatný klastr, a poté jsou postupně spojovány nejbližší klastry.&lt;br /&gt;
*** &amp;#039;&amp;#039;&amp;#039;Divizivní (shora dolů):&amp;#039;&amp;#039;&amp;#039; Všechny [[data|datové body]] začínají v jednom klastru, který je postupně rozdělován na menší klastry.&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Nevyžaduje předem znát počet klastrů, vizuálně interpretovatelné dendrogramem.&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Výpočetně náročné pro velké [[datový set|datové sady]], jednou vytvořené spojení/rozdělení nelze vrátit.&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;DBSCAN (Density-Based Spatial Clustering of Applications with Noise):&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Seskupuje [[data|datové body]], které jsou blízko u sebe (mají vysokou hustotu), a označuje [[objekt|objekty]] v oblastech s nízkou hustotou jako [[šum (data)|šum]] nebo [[extrémní hodnota|odlehlé hodnoty]].&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Nevyžaduje předem znát počet klastrů, dokáže najít klastry nepravidelných tvarů, odolný vůči [[šum (data)|šumu]].&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Citlivý na parametry (hustotu), má problémy s daty s různou hustotou.&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Gaussian Mixture Models (GMM):&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Předpokládá, že [[data|datové body]] pocházejí z kombinace několika [[Gaussovo rozdělení|Gaussových (normálních) rozdělení]]. [[Algoritmus]] se snaží najít parametry těchto rozdělení (střed, rozptyl), které nejlépe vysvětlují daná [[data]].&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Může modelovat klastry různých tvarů a velikostí, poskytuje pravděpodobnost, že bod patří do určitého klastru.&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Náročnější na interpretaci, náchylný k přeučení, pokud se nepoužije správná regularizace.&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Spektrální shlukování (Spectral Clustering):&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Princip:&amp;#039;&amp;#039;&amp;#039; Převádí problém [[klastrování]] do grafové reprezentace, kde jsou [[data|datové body]] uzly a podobnosti mezi nimi jsou hrany. Následně používá [[algoritmus|algoritmy]] z teorie grafů pro rozdělení grafu.&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Výhody:&amp;#039;&amp;#039;&amp;#039; Dobré pro nalezení komplexních, nelineárních klastrů.&lt;br /&gt;
** &amp;#039;&amp;#039;&amp;#039;Nevýhody:&amp;#039;&amp;#039;&amp;#039; Výpočetně náročné pro velké [[datový set|datové sady]], vyžaduje volbu počtu klastrů.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Metriky podobnosti (vzdálenosti) ==&lt;br /&gt;
Klastrovací [[algoritmus|algoritmy]] se spoléhají na definici podobnosti (nebo vzdálenosti) mezi [[data|datovými body]]. Mezi běžné metriky patří:&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Eukleidovská vzdálenost:&amp;#039;&amp;#039;&amp;#039; Nejčastější, pro numerická [[data]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Manhattan vzdálenost:&amp;#039;&amp;#039;&amp;#039; Součet absolutních rozdílů souřadnic.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Kosinusová podobnost:&amp;#039;&amp;#039;&amp;#039; Často pro [[textová data]] nebo [[vysoká dimenzionalita|vysokodimenzionální]] [[data]], měří [[úhel]] mezi vektory.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Aplikace klastrování ==&lt;br /&gt;
[[Klastrování]] má široké uplatnění v mnoha oblastech:&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Marketing]]:&amp;#039;&amp;#039;&amp;#039; [[Segmentace zákazníků]] pro cílené kampaně, analýza trhu.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Bioinformatika]]:&amp;#039;&amp;#039;&amp;#039; Seskupování [[genetické sekvence|genových]] expresních dat, klasifikace proteinů.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Rozpoznávání obrazu|Počítačové vidění]]:&amp;#039;&amp;#039;&amp;#039; Segmentace [[obrázky|obrázků]], rozpoznávání objektů.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[Zpracování přirozeného jazyka|Zpracování přirozeného jazyka]] (NLP):&amp;#039;&amp;#039;&amp;#039; Seskupování dokumentů podle tématu, shlukování [[slovo|slov]] s podobným významem.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Sociální sítě:&amp;#039;&amp;#039;&amp;#039; Identifikace komunit uživatelů, analýza vlivných skupin.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Medicína:&amp;#039;&amp;#039;&amp;#039; Seskupování pacientů s podobnými symptomy nebo reakcemi na [[léky]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Detekce podvodů:&amp;#039;&amp;#039;&amp;#039; Identifikace neobvyklých vzorců chování.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Klastrování pro laiky ==&lt;br /&gt;
Představte si, že máte obrovskou hromadu různých [[ponožky|ponožek]] (to jsou vaše &amp;#039;&amp;#039;data&amp;#039;&amp;#039;). Všechny jsou pomíchané – některé jsou modré, některé červené, některé s pruhy, některé puntíkované, některé dlouhé, některé krátké. Vaším úkolem je je roztřídit.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Klastrování&amp;#039;&amp;#039;&amp;#039; (nebo shlukování) je, jako když ty [[ponožky]] začnete třídit do hromádek, aniž byste předem věděli, kolik hromádek bude, nebo jaké typy hromádek budou. Prostě se snažíte dát k sobě ty, které jsou si nejpodobnější.&lt;br /&gt;
* Třeba dáte všechny modré s pruhy dohromady.&lt;br /&gt;
* Všechny červené a krátké na jinou hromádku.&lt;br /&gt;
* A ty s puntíky na třetí.&lt;br /&gt;
&lt;br /&gt;
[[Počítač]] se při [[klastrování]] chová podobně. Dostane spoustu informací (dat) a jeho cílem je najít v nich přirozené skupiny (klastry) tak, aby věci v jedné skupině byly co nejpodobnější, a od věcí v jiné skupině se co nejvíce lišily. A to vše dělá sám, bez toho, aby mu někdo řekl, jaké skupiny má hledat.&lt;br /&gt;
&lt;br /&gt;
Díky [[klastrování]] se dají v obrovských množstvích dat objevit zajímavé věci, třeba jaké skupiny zákazníků máte, jaké typy dokumentů se objevují nejčastěji, nebo jak se shlukují geny.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Viz také ==&lt;br /&gt;
* [[Strojové učení]]&lt;br /&gt;
* [[Učení bez učitele]]&lt;br /&gt;
* [[Klasifikace (strojové učení)]]&lt;br /&gt;
* [[K-means]]&lt;br /&gt;
* [[Hierarchické shlukování]]&lt;br /&gt;
* [[Datová věda]]&lt;br /&gt;
* [[Analýza dat]]&lt;br /&gt;
* [[Predikce]]&lt;br /&gt;
* [[Segmentace zákazníků]]&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Odkazy ==&lt;br /&gt;
* [https://www.britannica.com/technology/cluster-analysis Britannica – Cluster analysis] (anglicky)&lt;br /&gt;
* [https://www.ibm.com/topics/clustering IBM – What is clustering?] (anglicky)&lt;br /&gt;
* [https://www.javatpoint.com/machine-learning-clustering Javatpoint – Machine Learning Clustering] (anglicky)&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Strojové učení]]&lt;br /&gt;
[[Kategorie:Učení bez učitele]]&lt;br /&gt;
[[Kategorie:Datová věda]]&lt;br /&gt;
[[Kategorie:Statistika]]&lt;br /&gt;
[[Kategorie:Algoritmy]]&lt;br /&gt;
[[Kategorie:Analýza dat]]&lt;br /&gt;
[[Kategorie:Umělá inteligence]]&lt;/div&gt;</summary>
		<author><name>Filmedy</name></author>
	</entry>
</feed>