<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="cs">
	<id>https://infopedia.cz/index.php?action=history&amp;feed=atom&amp;title=Datov%C3%BD_set</id>
	<title>Datový set - Historie editací</title>
	<link rel="self" type="application/atom+xml" href="https://infopedia.cz/index.php?action=history&amp;feed=atom&amp;title=Datov%C3%BD_set"/>
	<link rel="alternate" type="text/html" href="https://infopedia.cz/index.php?title=Datov%C3%BD_set&amp;action=history"/>
	<updated>2026-04-09T01:38:25Z</updated>
	<subtitle>Historie editací této stránky</subtitle>
	<generator>MediaWiki 1.44.2</generator>
	<entry>
		<id>https://infopedia.cz/index.php?title=Datov%C3%BD_set&amp;diff=3179&amp;oldid=prev</id>
		<title>Filmedy: Nahrazení textu „  *“ textem „**“</title>
		<link rel="alternate" type="text/html" href="https://infopedia.cz/index.php?title=Datov%C3%BD_set&amp;diff=3179&amp;oldid=prev"/>
		<updated>2025-06-03T03:28:46Z</updated>

		<summary type="html">&lt;p&gt;Nahrazení textu „  *“ textem „**“&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;cs&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Starší verze&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Verze z 3. 6. 2025, 05:28&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l21&quot;&gt;Řádek 21:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Řádek 21:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;Tabulková data (strukturovaná data):&amp;#039;&amp;#039;&amp;#039; Nejčastější forma, kde data jsou uspořádána do řádků a sloupců.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;Tabulková data (strukturovaná data):&amp;#039;&amp;#039;&amp;#039; Nejčastější forma, kde data jsou uspořádána do řádků a sloupců.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Řádky (záznamy/pozorování):&#039;&#039;&#039; Představují jednotlivé entity, události nebo experimentální jednotky.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Řádky (záznamy/pozorování):&#039;&#039;&#039; Představují jednotlivé entity, události nebo experimentální jednotky.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Sloupce (proměnné/atributy/vlastnosti):&#039;&#039;&#039; Popisují charakteristiky nebo měření pro každou entitu.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Sloupce (proměnné/atributy/vlastnosti):&#039;&#039;&#039; Popisují charakteristiky nebo měření pro každou entitu.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;Nestrukturovaná data:&amp;#039;&amp;#039;&amp;#039; Data, která nemají předem definovanou tabulkovou strukturu (např. [[text]], [[obrázky]], [[audio]], [[video]]). Pro jejich použití ve [[strojové učení|strojovém učení]] je často nutné je transformovat do nějaké strukturované, numerické reprezentace (např. [[vektor (matematika)|vektorů]] vlastností).&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;Nestrukturovaná data:&amp;#039;&amp;#039;&amp;#039; Data, která nemají předem definovanou tabulkovou strukturu (např. [[text]], [[obrázky]], [[audio]], [[video]]). Pro jejich použití ve [[strojové učení|strojovém učení]] je často nutné je transformovat do nějaké strukturované, numerické reprezentace (např. [[vektor (matematika)|vektorů]] vlastností).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l29&quot;&gt;Řádek 29:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Řádek 29:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;Typy dat v datovém setu:&amp;#039;&amp;#039;&amp;#039;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;#039;&amp;#039;&amp;#039;Typy dat v datovém setu:&amp;#039;&amp;#039;&amp;#039;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Numerická data:&#039;&#039;&#039; [[Číslo|Číselné]] hodnoty, které mohou být diskrétní (celá [[číslo|čísla]], např. počet dětí) nebo spojitá (reálná [[číslo|čísla]], např. [[teplota]], [[výška]]).&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Numerická data:&#039;&#039;&#039; [[Číslo|Číselné]] hodnoty, které mohou být diskrétní (celá [[číslo|čísla]], např. počet dětí) nebo spojitá (reálná [[číslo|čísla]], např. [[teplota]], [[výška]]).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Kategorická data:&#039;&#039;&#039; Hodnoty, které představují kategorie nebo skupiny (např. [[pohlaví]], [[barva]], typ produktu). Mohou být nominální (bez pořadí) nebo ordinální (s pořadím, např. velikost oblečení S, M, L).&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Kategorická data:&#039;&#039;&#039; Hodnoty, které představují kategorie nebo skupiny (např. [[pohlaví]], [[barva]], typ produktu). Mohou být nominální (bez pořadí) nebo ordinální (s pořadím, např. velikost oblečení S, M, L).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Textová data:&#039;&#039;&#039; Libovolný [[text]], od krátkých frází po celé dokumenty (např. [[komentář (programování)|komentáře]] zákazníků, [[článek (žurnalistika)|články]]).&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Textová data:&#039;&#039;&#039; Libovolný [[text]], od krátkých frází po celé dokumenty (např. [[komentář (programování)|komentáře]] zákazníků, [[článek (žurnalistika)|články]]).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Obrazová data:&#039;&#039;&#039; [[Obrázky]] a [[video|videozáznamy]] (např. [[fotografie]], [[rentgen]]).&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Obrazová data:&#039;&#039;&#039; [[Obrázky]] a [[video|videozáznamy]] (např. [[fotografie]], [[rentgen]]).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;    &lt;/del&gt;* &#039;&#039;&#039;Časové řady:&#039;&#039;&#039; Sekvence [[data|dat]] indexovaných v čase (např. ceny akcií, údaje o počasí).&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;  *&lt;/ins&gt;* &#039;&#039;&#039;Časové řady:&#039;&#039;&#039; Sekvence [[data|dat]] indexovaných v čase (např. ceny akcií, údaje o počasí).&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;---&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;---&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Filmedy</name></author>
	</entry>
	<entry>
		<id>https://infopedia.cz/index.php?title=Datov%C3%BD_set&amp;diff=2341&amp;oldid=prev</id>
		<title>Filmedy: založena nová stránka s textem „{{K rozšíření}} {{Infobox Statistika | Název = Datový set | Obrázek = Dataset_concept.png | Popis obrázku = Konceptuální znázornění datového setu jako tabulky s daty | Obor = Datová věda, Strojové učení, Statistika, Informatika | Definice = Kolekce souvisejících dat uspořádaných v tabulkové formě, kde řádky představují pozorování a sloupce proměnné | Synonyma…“</title>
		<link rel="alternate" type="text/html" href="https://infopedia.cz/index.php?title=Datov%C3%BD_set&amp;diff=2341&amp;oldid=prev"/>
		<updated>2025-05-27T18:27:16Z</updated>

		<summary type="html">&lt;p&gt;založena nová stránka s textem „{{K rozšíření}} {{Infobox Statistika | Název = Datový set | Obrázek = Dataset_concept.png | Popis obrázku = Konceptuální znázornění datového setu jako tabulky s daty | Obor = &lt;a href=&quot;/index.php?title=Datov%C3%A1_v%C4%9Bda&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Datová věda (stránka neexistuje)&quot;&gt;Datová věda&lt;/a&gt;, &lt;a href=&quot;/index.php/Strojov%C3%A9_u%C4%8Den%C3%AD&quot; title=&quot;Strojové učení&quot;&gt;Strojové učení&lt;/a&gt;, &lt;a href=&quot;/index.php/Statistika&quot; title=&quot;Statistika&quot;&gt;Statistika&lt;/a&gt;, &lt;a href=&quot;/index.php/Informatika&quot; title=&quot;Informatika&quot;&gt;Informatika&lt;/a&gt; | Definice = Kolekce souvisejících &lt;a href=&quot;/index.php/Data&quot; title=&quot;Data&quot;&gt;dat&lt;/a&gt; uspořádaných v tabulkové formě, kde řádky představují &lt;a href=&quot;/index.php/Objekt&quot; title=&quot;Objekt&quot;&gt;pozorování&lt;/a&gt; a sloupce &lt;a href=&quot;/index.php?title=Atribut_(datab%C3%A1ze)&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Atribut (databáze) (stránka neexistuje)&quot;&gt;proměnné&lt;/a&gt; | Synonyma…“&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nová stránka&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{K rozšíření}}&lt;br /&gt;
{{Infobox Statistika&lt;br /&gt;
| Název = Datový set&lt;br /&gt;
| Obrázek = Dataset_concept.png&lt;br /&gt;
| Popis obrázku = Konceptuální znázornění datového setu jako tabulky s daty&lt;br /&gt;
| Obor = [[Datová věda]], [[Strojové učení]], [[Statistika]], [[Informatika]]&lt;br /&gt;
| Definice = Kolekce souvisejících [[data|dat]] uspořádaných v tabulkové formě, kde řádky představují [[objekt|pozorování]] a sloupce [[atribut (databáze)|proměnné]]&lt;br /&gt;
| Synonyma = Soubor dat, datová sada&lt;br /&gt;
| Struktura = Tabulková (řádky, sloupce), [[JSON]], [[XML]]&lt;br /&gt;
| Typy dat = Numerická, kategorická, textová, obrazová, časové řady&lt;br /&gt;
| Důležitost = Základ pro [[analýza dat|analýzu]], [[strojové učení|trénink modelů]], [[predikce]], [[rozhodování]]&lt;br /&gt;
| Fáze životního cyklu = Sběr, čištění, transformace, analýza, vizualizace, archivace&lt;br /&gt;
| Příklady = Databáze zákazníků, soubor [[obrázky|obrázků]] pro trénink [[AI]], výsledky průzkumu&lt;br /&gt;
| Příbuzné pojmy = [[Data]], [[Analýza dat]], [[Strojové učení]], [[Umělá inteligence]], [[Databáze]], [[Velký jazykový model]]&lt;br /&gt;
}}&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Datový set&amp;#039;&amp;#039;&amp;#039; (též &amp;#039;&amp;#039;&amp;#039;soubor dat&amp;#039;&amp;#039;&amp;#039; nebo &amp;#039;&amp;#039;&amp;#039;datová sada&amp;#039;&amp;#039;&amp;#039;) je kolekce souvisejících [[data|dat]], která jsou uspořádána specifickým způsobem, obvykle v tabulkové formě. V této struktuře každý řádek představuje jedno [[objekt|pozorování]] nebo [[položka (data)|položku]] (např. jednoho zákazníka, jeden výrobek, jednu událost), a každý sloupec představuje určitou [[atribut (databáze)|proměnnou]] nebo [[atribut (databáze)|vlastnost]] (např. [[věk]], [[příjmy]], [[barva]], datum). Datové sety jsou základním kamenem pro [[analýza dat|analýzu dat]], [[strojové učení|trénink modelů strojového učení]] a [[rozhodování]] ve všech odvětvích.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Struktura a typy datových setů ==&lt;br /&gt;
Nejběžnější formou datového setu je tabulka, ale existují i jiné struktury:&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Tabulková data (strukturovaná data):&amp;#039;&amp;#039;&amp;#039; Nejčastější forma, kde data jsou uspořádána do řádků a sloupců.&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Řádky (záznamy/pozorování):&amp;#039;&amp;#039;&amp;#039; Představují jednotlivé entity, události nebo experimentální jednotky.&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Sloupce (proměnné/atributy/vlastnosti):&amp;#039;&amp;#039;&amp;#039; Popisují charakteristiky nebo měření pro každou entitu.&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Nestrukturovaná data:&amp;#039;&amp;#039;&amp;#039; Data, která nemají předem definovanou tabulkovou strukturu (např. [[text]], [[obrázky]], [[audio]], [[video]]). Pro jejich použití ve [[strojové učení|strojovém učení]] je často nutné je transformovat do nějaké strukturované, numerické reprezentace (např. [[vektor (matematika)|vektorů]] vlastností).&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Polostrukturovaná data:&amp;#039;&amp;#039;&amp;#039; Data, která sice nemají pevnou tabulkovou strukturu, ale obsahují tagy nebo značky pro oddělení prvků, což usnadňuje jejich zpracování (např. [[JSON]], [[XML]] soubory).&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Typy dat v datovém setu:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Numerická data:&amp;#039;&amp;#039;&amp;#039; [[Číslo|Číselné]] hodnoty, které mohou být diskrétní (celá [[číslo|čísla]], např. počet dětí) nebo spojitá (reálná [[číslo|čísla]], např. [[teplota]], [[výška]]).&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Kategorická data:&amp;#039;&amp;#039;&amp;#039; Hodnoty, které představují kategorie nebo skupiny (např. [[pohlaví]], [[barva]], typ produktu). Mohou být nominální (bez pořadí) nebo ordinální (s pořadím, např. velikost oblečení S, M, L).&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Textová data:&amp;#039;&amp;#039;&amp;#039; Libovolný [[text]], od krátkých frází po celé dokumenty (např. [[komentář (programování)|komentáře]] zákazníků, [[článek (žurnalistika)|články]]).&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Obrazová data:&amp;#039;&amp;#039;&amp;#039; [[Obrázky]] a [[video|videozáznamy]] (např. [[fotografie]], [[rentgen]]).&lt;br /&gt;
    * &amp;#039;&amp;#039;&amp;#039;Časové řady:&amp;#039;&amp;#039;&amp;#039; Sekvence [[data|dat]] indexovaných v čase (např. ceny akcií, údaje o počasí).&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Životní cyklus datového setu ==&lt;br /&gt;
Datové sety procházejí typickým životním cyklem:&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Sběr dat:&amp;#039;&amp;#039;&amp;#039; Získávání dat z různých zdrojů (např. [[databáze]], [[senzor|senzory]], [[web]], průzkumy, [[veřejné zakázky|veřejně dostupné zdroje]]).&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Čištění dat (Data Cleaning):&amp;#039;&amp;#039;&amp;#039; Odstraňování chyb, duplicit, vyplňování chybějících hodnot a náprava nekonzistentních dat. Jedna z nejdůležitějších a časově náročných fází.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Transformace dat (Data Transformation/Feature Engineering):&amp;#039;&amp;#039;&amp;#039; Převod dat do vhodného formátu pro [[analýza dat|analýzu]] nebo [[strojové učení|modely strojového učení]] (např. normalizace numerických dat, převod kategorických dat na numerické reprezentace, vytváření nových proměnných z existujících).&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Analýza a vizualizace dat:&amp;#039;&amp;#039;&amp;#039; Použití statistických metod a vizualizačních nástrojů k pochopení dat, identifikaci vzorců a vztahů.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Trénink a testování modelů (ve [[strojové učení|strojovém učení]]):&amp;#039;&amp;#039;&amp;#039; Rozdělení datového setu na trénovací, validační a testovací sady. Trénovací sada se používá k učení [[Model (AI)|modelu]], validační k ladění [[Hyperparametr (strojové učení)|hyperparametrů]] a testovací k finálnímu vyhodnocení výkonu [[Model (AI)|modelu]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Ukládání a archivace:&amp;#039;&amp;#039;&amp;#039; Bezpečné uložení datových setů pro budoucí použití, přístup a audit.&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Důležitost datových setů ve strojovém učení ==&lt;br /&gt;
V oblasti [[strojové učení|strojového učení]] jsou datové sety naprosto zásadní. Kvalita a kvantita trénovacích dat přímo ovlivňuje výkon a spolehlivost [[AI model (AI)|modelu]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Trénink [[Model (AI)|modelů]]:&amp;#039;&amp;#039;&amp;#039; [[AI model (AI)|Modely]] se učí z datových setů identifikovat vzorce, korelace a struktury. Čím reprezentativnější a kvalitnější [[data]], tím lépe se [[Model (AI)|model]] naučí zobecňovat na nová, neviděná data.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Evaluace [[Model (AI)|modelů]]:&amp;#039;&amp;#039;&amp;#039; Samostatný testovací datový set slouží k objektivnímu posouzení, jak dobře se [[Model (AI)|model]] chová v reálném světě, a zda nedochází k [[přeučení (strojové učení)|přeučení]] nebo [[Podučení (strojové učení)|podučení]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Předsudky a zkreslení:&amp;#039;&amp;#039;&amp;#039; Pokud datový set obsahuje [[předsudek|předsudky]] (např. nedostatečná reprezentace určitých skupin), [[AI model (AI)|model]] se je naučí a může produkovat zkreslené nebo nespravedlivé výsledky. Je proto klíčové zajistit, aby datové sety byly co nejvíce reprezentativní a [[neutrální]].&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Příklady datových setů ==&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[MNIST]]:&amp;#039;&amp;#039;&amp;#039; Datový set ručně psaných číslic, často používaný pro úvodní [[strojové učení|úkoly rozpoznávání obrazu]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[ImageNet]]:&amp;#039;&amp;#039;&amp;#039; Rozsáhlý datový set milionů označených [[obrázky|obrázků]], klíčový pro vývoj [[hluboké učení|hlubokého učení]] v [[počítačové vidění|počítačovém vidění]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;COCO (Common Objects in Context):&amp;#039;&amp;#039;&amp;#039; Datový set pro detekci objektů, segmentaci a titulkování [[obrázky|obrázků]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;[[WikiText]]:&amp;#039;&amp;#039;&amp;#039; Velký datový set textu z [[Wikipedie]], používaný pro trénink [[velký jazykový model|jazykových modelů]].&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Titanic Dataset:&amp;#039;&amp;#039;&amp;#039; Obsahuje informace o pasažérech Titanicu a jejich osudu, často používaný pro výuku [[klasifikace (strojové učení)|klasifikace]].&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Datový set pro laiky ==&lt;br /&gt;
Představte si, že chcete naučit [[počítač]], aby uměl poznávat [[pes|psy]] na [[fotografie|fotkách]]. Aby se [[počítač]] (přesněji jeho [[Model (AI)|model]]) mohl učit, potřebuje se podívat na spoustu příkladů.&lt;br /&gt;
&lt;br /&gt;
Tato &amp;quot;spousta příkladů&amp;quot; se nazývá &amp;#039;&amp;#039;&amp;#039;datový set&amp;#039;&amp;#039;&amp;#039;.&lt;br /&gt;
* Je to jako velká &amp;#039;&amp;#039;&amp;#039;sbírka informací&amp;#039;&amp;#039;&amp;#039;.&lt;br /&gt;
* Pro našeho [[pes|psa]] by to byla hromada [[fotografie|fotek]], kde jsou na některých [[pes|psi]] a na jiných třeba [[kočka|kočky]] nebo [[pták|ptáci]]. A u každé [[fotografie|fotky]] by bylo napsáno, co na ní je (jestli [[pes]], nebo ne).&lt;br /&gt;
&lt;br /&gt;
Ten [[počítač]] si pak tento [[datový set]] prohlíží, učí se z něj, hledá v něm vzory (např. jak vypadá [[pes]]) a pak se snaží poznat [[pes|psy]] i na [[fotografie|fotkách]], které nikdy předtím neviděl.&lt;br /&gt;
&lt;br /&gt;
Čím větší a kvalitnější ten &amp;#039;&amp;#039;&amp;#039;datový set&amp;#039;&amp;#039;&amp;#039; je (čím více různých [[fotografie|fotek]] s [[pes|psy]] mu ukážete a čím lépe jsou označené), tím lépe se [[počítač]] naučí a tím spolehlivěji pak bude [[pes|psy]] poznávat. Bez &amp;#039;&amp;#039;&amp;#039;datového setu&amp;#039;&amp;#039;&amp;#039; by se [[AI model (AI)|model]] neměl z čeho učit!&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Viz také ==&lt;br /&gt;
* [[Data]]&lt;br /&gt;
* [[Analýza dat]]&lt;br /&gt;
* [[Strojové učení]]&lt;br /&gt;
* [[Umělá inteligence]]&lt;br /&gt;
* [[Hluboké učení]]&lt;br /&gt;
* [[Databáze]]&lt;br /&gt;
* [[Velký jazykový model]]&lt;br /&gt;
* [[Trénink (strojové učení)]]&lt;br /&gt;
* [[Predikce]]&lt;br /&gt;
* [[Atribut (databáze)]]&lt;br /&gt;
* [[JSON]]&lt;br /&gt;
* [[XML]]&lt;br /&gt;
&lt;br /&gt;
---&lt;br /&gt;
== Odkazy ==&lt;br /&gt;
* [https://www.ibm.com/topics/data-set IBM – What is a dataset?] (anglicky)&lt;br /&gt;
* [https://developers.google.com/machine-learning/glossary#dataset Google Developers – Dataset (Machine Learning Glossary)] (anglicky)&lt;br /&gt;
* [https://www.statista.com/statistics/1042571/big-data-types/ Statista – Types of Big Data] (anglicky)&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Datová věda]]&lt;br /&gt;
[[Kategorie:Strojové učení]]&lt;br /&gt;
[[Kategorie:Statistika]]&lt;br /&gt;
[[Kategorie:Informatika]]&lt;br /&gt;
[[Kategorie:Data]]&lt;br /&gt;
[[Kategorie:Umělá inteligence]]&lt;br /&gt;
[[Kategorie:Analýza dat]]&lt;/div&gt;</summary>
		<author><name>Filmedy</name></author>
	</entry>
</feed>