Přeskočit na obsah

Rozsah dat

Z Infopedia
(přesměrováno z Rozsah (rozsah dat))
Rozbalit box

Obsah boxu

Rozsah dat


Soubor:Data range example.png
Grafické znázornění rozsahu dat na číselné ose.

Rozsah dat (anglicky range) je v statistice a analýze dat základní míra variability nebo disperze datového souboru. Jedná se o rozdíl mezi nejvyšší a nejnižší hodnotou v daném souboru dat. Poskytuje rychlou a jednoduchou informaci o rozsahu hodnot, které datový soubor pokrývá. I když je snadno spočitatelný, je citlivý na extrémní hodnoty (outliery) a nemusí vždy poskytovat komplexní obrázek o rozložení dat.

---

Definice a výpočet

Rozsah dat se počítá jako rozdíl mezi nejvyšší hodnotou (max) a nejnižší hodnotou (min) v datovém souboru.

Vzorec: $R = \text{max} - \text{min}$

Kde:

  • $R$ = Rozsah dat
  • $\text{max}$ = Nejvyšší hodnota v souboru dat
  • $\text{min}$ = Nejnižší hodnota v souboru dat

Příklad: Mějme soubor dat o věku studentů ve skupině: $18, 20, 19, 22, 21, 18, 25$. 1. Najdeme nejvyšší hodnotu (max): $25$ 2. Najdeme nejnižší hodnotu (min): $18$ 3. Vypočítáme rozsah: $R = 25 - 18 = 7$

Rozsah dat je tedy 7 let. To znamená, že rozdíl mezi nejstarším a nejmladším studentem ve skupině je 7 let.

---

Vlastnosti a interpretace

  • Jednoduchost: Jedná se o nejjednodušší míru variability, která se snadno počítá a interpretuje.
  • Citlivost na extrémy: Rozsah dat je extrémně citlivý na extrémní hodnoty (odlehlé hodnoty). Pouhý jeden outlier může výrazně změnit vypočítaný rozsah, což nemusí odpovídat typické variabilitě dat.
  • Neposkytuje informace o rozložení: Rozsah nám neřekne nic o tom, jak jsou data rozložena mezi minimem a maximem. Zda jsou data rovnoměrně rozložena, shlukují se kolem průměru, nebo mají více shluků.
  • Použití pro malé soubory: Je užitečný pro rychlý přehled variability v malých datových souborech, kde není přítomnost outlierů příliš pravděpodobná.

---

Rozsah dat vs. jiné míry variability

Rozsah dat je jen jednou z mnoha měr variability. Dalšími, které poskytují komplexnější obrázek, jsou:

Kdy použít rozsah dat:

---

Aplikace v informatice a datových vědách

V informatice a datových vědách se termín "rozsah dat" používá v několika kontextech:

---

Rozsah dat pro laiky

Představte si, že máte skupinu kamarádů a chcete vědět, jak moc se lišíte ve výšce. Změříte každého kamaráda a zapíšete si hodnoty.

Řekněme, že nejvyšší kamarád má $190 cm$ a nejnižší $160 cm$.

Rozsah dat je pak jednoduše rozdíl mezi tím nejvyšším a nejnižším. $190 cm - 160 cm = 30 cm$.

Takže rozsah výšky ve vaší skupině je $30 cm$. To vám řekne, jak "roztažená" je ta vaše skupina z hlediska výšky. Je to super jednoduché, ale neřekne vám to třeba, jestli jsou všichni ostatní někde uprostřed, nebo jestli máte hodně lidí u jedné i druhé hranice.

---

Externí odkazy

---

Kategorie