Moje poznámky ohledně statistických termínů ve statistikách, které se objevují ve vědeckých studiích.
V popisné statistice je mezikvartilní rozsah ( IQR ), nazývaný také střední rozpětí , střední 50% nebo H-rozpětí , měřítkem statistického rozptylu , který se rovná rozdílu mezi 75. a 25. percentilem nebo mezi horním a dolním kvartilem, [1] [2] IQR = Q 3 - Q 1 . Jinými slovy, IQR je první kvartil odečtený od třetího kvartilu; tyto kvartily lze jasně vidět na grafu dat. Je to upravený odhad, definovaný jako 25% ořezaný rozsah, a je běžně používanou robustní mírou měřítka .
IQR je míra variability založená na rozdělení datové sady na kvartily. Kvartily rozdělují seřazenou datovou sadu na čtyři stejné části. Hodnoty, které oddělují části, se nazývají první, druhý a třetí kvartil; a jsou označeny Q1, Q2 a Q3.
Na rozdíl od celkového rozsahu má mezikvartilní rozsah bod zlomu (angl. "breakdown point") 25% [3], a je proto často upřednostňován před celkovým rozsahem.
IQR se používá k vytváření grafů, jednoduchých grafických reprezentací distribuce pravděpodobnosti.
U symetrického rozdělení (kde se medián rovná midhingu , průměr prvního a třetího kvartilu) se polovina IQR rovná mediánové absolutní odchylce (MAD).
Medián je odpovídající míra centrální tendence .
Ve statistice je interval spolehlivosti ( CI ) typ odhadu vypočítaného ze statistik pozorovaných dat. To poskytuje rozsah hodnot pro neznámý parametr (například průměr). Interval má přidruženou úroveň spolehlivosti, která udává pravděpodobnost, s jakou bude odhadovaný interval obsahovat skutečný parametr. Úroveň spolehlivosti vybírá vyšetřovatel. Pro daný odhad v daném vzorku generuje použití vyšší úrovně spolehlivosti širší (tj. Méně přesný) interval spolehlivosti. Obecně je interval spolehlivosti pro neznámý parametr založen na vzorkování distribuce odpovídajícího odhadce. [1]
To znamená, že úroveň spolehlivosti představuje teoretickou dlouhodobou frekvenci (tj. Podíl) intervalů spolehlivosti, které obsahují skutečnou hodnotu neznámého parametru populace. Jinými slovy, 90% intervalů spolehlivosti vypočítaných na úrovni spolehlivosti 90% obsahuje parametr, 95% intervalů spolehlivosti vypočítaných na úrovni spolehlivosti 95% obsahuje parametr, 99% intervalů spolehlivosti vypočítaných na úrovni spolehlivosti 99% obsahuje parametr atd. [2]
Úroveň spolehlivosti je určena před zkoumáním dat. Nejčastěji se používá 95% úroveň spolehlivosti. [3] Někdy se však používají jiné úrovně spolehlivosti, například 90% nebo 99%.
Faktory ovlivňující šířku intervalu spolehlivosti zahrnují velikost vzorku, úroveň spolehlivosti a variabilitu ve vzorku. Větší vzorek bude mít tendenci vytvářet lepší odhad parametru populace, když jsou všechny ostatní faktory stejné. Vyšší úroveň spolehlivosti bude mít tendenci vytvářet širší interval spolehlivosti.
Pro přidání komentáře se musíš přihlásit nebo registrovat na signály.cz.