V poslední době se zajímám o zdraví a léčbu v souvislosti s epidemií covid-19.

Poznámky ke statistikám ve studiích.

18. 3. 2021 22:05
Rubrika: Statistiky | Štítky: studie , statistiky

Moje poznámky ohledně statistických termínů ve statistikách, které se objevují ve vědeckých studiích.

 

IQR - Interquartile range

Graf s mezikvartilovým rozsahem) a funkce hustoty pravděpodobnosti (pdf) normální populace N (0, σ 2)

V popisné statistice je mezikvartilní rozsah ( IQR ), nazývaný také střední rozpětí , střední 50% nebo H-rozpětí , měřítkem statistického rozptylu , který se rovná rozdílu mezi 75. a 25. percentilem nebo mezi horním a dolním kvartilem, [1] [2] IQR = Q 3  -  Q 1 . Jinými slovy, IQR je první kvartil odečtený od třetího kvartilu; tyto kvartily lze jasně vidět na grafu dat. Je to upravený odhad, definovaný jako 25% ořezaný rozsah, a je běžně používanou robustní mírou měřítka .

IQR je míra variability založená na rozdělení datové sady na kvartily. Kvartily rozdělují seřazenou datovou sadu na čtyři stejné části. Hodnoty, které oddělují části, se nazývají první, druhý a třetí kvartil; a jsou označeny Q1, Q2 a Q3.

Na rozdíl od celkového rozsahu má mezikvartilní rozsah bod zlomu (angl. "breakdown point") 25% [3], a je proto často upřednostňován před celkovým rozsahem.

IQR se používá k vytváření grafů, jednoduchých grafických reprezentací distribuce pravděpodobnosti.

U symetrického rozdělení (kde se medián rovná midhingu , průměr prvního a třetího kvartilu) se polovina IQR rovná mediánové absolutní odchylce (MAD).

Medián je odpovídající míra centrální tendence .

 

CI - Confidence interval

 

Ve statistice je interval spolehlivosti ( CI ) typ odhadu vypočítaného ze statistik pozorovaných dat. To poskytuje rozsah hodnot pro neznámý parametr (například průměr). Interval má přidruženou úroveň spolehlivosti, která udává pravděpodobnost, s jakou bude odhadovaný interval obsahovat skutečný parametr. Úroveň spolehlivosti vybírá vyšetřovatel. Pro daný odhad v daném vzorku generuje použití vyšší úrovně spolehlivosti širší (tj. Méně přesný) interval spolehlivosti. Obecně je interval spolehlivosti pro neznámý parametr založen na vzorkování distribuce odpovídajícího odhadce. [1]

To znamená, že úroveň spolehlivosti představuje teoretickou dlouhodobou frekvenci (tj. Podíl) intervalů spolehlivosti, které obsahují skutečnou hodnotu neznámého parametru populace. Jinými slovy, 90% intervalů spolehlivosti vypočítaných na úrovni spolehlivosti 90% obsahuje parametr, 95% intervalů spolehlivosti vypočítaných na úrovni spolehlivosti 95% obsahuje parametr, 99% intervalů spolehlivosti vypočítaných na úrovni spolehlivosti 99% obsahuje parametr atd. [2]

Úroveň spolehlivosti je určena před zkoumáním dat. Nejčastěji se používá 95% úroveň spolehlivosti. [3] Někdy se však používají jiné úrovně spolehlivosti, například 90% nebo 99%.

Faktory ovlivňující šířku intervalu spolehlivosti zahrnují velikost vzorku, úroveň spolehlivosti a variabilitu ve vzorku. Větší vzorek bude mít tendenci vytvářet lepší odhad parametru populace, když jsou všechny ostatní faktory stejné. Vyšší úroveň spolehlivosti bude mít tendenci vytvářet širší interval spolehlivosti.

Zobrazeno 136×

Komentáře

Napsat komentář »

Pro přidání komentáře se musíš přihlásit nebo registrovat na signály.cz.

Štítky

Autor blogu Grafická šablona signály.cz