Prosím přítomné mozky o mentální podporu... bratr počítá nějaké statistiky nad vzorkem pacientů a já se snažím zorientovat v tom, co je vlastně možno upočítat.
Základní setup je následující: Má databázi pacientů léčených nějakým lékem (ve skutečnosti dvěma), u kterých chce zkoumat vliv podání antibiotik na hladinu nějaké látky v krvi. Ta hladina je sledována dlouhodobě, takže každý pacient má svou vlastní historii těchto hladin... např. pacient P1 bude mít n1 měření, z nich vypočítanou střední hodnotu a jejich rozptyl (ta střední hodnota a rozptyl mohou být u různých pacientů různé). Některá z těch měření jsou po podání ATB, kde je ta hladina ovlivněna dvěma faktory - podání ATB vede k jejímu zvýšení, zároveň se ale provádí léková kompenzace, která vede ke snížení. Hypotéza je, že dochází (systematicky) k pře-kompenzování, tedy hladiny měřené po podání ATB jsou nižší. Druhá hypotéza je, že ty hladiny po podání ATB mají větší rozptyl a častěji dochází k překročení nějakých fyziologických hranic.
Můj dotaz je následující: Protože mám u každého pacienta m+n měření, jak testovat tu shodu středních hodnot? Udělat si soubor středních hodnot s/bez ATB u každého pacienta a potom udělat párový t-test? Nebo se vykašlat na párovost a nasypat všechna měření s/bez do dvou skupin? A ten rozptyl testovat také nějak párově nebo jenom odhadnout vzorky s/bez ATB jako N(x_0, sigma) a otestovat shodu sigma?
Případně mě napadlo, přidat příznak "mimo fyziologické hodnoty" a testovat, za pravděpodobnost tohoto jevu je s/bez ATB odlišná.
Nemáte někdo nějakou pěknou kuchařku nebo wiki nebo něco, kde bych si mohl oživit tyhle věci?