Главно меню

ОБРАЗОВАТЕЛНИ РЕСУРСИ - ИКТвНОС

Национална научна програма
„Информационни и комуникационни технологии за
единен цифров пазар в науката, образованието и сигурността“
(ИКТ в НОС)

Биостатистическо изследване

проф. Тодор Кундуржиев, дм, доц. Милена Стойчева, дм

Въведение

Статистиката е наука, която изучава количествената страна на масовите явления (не на единични явления, а на явления, проявяващи се в голям брой случаи). В зависимост от предметната област, в която я прилагаме, различаваме биостатистика, икономическа статистика, селскостопанска статистика и т.н. Биостатистиката, следователно, е наука, изучаваща количествената страна на масовите явления в областта на медицината и здравеопазването с цел разкриване на закономерности и характеризиране на техни конкретни проявления.

Основни понятия

Статистическа съвкупност. Обектите, случаите, чрез/или в които може да се проявява дадено явление, могат да бъдат обединени в процеса на тяхното изучаване в еднородни групи, наречени статистически съвкупности. Това обединение не се извършва формално, а въз основа на съществуващата взаимна връзка между отделните случаи, която произтича от тяхната качествена еднородност. Статистическите съвкупности могат да бъдат няколко вида:

  • моментни и периодни, в зависимост от факта дали се отнасят за определен момент, или за конкретен период;
  • генерални и извадкови, в зависимост от това дали включват абсолютно всички единици на съвкупността, или само част от тях;
  • реални и хипотетични, според това дали съществуват реално или са продукт на умозаключение.

Статистически единици. Единиците (случаите, събитията), които съставят статистическите съвкупности се наричат статистически единици.

Генералната съвкупност (популация). Обхваща всички единици на изучаваната съвкупност. Не е задължително случаите да бъдат чов. индивиди, те могат да бъдат лабораторни животни, болници, аптеки и др. Ако например искаме да изследваме разпространението на хепатит В у нас, генералната съвкупност ще включва всички хора в България. Ако ни интересува колко са лицата, страдащи от рак на простатата в страната, генералната съвкупност ще включва само мъжете в България.Извадка. Представлява определена част от генералната съвкупност.

Променливи (признаци) и скали за измерване

Статистически признаци (променливи) са основни качества, особености, характеристики, по които се извършва статистическото проучване. Признаците се наричат още променливи, защото стойностите им могат да се променят в отделните единици на изследването. Терминът „променлива” се използва в противовес на „константа” – стойност, която не се променя. Например променливи са възрастта, кръвната група, защото (значенията) разновидностите им варират при изследваните лица.

В зависимост от естеството на значенията си, признаците се класифицират в два основни вида:

  • количествени (наричани още вариационни, метрирани), те могат да бъдат дискретни (това означава, че приемат обикновено само цели стойности – като брой деца в семейството, брой зъби, брой заети лица в дадена болница и т.н.) или непрекъснати (могат да приемат всички числови значения в даден интервал – тегло, t0C, стойност на някакъв медицински показател т.н.);
  • категорийни (качествени, атрибутивни, неметрирани) – нямат числови значения, а изразяват качествени различия между изучаваните случаи; техните значения са категорийни разновидности. Такива са например полът, образованието, кръвната група, цвета на очите и др.

Видът на променливата в значителна степен предопределя избора на коректен статистически анализи.

За измерване на променливите се използват четири вида измерителни скали:

  • номинална скала (класификационна, скала на наименованието) – използва се, когато дадено свойство не се поддава на непосредствено измерване. В тази скала не се съдържа никаква информация за величината на измервания признак (такава липсва), а само се различават отделните му класове или категории, като те се отбелязват със символи (семейно положение: несемеен/несемейна, омъжена/женен, разведен/а, вдовец/а; кръвна група: 0, А, В и АВ). Частен случай на номиналната скала е дихотомната – когато значенията на наблюдавания признак са само две, например полът – мъж или жена; наличие или отсъствие на заболяване и т.н. Най-важната характеристика на номиналната скала е, че подразделенията на променливата, която измерваме, са равнопоставени. Единствената количествена характеристика при тази скала е броят на единиците честотата) в обособените категории;
  • ординална скала – различават се отделни класове на променливата, които могат да се сравняват помежду си, като отделните категории се подреждат по тяхната тежест (напр. променливата образование: основно, средно, висше). Тази скала има три разновидности – полуподредена (тук разновидностите на признака се изразяват чрез термините – голям-малък, евтино-скъпо, ниска-висока и т.н.); рангова (при нея разновидностите на признака се изразяват с термините първо, второ, трето и т.н.) и бална (например скалата за оценяване знанията на студентите – слаб, среден и т.н.). И тук както при номиналната скала, единствената количествена характеристика са честотите;
  • интервална скала – характеризира се с наличието на мерна единица и начална точка. Могат да се оценяват разлики между отделните единици по отношение на изучаваното свойство. Различията се представят във вид на интервал между две точки от скалата (температура, надморска височина). Началната точка на скалата е условно определена, възможни са стойности и под нея (напр. температура от -12 °С);
  • абсолютна скала ( скала на отношенията) – задава се абсолютна начална точка и мерна единица. Може да се сравнява колко пъти дадено измерване е по-голямо или по-малко от друго (ръст, тегло). Началната точка на скалата означава пълно отсъствие на признака.

Качествените (категорийни) данни се представят на слабите скали – номинална и ординална, а количествените – на силни скали: интервална и абсолютна.

Етапи на статистическото изследване

Основните етапи през които преминава едно статистическо изследване са четири, а именно: описание (планиране и организация); измерване на планираните показатели (теренна фаза); статистическа обработка (описание и анализ); обсъждане (интерпретация и обобщаване) на получените резултати. Взаимната свързаност на тези етапи налагат, и са заложени определени изисквания на всеки етап към останалите.

В хода на всяко конкретно проучване, като се има предвид спецификата на набелязаната цел и задачи, някои от компонентите на тази обща схема могат да отпаднат, както и да се добавят нови елементи.

Първи етап – описание (планиране и организация) на проучването

Основание за провеждането на едно статистическо изследване в областта на трудовата медицина дава възникването на трудово-медицински проблем. Този етап започва с описване на възникналия проблем (например зачестили клинични оплаквания при работа в специфична работна среда), т.е. наблюдаваните явления се описват. След което се подбират онези категории, качества, свойства и особености на изследваните явления, които в най-висока степен съответстват на описания проблем. През този етап се прави и преценката каква нова информация може да се получи от това изследване. За тази цел е необходимо да се разгледат резултатите и заключенията от проведените подобни изследвания до момента.

След тези стъпки се формулират целите и задачите на проучването, както и изследователските хипотези.

Следващите стъпки в този етап са: определяне на обекта на проучването (популация, определена популация в риск, извадка и т.н.); в зависимост от наличието на описаните явления се определя и обхватът на статистическата съвкупност; определяне на единиците на наблюдение, предполагаеми факторни и зависими променливи (признаци).

Плановата схема изисква още да се избере подходящ вид на проучването – изчерпателно или репрезентативно; ретроспективно или проспективно; еднократно, периодично или текущо. Определя се периодът на наблюдение, като се има предвид развитието и разпространението на заболяванията, продължителността на експозицията, времевия интервал на изпитваните лечебни или профилактични интервенции и лекарствени продукти.

През този етап се избира и описва методиката за събиране на данните (анкета, интервю, наблюдение, експеримент, медицински прегледи, биологични проби, лабораторни изследвания, скринингови методи и др.).

При изготвянето на първичните документи за събиране на данните се предвиждат стандартизиране на данните и система за кодиране на получената информация. От особено значение е да се предвиди също така и система за технически и логически контрол и проверка на достоверността на данните.

Планува се използването на адекватни статистически методи и анализи, които да са съобразени с естеството и характера на изследваните явления, тъй като от това до голяма степен зависи научната обоснованост на получените резултати.

Избира се подходящ модел на извадката, ако е планирано репрезентативно проучване, се определят правилата за формиране на самата извадка. Този избор е свързан с особеностите и обема на генералната съвкупност, точността на проучването, материалната обезпеченост, възможностите за контрол на факторите, които могат да окажат негативно влияние (замъгляващите фактори) върху получените данни.

Въз основа на всичко описано до тук в документален вид се изготвя т.нар. „Изследователски протокол на проучването”. В зависимост от естеството на изследването в някои случаи този протоколът трябва да бъде одобрен от съответната Комисия по етика.

При някои видове проучвания се налага провеждането на т. нар. пилотно проучване. То се извършва върху малък обем от извадката, за кратко време и целта му е да се апробира описания изследователски протокол на проучването. В следствие на това се отстраняват допуснатите грешки (ако има такива) от един или друг характер и се изготвя окончателния вариант на протокола.

Този етап от проучването завършва с изготвянето на подробен финансов план, обезпечаване на необходимите ресурси (човешки и технически) и времевите интервали за изпълнението на всяка стъпка от протокола, както и отговорните лица за изпълнението на задачите.

Втори етап – измерване (теренна фаза)

През този етап се извършват самите измервания в реални условия. Продължителността му е различна в зависимост от типа на проучването. Провеждането на този етап трябва да бъде напълно съобразено с предписаните инструкции в протокола на изследването. В противен случай може да се стигне до възможността за допускане на систематична грешка. Такава грешка може да се получи и от неточно измерване, неточни класификации на факторните и зависимите променливи (експозиции, здравен статус), точност на измерващите уреди и др. Систематичната грешка води до повишаване или понижаване на отчетените стойности, което от своя страна води до нарушаване на точността на оценките. Това показва, че стремежът при провеждането на този етап е да се намалява възможността за допускането на систематична грешка.

Събраните данни се въвеждат в компютър, обикновено в предварително изготвена електронна таблица. При това въвеждане могат да бъдат зададени критерии за технически и логически контрол с цел ограничаване на неприемливи (грешно отчетени) данни, а от тук и намаляване на възможността за допускане на систематична грешка. Този етап завършва именно с такъв тип проверки за достоверност (валидиране) на събраните данни. Грешките се коригират, ако това е възможно, а данните със съмнителна и неприемлива стойност се отстраняват.

Трети етап – статистическа обработка (описание и анализ) на данните

Следвайки протокола на статистическото изследване на този етап се извършва статистическата обработка на данните, която е свързана с характера на проучването и вида на разглежданите променливи. Тук се включва групиране на данните, таблично и графично представяне, както и биостатистическият анализ.

Статистическата групировка не се извършва самоцелно, а въз основа на признаци с важно медицинско значение, като напр. здравен и социален статус, демографски показатели, физико-химични фактори, интензитет на експозицията, приемана доза от лекарството и т. н.

Биостатистическият анализ преминава през: сравняване на честотите на здравни събития или явления, проверка на статистически хипотези, свързани с факторна зависимост при конкретни заболявания, количествена оценка на установените връзки и зависимости, моделиране и прогнозиране на установените тенденции и т.н.

По същество биостатистическият анализ трябва да протича в единство с качествения  анализ в предметната област (медико-биологичен, клиничен и медико-социален).

Четвърти етап – обсъждане (интерпретация и обобщаване) на резултатите

При този етап от проучването резултатите се подлагат на задълбочено обсъждане и интерпретация от гледна точка на епидемиологичното осмисляне, при което фокуса е към всички по-важни факти, установени в процеса на изследването.

Съществено значение се отдава на достоверността и доказателствената сила на резултатите, както и на тяхната представителност и различните аспекти на валидността на статистическото изследване.

При обсъждане на валидността на резултатите трябва да се има предвид случайността, систематичната грешка и замъгляващите фактори, като допълнителни алтернативни обяснения.

В края на този етап, а това е и края на проучването се формулират изводите и заключенията. Може да бъдат дефинирани нови хипотези свързани с проблемите, по които се налагат нови проучвания, отправят се препоръки за въвеждане на мерки и програми за контрол на заболяванията – терапевтични схеми, лечебни и профилактични средства и т.н. Един от най-важните моменти при едно статистическо проучване е интерпретацията на резултатите, тъй като неправилната интерпретация неизбежно води до неправилни изводи и заключения.

Описателна статистика

Мерки на централната тенденция, разсейването и формата на разпределението

Мерки на централната тенденция (средни величини)

Това са обобщаващи статистически характеристики, които отразяват общото, типичното за дадената извадка. Мерките на централната тенденция са много на брой, но най-често в практиката се използват показателите средна аритметична величина, медиана и мода.

Средната аритметична стойност  се изчислява по формулата:

xi – значението на признака за i-тата единица в съвкупността

n – общият брой случаи

Например ако изчисляваме средната възраст, то xi е възрастта на всеки отделен индивид, а n е броят на тези лица.

Ако количественият признак е групиран в интервали, задължително условие е те да бъдат с еднаква ширина. В този случай средната аритметична стойност може да се изчисли по друга формула:

xi – средата на съответния интервал;

fi – честотата (броя на случаите) в съответния интервал

n – броят на интервалите

Разбира се, изчисляването на каквито и да е оценки въз основа на групирани данни рефлектира върху тяхната точност (по-неточни са). Предпочита се обобщаващите статистически характеристики да се изчисляват от негрупирани данни винаги, когато това е възможно.

Медианата (Ме) представлява позиционната среда на единиците. За да бъде определена тя, всички случаи трябва да бъдат подредени по размера на интересуващия ни признак (например по възраст). Стойността на признака на единицата, която е точно в средата, е медианата. Разбира се централно значение на признака може да има само ако броят на случаите е нечетен. Ако обаче имаме четен брой единици, то за медиана се приема средната аритметична от стойността на двете значения в средата. Поредният номер на единицата, която е медиана, се определя от формулата:

nMe е поредния номер на единицата, чиято стойност е медианата.

Медианата също може да се изчисли и въз основа на групирани данни. И тук е в сила условието ширината на интервалите да е еднаква. Формулата е следната:

LMe – долната граница на медианния интервал

∑f – общият брой случаи

CMe-1 – кумулираните честоти в предмедианния интервал

e – ширина на интервалите

fMe – честотата в медианния интервал

За да определим медианния интервал, трябва да изчислим кумулираните честоти. Интервалът, който съдържа единицата с пореден номер n/2, е медианният интервал.

Модата (Мо) представлява най-често срещаното значение на променливата. Може да има повече от една мода в даден статистически ред, т.е. повече от едно значение (напр. възрастта 25 и 26) да се среща най-много пъти в изучаваната извадка.

При групирани в равни по ширина интервали данни също може да се изчисли модата. Това става по формулата:

LMo – долна граница на модалния интервал

fMo – честота в модалния интервал

fMo-1 – честота в предмодалния интервал

fMo+1 – честота в следмодалния интервал

Модалният интервал е интервалът с най-много значения на признака.

Що се отнася до категорийните променливи, за всяка от тях може да се определи модата (значението на признака, което се среща най-често). За променливите, които се измерват на ординалната скала може да се определи и медианата, тъй като можем да подредим категориите нарастващо. Средна аритметична в истинския смисъл на думата при категорийни променливи няма. Условно за средна се приема относителния дял на най-често срещаното значение (p), докато сумата от дела на останалите значения се приема за негова алтернатива (q). Обикновено се прилага за променливи, измервани на дихотомната скала (частен случай на категорийна променлива, измервана на номинална скала само с две значения на признака – вижте първа глава), но принципно всяка качествена променлива може да бъде преобразувана в такава с по-малко значения на признака.

Мерки на разсейването

Най-често използваните мерки, измерващи разсейването на единиците в дадена извадка, са размах, стандартно отклонение и дисперсия. Те показазват доколко дадената съвкупност е компактна, с близки значения или варира по размера на изучавания признак. Освен тях могат да се изчислят и коефициента на вариация, както и интерквартилния размах.

Размахът е най-елементарният измерител на разсейването. Изчислява се по формулата: d = xmax – xmin

xmax – най-малката стойност на признака, наблюдавана в извадката;

xmin – най-голямата стойност на признака.

Този измерител е твърде неточен, тъй като се изчислява въз основа само на две единици от изучаваната извадка. В практиката по-често се използват показателите стандартно отклонение (известно и като средно квадратично отклонение) и дисперсия. Стандартното отклонение показва средното отклонение на стойностите на изучавания признак от средната им аритметична. Формулата за изчислението на тази статистическа характеристика е следната:

Дисперсия представлява стандартното отклонение, повдигнато на квадрат, или:

Стандартното отклонение може да се представи в относителна форма чрез изчисляване на т.нар. коефициент на вариация (V). Той се изчислява по формулата:

Мерки за формата на разпределението – асиметрия и ексцес

Коефициентът на асиметрия измерва дали дадено разпределение е симетрично или не. Косвено можем да съдим за наличие на асиметрия, когато трите средни величини – средна аритметична, медиана и мода, имат стойности, отдалечени една от друга. Коефициентът на асиметрия се определя по формулата:

М3 – трети централен момент, намира се по формулата:

Когато коефициентът на асиметрия е със стойност 0, тогава разпределението е абсолютно симетрично. При стойности между 0,25 и -0,25, разпределението е умерено асиметрично. При положителни стойности на коефициента на асиметрия, по-големи от 0,25, говорим за дясна (положителна) асиметрия, а при стойности под -0,25 – за лява (отрицателна)

Положителна асиметрия
Отрицателна асиметрия
Симетрично разпределение

Коефициент на ексцес измерва до колко е остър или тъп ъгъла при върха на кривата. Той се определя по формулата:

Видове ексцес

Когато едно честотно разпределение е симетрично и не се наблюдава ексцес (т.е. коефициентите асиметрия и ексцес попадат в границите -0,2÷0,2), това означава, че неговата форма е близка до формата на нормалното разпределение. С други думи, може да се каже, че то има нормално разпределение.

Теоретично разпределение, което е симетрично спрямо централната си ос (камбанообразна форма). Не е едно единствено, а фамилия от нормални разпределения, еднозначно определени от средната аритметична и дисперсията.

Въведение в статистическото заключение – проверка на хипотези

Определение и видове статистически хипотези

По същество хипотезата е обосновано предположение за хода на определен процес, явление или събитие. За да бъде потвърдено или отхвърлено, са необходими научнообосновани аргументи.

Статистическата хипотеза обикновено е свързана с предположение за някои неизвестни популационни параметри или за вида на честотните разпределения в изследваната популация.

В статистиката съществуват два вида хипотези – нулева хипотеза и алтернативна хипотеза. Това са две взаимноизключващи се (противоположни) твърдения, т.е. ако едното е вярно, другото автоматично не е вярно. При това положение е достатъчно на проверка да се подложи само едната хипотеза. На проверка се подлага само нулевата хипотеза по данни от репрезентативни изследвания.

Нулева хипотеза (H0) – твърдение, което е свързано с наличието на нулева разлика, нулева връзка, нулев ефект (няма разлика, няма връзка, няма ефект), т.е наблюдаваната разлика, връзка, ефект и т.н. се дължи само на случайността, а не на целенасочено въздействие.

Алтернативна хипотеза (H1) – обратна на нулевата хипотеза или това е твърдение, свързано с наличието на значима разлика, връзка или ефект. Наблюдаваната разлика, връзка или ефект се дължи не само на случайността, но и на систематично (закономерно) действащи причини.

Формулирането на алтернативната хипотеза е важен момент при проверката на хипотези. Това твърдение в повечето случаи е желания от изследователя резултат и може да бъде прието само, ако нулевата хипотеза е отхвърлена. В някои случаи алтернативните хипотези могат да бъдат определени като ненасочени и насочени. Ненасочени са тогава когато са свързани с твърдение за значимо различие, без да се уточнява накъде е насочено това различие. Ако е уточнена посоката на различието, тогава говорим за насочена алтернатива.

Пример 1. Нека с µозначим средната стойност на систолното кръвно налягане в дадена популация. Ако искаме да проверим дали тази стойност е 120 mm/Hg, тогава съответните хипотези ще бъдат:

H0: µ=120

H1: µ≠120 при ненасочена алтернатива

H1: µ<120 или H1: µ>120 при насочена алтернатива

Пример 2. Нека с µ1 и µозначим популационните средни стойности на систолното кръвно налягане на пациенти от две групи. Ако искаме да сравним тези налягания между двете групи, тогава хипотезите ще бъдат:      

H0: µ12

H1: µ1≠µпри ненасочена алтернатива

H1: µ12 или H1: µ1при насочена алтернатива

Видове грешки при проверката на хипотези

Приемането или отхвърлянето на нулевата хипотеза представляват двете възможни решения от страна на изследователя, предприети въз основа на статистически съображения. При всяко от тези решения съществува известна вероятност за грешка.

Грешка от първи род (α – грешка). Отхвърлянето на нулевата хипотеза, когато тя е валидната хипотеза, представлява грешка от първи род. С други думи може да се каже, че грешката от първи род е свързана с твърдение за несъществуващ ефект.Грешка от втори род (β – грешка). Приемането на нулевата хипотеза, когато тя не е валидната хипотеза, представлява грешка от втори род. Т.е. отхвърлянето на съществуващ ефект води до грешка от втори род.

И двата вида грешки са нежелани следствия от решението на изследователя. Грешката от първи род представлява в по-висока степен нежелано последствие, като основните причини за това са две. Първо, в основната част от случаите целта на изследователят е да докаже съществуването на някакъв ефект, което всъщност е свързано с решението за отхвърляне на нулевата хипотеза. Именно едно такова действие е свързано с вероятност за допускане на грешка от първи род. Второ, теорията за проверка на статистически хипотези се основава на контрола на вероятността за грешка от първи род по един сравнително елементарен начин от гледна точка на математическия апарат. Докато контрола на грешката от втори род представлява сложна и трудно изпълнима математическа цел.

Статистически критерий и ниво на значимост

Статистическите хипотези се проверяват с помощта на специфични статистически критерии. Стойностите на тези критерии се получават от предварително известни теоретични разпределения. При проверката на всяка конкретна статистическа хипотеза, избраният критерий има две стойности – теоретична и емпирична. Теоретичната стойност може да бъде определена от таблици с теоретичните стойности на съответния критерий, а емпиричната се изчислява по конкретна математическа формула с данните на репрезентативната извадка. В основата на всеки статистически тест за проверка на хипотези стои именно статистическият критерий.

При избора на подходящ критерий е необходимо да се познават условията, на които трябва да отговарят променливите величини и естеството на извадките.

Вероятността за допускане на грешка от първи род е свързана със статистическата значимост на получените резултати, а именно ако тази вероятност е достатъчно малка, това ще даде възможност да се приеме алтернативната хипотеза, т.е. да се приеме наличието на статистически значим ефект. В този смисъл вероятността за допускане на грешка от първи род представлява статистическото ниво на значимост. Определянето на критично (прагово) ниво на значимост (α) е свързано с възприетата статистическа вероятност, с която изследователя подкрепя своите твърдения (напр. при статистическа вероятност 0.95, α=0.05, съответно при 0.99 – α=0.01 и т.н.). Теоретичната стойност на избрания критерий разделя числовата ос на две области – област на приемане на H0 и област на отхвърляне на H0. Областта на отхвърляне на нулевата хипотеза се нарича още критична област за H0. Тази област може да бъде двустранна или едностранна (лявостранна или дясностранна). Това зависи от формулираната алтернативна хипотеза.

теоретичните значения на критерия, съответстващи на квантилите от ред α/2 и (1-α/2)теоретичните значения на критерия, съответстващи на квантилите от ред α/2 и (1-α/2)

Вероятността за приемане на H1, когато тя е валидната хипотеза, се свързва с мощността на избрания критерий. Мощността на критерия (γ) е в пряка връзка с грешката от втори род и се изразява чрез равенството: γ=1-β

Етапи при проверката на статистически хипотези

Както стана ясно по-рано, на проверка се подлага H0. Процедурата при тази проверка преминава през няколко етапа.

  • Формулиране на H0 и H1.
  • Определяне (избор) на критичното ниво на значимост α. Това зависи от естеството на провежданото изследване. Обикновено се избира да бъде 0.05 или 0.01.
  • Избор на статистически тест (критерий) за проверката. Избора се извършва въз основа на условията, на които трябва да отговарят отделните променливи и извадката. (вж. гл. VI)
  • Изчисляване на емпиричната стойност на избрания критерий.
  • Определяне на теоретичната стойност на критерия. Това става от съответните таблици, като се има предвид избраното ниво на значимост и степените на свобода.
  • Вземане на решение (приемане или отхвърляне на нулевата хипотеза). С този етап е свързано и самото статистическо заключение.

Решението да се приеме или отхвърли H0 зависи от съотношението между теоретичната и емпиричната стойност на избрания критерий.

Ако KЕ>KT, тогава нулевата хипотеза се отхвърля в полза на алтернативната и заключението ще бъде, че съществува статистически значим ефект. В обратния случай, когато KЕ≤KT, тогава нулевата хипотеза се приема и заключението е, че не се наблюдава статистически значим ефект. Решението за приемане или отхвърляне на H0 може да се вземе и като се сравнят – зададеното критично ниво на значимост αи изчислената от данните с помощта на статистически софтуер емпирична стойност на нивото на значимост (p). Проверката протича по следния начин: ако p<α, тогава H0 се отхвърля в полза на Hиако p≥α, тогаваH0 се приема. В статистическите софтуерни продукти, чрез които може да се прави статистическа проверка на хипотези, p-стойността обикновено се означава в резултатите като sig. или p-value.

Литература:

1. Ранчов, Г.,  Медицинска статистика, Горекспрес,  1997, София, 274 с.

2. Ранчов, Г.,  Биостатистика и биоматематика, Еко Принт,  2008, София, 388 с.

3. Willcox W., The Founder of Statistics. Review of the International Statistical Institute. 5 (4). 1938. pp. 321-328.

ИЗДАТЕЛСТВО "ФОЗ"

e-mail:  press@foz.mu-sofia.bg

КОНТАКТИ

гр. София, ул. „Бяло море“ №8 УМБАЛ „Царица Йоанна“ – ИСУЛ ет. 5, 
тел. 02 9432 127

e-mail:  fph@foz.mu-sofia.bg

© Faculty of Public Health  2024          |            Защита на личните данни (GDPR)

bg_BGBG