Анализът на остатъците играе важна роля за валидиране на регресионния модел. Ако терминът за грешка в регресионния модел отговаря на четирите предположения, отбелязани по-рано, тогава моделът се счита за валиден. Тъй като статистическите тестове за значимост също се основават на тези предположения, заключенията, произтичащи от тези тестове за значимост, се поставят под въпрос, ако предположенията относно ε не са изпълнени.
The i th остатъчен е разликата между наблюдаваната стойност на зависимата променлива, Y. i , и стойността, предвидена от изчислено уравнение за регресия , ŷ i . Тези остатъци, изчислени от наличните данни, се третират като оценки на грешката на модела, ε. Като такива те се използват от статистиците за валидиране на предположенията относно ε. Добрата преценка и опит играят ключови роли в остатъчния анализ.
Графичните графики и статистическите тестове относно остатъците се изследват внимателно от статистиците и се правят преценки въз основа на тези изследвания. Най-често срещаните остатъчни парцели показват ŷ по хоризонталната ос и остатъците по вертикалната ос. Ако предположенията относно члена на грешката, ε, са изпълнени, остатъчният график ще се състои от хоризонтална лента от точки. Ако остатъчният анализ не показва, че предположенията за модела са изпълнени, той често предлага начини, по които моделът може да бъде модифициран, за да се получат по-добри резултати.
При регресионния анализ изграждането на модел е процес на разработване на вероятностен модел, който най-добре описва връзката между зависимите и независимите променливи. Основните проблеми са намирането на правилната форма (линейна или криволинейна) на връзката и избора кои независими променливи да бъдат включени. При изграждането на модели често е желателно да се използват както качествени, така и количествени променливи.
Както беше отбелязано по-горе, количествените променливи измерват колко или колко; качествените променливи представляват типове или категории. Да предположим например, че е от интерес да се предскажат продажбите на студен чай, който се предлага в бутилки или кутии. Ясно е, че независимият тип контейнер с променлива може да повлияе на продажбите на зависимите променливи. Типът на контейнера обаче е качествена променлива и на него трябва да се присвоят числови стойности, ако ще се използва в регресионно проучване. Така наречените фиктивни променливи се използват за представяне на качествени променливи в регресионния анализ. Например фиктивната променлива х може да се използва за представяне на тип контейнер чрез настройка х = 0, ако студен чай е опакован в бутилка и х = 1, ако студеният чай е в кутия. Ако напитката може да се постави в стъклени бутилки, пластмасови бутилки или кутии, ще са необходими две фиктивни променливи, които правилно да представят качествения променлив тип контейнер. Общо взето, да се - Необходими са 1 фиктивни променливи, за да се моделира ефектът от качествена променлива, която може да се приеме да се стойности.
Общият линеен модел Y. = β0+ β1 х 1+ βдве х две+. . . + β стр х стр + ε може да се използва за моделиране на голямо разнообразие от криволинейни връзки между зависими и независими променливи. Например, всяка от независимите променливи може да бъде нелинейна функция на други променливи. Също така статистиците понякога намират за необходимо да трансформират зависимата променлива, за да изградят задоволителен модел. Логаритмичната трансформация е един от най-често срещаните видове.
Корелационният и регресионният анализ са свързани в смисъл, че и двете се занимават с връзките между променливите. Коефициентът на корелация е мярка за линейна асоциация между две променливи. Стойностите на коефициента на корелация винаги са между -1 и +1. Коефициентът на корелация от +1 показва, че две променливи са перфектно свързани в положителен линеен смисъл, коефициентът на корелация от -1 показва, че две променливи са перфектно свързани в отрицателен линеен смисъл, а коефициентът на корелация от 0 показва, че няма линейна връзка между двете променливи. За проста линейна регресия коефициентът на корелация на пробата е квадратният корен от коефициента на детерминация, като знакът на коефициента на корелация е същият като знака на б 1, коефициентът на х 1в изчисленото уравнение на регресията.
коя змия се класира като най-опасната за хората в Америка?
Нито регресионният, нито корелационният анализ не могат да се интерпретират като установяване на причинно-следствени връзки. Те могат да посочат само как или до каква степен променливите са свързани помежду си. Коефициентът на корелация измерва само степента на линейна асоциация между две променливи. Всички заключения за причинно-следствена връзка трябва да се основават на преценката на анализатора.
Динамичен ред е набор от данни, събрани в последователни моменти от време или през последователни периоди от време. Поредица от месечни данни за стартиране на нови жилища и поредица от седмични данни за продажби на продукти са примери за времеви редове. Обикновено данните във времеви редове се събират на равни интервали от време, като час, ден, седмица, месец или година.
Основната грижа на анализа на времевите редове е разработването на прогнози за бъдещи стойности на поредицата. Например, федералното правителство разработва прогнози за много икономически редове като брутния вътрешен продукт, износа и т.н. Повечето компании разработват прогнози за продажби на продукти.
Докато на практика се използват както качествени, така и количествени методи за прогнозиране, статистическите подходи за прогнозиране използват количествени методи. Двата най-широко използвани метода за прогнозиране са авторегресивната интегрирана плъзгаща се средна (ARIMA) на Box-Jenkins и иконометричните модели.
Методите ARIMA се основават на предположението, че вероятностен модел генерира данни за времевите редове. Предполага се, че бъдещите стойности на времевите редове са свързани с минали стойности, както и с минали грешки. Времевите редове трябва да са неподвижни, i.e. , който има постоянна средна стойност, дисперсия и функция за автокорелация, за да бъде приложим модел ARIMA. За нестационарни серии понякога могат да се приемат разлики между последователни стойности и да се използват като стационарни серии, към които може да се приложи моделът ARIMA.
къде се намира нюйоркското време
Иконометричните модели разработват прогнози за времеви редове, използвайки един или повече свързани времеви редове и евентуално минали стойности на редовете. Този подход включва разработване на регресионен модел, в който се прогнозира времевият ред като зависима променлива; свързаните времеви редове, както и миналите стойности на времевите редове са независимите или прогнозни променливи.
Обсъдените по-горе статистически методи обикновено се фокусират върху параметри на популации или вероятностни разпределения и се наричат параметрични методи. Непараметричните методи са статистически методи, които изискват по-малко предположения за популация или разпределение на вероятностите и са приложими в по-широк кръг от ситуации. За да бъде класифициран статистически метод като непараметричен метод, той трябва да отговаря на едно от следните условия: (1) методът се използва с качествени данни или (2) методът се използва с количествени данни, когато не може да се направи предположение за разпределението на вероятността на популацията. В случаите, когато са приложими както параметрични, така и непараметрични методи, статистиците обикновено препоръчват да се използват параметрични методи, тъй като те са склонни да осигуряват по-добра точност. Непараметричните методи са полезни обаче в ситуации, в които предположенията, изисквани от параметричните методи, изглеждат съмнителни. Няколко от най-често използваните непараметрични методи са описани по-долу.
Да приемем, че хората от извадка са помолени да заявят предпочитание към един от двата подобни и конкуриращи се продукти. Знак плюс (+) може да бъде записан, ако дадено лице предпочита един продукт и знак минус (-), ако лицето предпочита другия продукт. С качествени данни в тази форма тестът с непараметричен знак може да се използва за статистическо определяне дали съществува разлика в предпочитанията за двата продукта за популацията. Тестът за знаци също може да се използва за тестване хипотези за стойността на медиана на популацията.
Тестът с подписан ранг на Wilcoxon може да се използва за тестване на хипотези за две популации. При събирането на данни за този тест, всеки елемент или експериментална единица в извадката трябва да генерира две сдвоени или съвпадащи стойности на данни, една от популация 1 и една от популация 2. Разликите между сдвоените или съпоставените стойности на данните се използват за тестване на разлика между двете популации. Тестът на Wilcoxon със знаков ранг е приложим, когато не може да се направи предположение за формата на вероятностните разпределения за популациите. Друг непараметричен тест за откриване на разлики между две популации е тестът на Mann-Whitney-Wilcoxon. Този метод се основава на данни от две независими случайни извадки, една от популация 1 и друга от популация 2. Няма съответствие или сдвояване, както се изисква за теста на Wilcoxon с ранг.
Предлагат се и непараметрични методи за корелационен анализ. Коефициентът на корелация на ранга на Спирман е мярка за връзката между две променливи, когато са налични данни под формата на рангови подреждания. Например, коефициентът на корелация на ранга на Спирман може да се използва за определяне на степента на съгласие между мъжете и жените по отношение на тяхното предпочитание от 10 различни телевизионни предавания. Коефициентът на корелация на ранг на Spearman от 1 ще означава пълно съгласие, коефициент от -1 ще означава пълно несъгласие и коефициент 0 ще покаже, че класирането не е свързано.
Статистическият контрол на качеството се отнася до използването на статистически методи за наблюдение и поддържане на качеството на продуктите и услугите. Един метод, посочен като вземане на проби, може да се използва, когато трябва да се вземе решение за приемане или отхвърляне на група части или предмети въз основа на качеството, открито в пробата. Вторият метод, наричан статистически контрол на процеса, използва графични дисплеи, известни като контролни диаграми, за да определи дали даден процес трябва да продължи или трябва да се коригира, за да се постигне желаното качество.
Да приемем, че потребителят получава пратка от части, наречени много от производител. Ще бъде взета проба от части и броят на дефектните елементи. Ако броят на дефектните артикули е нисък, ще бъде приета цялата партида. Ако броят на дефектните елементи е голям, цялата партида ще бъде отхвърлена. Правилните решения съответстват на приемането на партида с добро качество и отхвърлянето на партида с лошо качество. Тъй като се използва вземане на проби, вероятностите за погрешно решенията трябва да бъдат обмислени. Грешката при отхвърляне на партида с добро качество създава проблем за производителя; вероятността за тази грешка се нарича риск на производителя. От друга страна, грешката да се приеме некачествена партида създава проблем за купувача или потребителя; вероятността за тази грешка се нарича риск на потребителя.
Дизайнът на план за вземане на проби за приемане се състои от определяне на размера на извадката н и приемане критерий ° С , където ° С е максималният брой дефектни артикули, които могат да бъдат намерени в пробата и партидата все още да бъде приета. Ключът към разбирането както на риска на производителя, така и на риска на потребителя е да се приеме, че партидата има известен процент дефектни артикули и да се изчисли вероятността за приемане на партидата за даден план за вземане на проби. Чрез вариране на предполагаемия процент дефектни артикули в дадена партида могат да бъдат оценени няколко различни планове за вземане на проби и план за вземане на проби, така че рисковете както на производителя, така и на потребителя да са сравнително ниски.
Статистическият контрол на процесите използва вземане на проби и статистически методи за проследяване на качеството на текущ процес, като производствена операция. Графичен дисплей, посочен като контролна диаграма, предоставя основа за решаване дали вариацията в изхода на даден процес се дължи на често срещани причини (случайно възникващи вариации) или на необичайни причиними причини. Винаги, когато се определят причиними причини, може да се вземе решение за коригиране на процеса, за да се върне продукцията до приемливи нива на качество.
Ото фон Бисмарк е назначен от Германия от крал Вилхелм I през 1871г.
Диаграмите за контрол могат да бъдат класифицирани по типа данни, които съдържат. Например, х -диаграмата се използва в ситуации, когато се използва примерна средна стойност за измерване на качеството на продукцията. Количествени данни като дължина, тегло и температура може да се следи с х -диаграма. Променливостта на процеса може да се наблюдава с помощта на диапазон или R -диаграма. В случаите, в които качеството на продукцията се измерва по отношение на броя на дефектите или дела на дефектите в извадката, н стр -диаграма или a стр -диаграма може да се използва.
Всички схеми за контрол са изградени по подобен начин. Например, централната линия на х -chart съответства на средната стойност на процеса, когато процесът е под контрол и произвежда продукция с приемливо качество. Вертикалната ос на контролната карта идентифицира скалата на измерване за променлива на лихвата . Горната хоризонтална линия на контролната диаграма, посочена като горна контролна граница, и долната хоризонтална линия, посочена като долна контролна граница, са избрани така, че когато процесът е в контрол, ще има голяма вероятност стойността на средната стойност на пробата ще попадне между двете контролни граници. Стандартната практика е да се определят контролните граници при три стандартни отклонения над и под средната стойност на процеса. Процесът може да бъде пробен периодично. Тъй като е избрана всяка проба, стойността на средната стойност на пробата се нанася върху контролната диаграма. Ако стойността на средната стойност на пробата е в рамките на контролните граници, процесът може да продължи при предположението, че стандартите за качество се спазват. Ако стойността на средната стойност на пробата е извън контролните граници, заключение извън контрол посочва необходимостта от коригиращи действия, за да се върне процесът до приемливи нива на качество.
Copyright © Всички Права Запазени | asayamind.com