Хүчин зүйлийн шинжилгээ. Үндсэн бүрэлдэхүүн хэсгийн арга. Үндсэн бүрэлдэхүүн хэсгийн арга Үндсэн бүрэлдэхүүн хэсгүүдийг сонгох шалгуур

Толгойн бүрэлдэхүүн хэсгийн арга нь олон тооны хамаарал бүхий (насан, үндэстэй) хувьсагчдыг цөөн тооны бие даасан хувьсагчдад хөрвүүлдэг арга бөгөөд олон тооны хувьсагч нь мэдээлэлд дүн шинжилгээ хийх, тайлбарлахад хүндрэл учруулдаг. Хатуу kazhuchi, tsey аргыг хүчин зүйлийн шинжилгээ хийхээс өмнө авч үзэхгүй, гэхдээ энэ нь баялаг байж болох юм. Тодруулбал, эхний ээлжинд, тоолох журмын явцад нэн даруй бүх нялцгай биетүүд болон тэдгээрийн тоог сүүлийн өөрчлөлтийн зардлын талаас илүү хувийг авдаг хүмүүс; өөрөөр хэлбэл, энэ нь бүх гадаад өөрчлөлтийн тархалтын шинэ хуваарилалт, өөрөөр хэлбэл. її далд фактороор дамжуулан гадаад тайлбар (тодруулсан шинж тэмдэг).

Жишээлбэл, бид судалгаа хийж, оюутнуудын оюун ухааныг Вечслерийн тест, Эйзенкийн тест, Равенийн тест, мөн нийгэм, танин мэдэхүйн болон дэлхийн сэтгэлзүйн амжилтаар хэмждэг судалгаа хийсэн бололтой. Аль болох оюун ухааны янз бүрийн тестийн үзүүлэлтүүд хоорондоо уялдаатай байхын тулд өмхий нь өөр өөр байсан ч доод талын нэг шинж чанар болох його оюуны эрүүл мэндийг бий болгодог. Yakscho zminnyh үед doslіzhenny хэтэрхий баян ( х 1 , х 2 , …, х х ) , Deyakі їх vzaєmopov'yazanі, дараа нь сүүлийн нэг vinikaє bazhannya өөрчлөлтийн тоог богиносгож, өгөгдлийн нугалах өөрчлөх. Аль нь болон шинэ өөрчлөлтийн sprat бий болгож буй толгой бүрэлдэхүүн хэсгүүдийн арга үйлчилдэг y 1 , y 2 , …, y х, зарим нэг шугаман хослол бүхий кобын өөрчлөлттэй арьс х 1 , х 2 , …, х х :

y 1 =a 11 x 1 +a 12 x 2 +…+a 1p x p

y 2 \u003d a 21 x 1 + a 22 x 2 + ... + a 2p x p

… (1)

y p =a p1 x 1 +a p2 x 2 +…+a pp x p

Өөрчлөлтүүд y 1 , y 2 , …, y х chinniks толгойн бүрэлдэхүүн хэсэг гэж нэрлэдэг. Ийм байдлаар хүчин зүйл нь корреляцийн матрицын тусгай хувиргалтын шалтгаан болсон статистикийн нотолгоо юм. . Үржүүлэх үйлдлийг матрицын хүчин зүйлчлэл гэж нэрлэдэг. Корреляцийн матрицаас хүчин зүйл ангилсны үр дүнд хүчин зүйлсийн тоог гарч буй өөрчлөлтүүдийн тоотой тэнцүү тоо хүртэл өөрчилж болно. Гэсэн хэдий ч хүчин зүйлчлэлийн үр дүнд гарч ирэх хүчин зүйлүүд нь дүрмээр бол тэдгээрийн утгатай тэнцүү биш юм.

Коэффицент а ij, шинэ өөрчлөлтийг илэрхийлдэг , шинэ өөрчлөлтүүд (толгой бүрэлдэхүүн хэсэг, хүчин зүйлүүд) нь өгөгдлийн хамгийн их хэлбэлзлийн хэмжээг тодорхойлж, хоорондоо маргалддаггүй байдлаар сонгогддог. Ихэнхдээ коэффициентүүдийг тодорхой харуулдаг а ij ийм байдлаар өмхий үнэр нь гадаад өөрчлөлт болон шинэ өөрчлөлт (хүчин зүйл) хоорондын хамаарлын коэффициент байв. Tse олон тоонд хүрдэг а ijхүчин зүйлийн стандарт хазайлт. Ихэнх статистикийн багцуудын хувьд энэ нь ийм байдлаар ажилладаг (STATISTICA програмын хувьд ч бас). Коэффицента ij Ширээний харагдах байдал нь өмхий үнэртэж, баганын харагдах байдал нь гутаан доромжилж, эгнээний харагдах байдал нь өөрчлөгддөг.

Ийм хүснэгтийг хүчин зүйлийн тохиргооны хүснэгт (матриц) гэж нэрлэдэг. Коэффициентээр nіy, є-д заасан тоонууд а ij. 0.86 гэсэн тоо нь эхний хүчин зүйл болон Wechsler тестийн утга хоорондын хамаарал 0.86 гэсэн үг юм. Үнэмлэхүй хүчин зүйл нь илүү өндөр байх тусам өөрчлөлт ба хүчин зүйлийн хоорондын холбоо улам хүчтэй болно.

Үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ (PCA) нь чиг хандлага, хэв маягийг хадгалж, өндөр хэмжээст өгөгдлийг нугалах ажлыг хялбаршуулдаг. Vіn rob tse, функцүүдийн хураангуй гэх мэт өгөгдлийг жижиг болгон хувиргадаг. Ийм өгөгдөл нь шинжлэх ухаан, технологийн янз бүрийн салбарт бүр илүү өргөн байдаг бөгөөд тэдгээр нь арьсны zrazka нь цөөн хэдэн шинж тэмдэг байдаг бол, жишээ нь, баялаг үзэл бодол ийм илэрхийлэл байдаг бол буруутгаж байна. Энэ төрлийн хүндэтгэл нь өршөөлийн давтамжийг олон удаа засч залруулах замаар өршөөлийн давтамжаас үүдэлтэй асуудлуудыг илэрхийлдэг.

Арга нь бөөгнөрөлтэй төстэй - хэв маягийг илгээх, дүн шинжилгээ хийхгүйгээр мэдэх, янз бүрийн бүлгийн судалгаанаас pereveryayuchi, чи zrazki, өмхий үнэр нь vіdmіnnostі istotnі байж болно. Бүх статистик аргуудын нэгэн адил йог буруу оношлох боломжтой. Өөрчлөлтүүдийн масштабыг дүн шинжилгээ хийхдээ янз бүрийн үр дүнд хүргэж болох бөгөөд энэ нь өгөгдлийн өмнөх утгын дагуу засч залруулахгүй байх нь чухал юм.

Бүрэлдэхүүн хэсгүүдийн шинжилгээний зорилго

Үндсэн мета арга нь өгөгдлийн багц дахь өөрчлөлтийг илрүүлэх, шинэ чухал үндсэн өөрчлөлтүүдийг тодорхойлох явдал юм. Энэ зорилгоор тусгай хэрэгслийг ашиглах шаардлагатай, жишээлбэл, TableOfReal өгөгдлийн матриц дахь баялаг өгөгдлийг сонгох, өөрчлөлт, өөрчлөлттэй тохирох ижил мөрөнд. Тиймээс TableOfReal-ийг вектор ба өгөгдлийн дугаарOfRows, ийм тооны элементийн арьсны вектор Багана гэж тайлбарладаг.

Уламжлал ёсоор, толгойн бүрэлдэхүүн хэсгийн арга нь ковариацын матриц эсвэл корреляцийн матриц дээр суурилдаг бөгөөд үүнийг өгөгдлийн матрицаас тооцоолж болно. Ковариацын матрицыг квадрат болон хөндлөн үүсгэхийн нийлбэрийг масштаблахад ашиглаж болно. Корреляцийн матриц нь ковариацын матрицтай төстэй боловч эхний ээлжинд энэ нь өөрчлөгддөг тул багануудыг стандартчилдаг. Заримдаа энэ нь өгөгдлийг стандартчилахад тохиолддог, учир нь тэдгээрийн заримынх нь зөрүү маш их ялгаатай байдаг. Өгөгдөлд дүн шинжилгээ хийхийн тулд объектуудын жагсаалтаас TabelOfReal өгөгдлийн матрицыг сонгоод явахын тулд дарна уу.

Үндсэн бүрэлдэхүүн хэсгүүдийн аргын хувьд объектын жагсаалтад шинэ объект гарч ирэхээс өмнө Tse prizvede. Одоо та муруй утгуудын графикийг нэмж, арьсны ач холбогдлыг харгалзан үзэх боломжтой. Мөн хөтөлбөр нь дию-г санал болгож болно: тархалтын нэг хэсгийг салгах эсвэл эрчим хүчний утгын тооны тэгш байдлыг эргүүлж, тэгш байдлыг арилгах. Oskіlki komponenti otrimani оновчлолын тодорхой ажлуудыг шийдвэрлэх арга зам, "нахиалах" хүчний үйлсийн өмхий үнэр, жишээ нь, хамгийн их minlivost. Нэмж дурдахад хүчин зүйлийн шинжилгээ хийх боломжтой бусад эрх мэдэл бага байдаг.

арьсны тархалт, түүний гадаад өөрчлөлтийн нийт тархалтын хэсэгт, чадлын утгуудаар тогтоогддог;
болгоомжтой байх цагийн хувьд арьсны бүрэлдэхүүн хэсгийн ач холбогдлыг харуулсан үнэлгээний тооцоо;
otrimannya navantage, арьсны бүрэлдэхүүн хэсэг болон арьсны өөрчлөлтийн хоорондын хамаарлыг хэрхэн тодорхойлох;
нэмэлт p-бүрэлдэхүүнд зориулж үүсгэсэн гадаад өөрчлөлтүүдийн хоорондын хамаарал;
амралтын өдрүүдийн ажилд өгөгдлийг p-бүрэлдэхүүн хэлбэрээр хийж болно;
Тайлбарыг сайжруулахын тулд бүрэлдэхүүн хэсгүүдийн "эргэлт".

Хадгаламжийн цэгүүдийн тоог сонгоно уу

Хадгалахын тулд шаардлагатай тооны бүрэлдэхүүн хэсгүүдийг сонгох хоёр арга бий. Гомдлын аргууд нь vіdnosinah mizh vlasnymi утгыг үндэслэдэг. Хэнд зориулж хуваарийн утгыг ашиглахыг зөвлөж байна. График дээрх цэгүүд virіvnyuvatisya болон тэг рүү ойртох хандлагатай байдаг тул тэдгээрийг үл тоомсорлож болно. Бүрэлдэхүүн хэсгүүдийн тоог тоонд оруулан, дэлхийн тархалтын нэг хэсэгт орж байгаа мэт. Жишээлбэл, нийт тархалтын 95% -д сэтгэл хангалуун байхын тулд бүрэлдэхүүн хэсгүүдийн тоо (VAF) 0.95 байна.

Үндсэн бүрэлдэхүүн хэсгүүдийг олон нийтийн векторуудын өргөн хүрээний өгөгдлийн вектор дахь үндсэн бүрэлдэхүүн хэсгүүдийн аргын баялаг статистик дүн шинжилгээг боловсруулахад ашигладаг. Та үүнийг хоёр аргаар үүсгэж болно - TableOfReal-аас шууд PCA объектыг үүсгэхгүйгээр, дараа нь тохиргоо эсвэл тоог харуулах боломжтой. Объект болон TableOfReal-ийг нэгэн зэрэг сонгоод "Тохиргоо" -г ийм байдлаар нойтон өнгөлсөн бүрэлдэхүүн хэсгүүдийн шинжилгээ ялалт байгуулна.

Эхлэх цэг болгон үүнийг тэгш хэмтэй матрицаар харуулав, жишээлбэл, ковариац, эхлээд үүнийг богиносгож, дараа нь далд алдаатай QL алгоритм. Цэг нь зөв цэг ба өгөгдлийн матриц учраас квадратуудын нийлбэрээс матриц үүсгэх боломжгүй юм. Натомист, тоон хувьд илүү тогтвортой арга руу шилжиж, зохицуулалтыг ганцаарчилсан утгын дагуу шийдээрэй. Ижил матриц нь сайн вектор бөгөөд диагональ дөрвөлжин элементүүд нь сайн утгууд юм.

Гол бүрэлдэхүүн хэсэг є нь дамми-д зориулсан head компонентын аргыг ашиглан өгөгдлийн багц дахь гадаад таамаглагчдын шугаман хослолыг хэвийн болгоход ашигласан. Зураг дээр PC1 ба PC2 нь үндсэн бүрэлдэхүүн хэсэг юм. Зөвшөөрөгдөх, є бага таамаглагч, сарлаг X1, X2 ..., XP.

Үндсэн бүрэлдэхүүнийг дараах байдлаар бичиж болно: Z1 = 11X1 + 21X2 + 31X3 + .... + p1Xp

Z1 нь эхний толгойн бүрэлдэхүүн хэсэг;
p1 - эхний үндсэн бүрэлдэхүүн хэсгийн хоосон чанарыг (1, 2.) нэмдэг хоосон вектор.

Ашигт ажиллагаа нь квадратын нийлбэрээр солигддог 1. Энэ нь үүнтэй холбоотой, ашигт ажиллагааны том үнэ цэнэ нь их хэмжээний тархалтад хүргэдэг. Vіn нь мөн үндсэн бүрэлдэхүүн хэсгийг (Z1) шууд заадаг бөгөөд үүнд хамгийн их ялгаатай байдаг. Цэ r-хэмжийн өргөн дэх шугам, n-хамгаалагч руу ойртуулах.

Ойролцоох vymіryuєtsya z vikoristannyam дундаж дөрвөлжин Евклидийн долгион. X1..Xp нь нормчлогдсон таамаглагч юм. Хэвийн таамаглагчид тэгтэй тэнцүү дундаж утгатай байж болох ба стандарт хазайлт нь нэгтэй тэнцүү байна. Мөн эхний толгойн бүрэлдэхүүн хэсэг нь өгөгдлийн багц дахь хамгийн их хэлбэлзлийг засдаг гадаад чанга яригчийн бүхэл бүтэн хослол юм. Vіn vyznaє шууд өгөгдлийн хамгийн их удаашралтай. Эхний бүрэлдэхүүн хэсэгт хэдий чинээ жижиг зүйл тогтоогдоно төдий чинээ их мэдээллийг түүнээс авдаг. Zhoden іnshiy анхны үндсэн илүү ээж minlivіst чадахгүй.

Эхний үндсэн бүрэлдэхүүн хэсгийг өгөгдөлд хамгийн ойр байрлах мөрөнд авчирч, өгөгдлийн цэг ба шугамын хоорондох квадратын хамгийн бага нийлбэрт хүргэнэ. Бусад толгойн бүрэлдэхүүн хэсэг (Z2) нь мөн өгөгдлийн багцад дутуу байгаа дисперсийг засдаг, Z1 нь хамааралгүй тул гаднах таамаглагчдын шугаман хослол юм. Өөрөөр хэлбэл, эхний болон бусад бүрэлдэхүүн хэсгүүдийн хоорондын хамаарал тэг болж болно. Vіn-ийг дараах байдлаар илэрхийлж болно: Z2 = 12X1 + 22X2 + 32X3 + .... + p2Xp.

Тэдгээр нь хамааралгүй юм шиг шууд ортогональ байж болно.

Нэмж дурдахад үндсэн бүрэлдэхүүн хэсгүүдийн тооцоолол нь бүх сонголтын туршилтын өгөгдлийг урьдчилан таамаглах процесс эхэлдэг. Цайны савны үндсэн бүрэлдэхүүн хэсгийн аргын үйл явц нь энгийн байдаг.

Жишээлбэл, R (3.4.2 хувилбар) киноны төв болон масштабын функц, йогийн номын сан rvest зэрэг тестийн багц руу хөрвүүлэх талаар ажиллах шаардлагатай. R - статистикийн тооцоолол, график дүрслэлд зориулсан үнэгүй хэлний програмчлал. Vіn buv 1992 онд користувачуудын статистикийн даалгаврыг биелүүлэхийн тулд хаданд сэргээн босгосон. PCA-ийн дараа загварчлах бүх үйл явц.

Питон дээр PCA-г хэрэгжүүлэхийн тулд sklearn номын сангаас өгөгдлийг импортлох хэрэгтэй. Тайлбар нь R-тэй ижил хэвээр байна. Python-д зориулсан цөөн хэдэн өгөгдлүүд нь утгуудыг нэг өдөр оруулан, ангилсан өөрчлөлтүүдийг тоо болгон хувиргадаг цэвэршүүлсэн хувилбар юм. Загварчлах үйл явц нь R cortex-ийн жишээнд тайлбарласны дагуу хэвээр үлддэг.

Үндсэн бүрэлдэхүүн хэсгийн аргын санаа нь хүчин зүйлийн шинжилгээг хөгжүүлэхэд ойр дотно байх болно. 1-ээс p хүртэл нэгтгэхийн оронд одоо 1-ээс m хүртэл нэгтгэж, нийлбэр дэх p-m гишүүний үлдсэн хэсгийг үл тоомсорлож, 3 дахь виразыг хасав. Матрицын тэмдэглэгээний үлдэгдэл илэрхийлэлийг өгдөг хүчин зүйлийн давуу L матрицын тэмдэглэгээнд зориулж сонгосон шүлэгт үзүүлсэн шиг tse-г дахин бичих боломжтой. Дүрмээр бол стандартчилагдсан vimirovanie нь зөвтгөгдөж, R хамаарлын сонголтын матрицаар солигддог.

Tse нь хүчин зүйлийн шинжилгээнд давамгайлсан L хүчин зүйлийн матрицыг бүрдүүлдэг бөгөөд үүнийг шилжүүлсэн L дагалддаг. Тодорхой дисперсийг тооцоолохын тулд дисперс-ковариацын матрицын хүчин зүйлийн загвар.

Одоо бид илүү сайн матрицын дисперс-ковариацыг хассан LL байна".

Си бол i-р хичээлийн хамгаалагчдын вектор юм.
S нь бидний чичиргээний дисперс-ковариацын матрицыг илэрхийлдэг.

Ковариацын дисперсийн qi матрицын ижил p чадлын утгууд, мөн qi матрицын ижил чадлын векторууд.

Хүчинтэй утгууд S:λ^1, λ^2, ..., λ^p.

Эрчим хүчний векторууд S: e^1, e^2, ..., e^n.

PCA шинжилгээ нь олон тооны өөрчлөлтөөс баялаг өгөгдлийн багц нэмэх боломжийг олгодог олон талт шинжилгээний хамгийн хэцүү бөгөөд түгээмэл арга юм. Энэ аргын цаана толгойн бүрэлдэхүүн хэсгүүдийн аргыг биоинформатик, маркетинг, социологи, бусдын баялагт өргөнөөр ашигладаг. XLSTAT нь Excel-д өгөгдлийг зуучлагчгүйгээр харуулах бүрэн бөгөөд уян хатан функцээр хангадаг бөгөөд Excel-ийн өгөгдлийн тайланг гүнзгий харах боломжийг олгохын тулд хэд хэдэн стандарт болон өргөтгөсөн сонголтуудыг түгээдэг.

Та програмыг дуусаагүй өгөгдлийн матрицууд дээр ажиллуулж, хамгаалалтад нэмэлт өөрчлөлт оруулж, картын уншилтыг оновчтой болгох өөр өөр шалгуурын дагуу өөрчлөлтийг шүүж болно. Түүнээс гадна та эргэж болно. Харьцангуй багана үүсгэх нь амархан, график нь Excel-ийн стандарт диаграм шиг хамгаалагч юм. Үр дүнгийн талаархи мэдээллийг дамжуулахад хангалттай бөгөөд ингэснээр дүн шинжилгээнд ялах болно.

XLSTAT нь үндсэн бүрэлдэхүүн хэсгийг тооцоолохын өмнө оролтын өгөгдөлд ашиглагдах хэд хэдэн өгөгдөл боловсруулах аргыг танилцуулж байна.

Pearson, сонгодог PCA нь үр дүнд нь агуу урам зоригоос үүдэлтэй өөрчлөлтүүдийн хэт их урсгалыг арилгахын тулд тооцооллын өгөгдлийг автоматаар стандартчилдаг.
Стандарт бус явалттай ажилладаг ковариац.
Полигорик, дараалсан өгөгдлийн хувьд.

Өгөгдсөн өгөгдөлд дүн шинжилгээ хийх

Та тэгш хэмтэй корреляцийн ковариацын матрицыг ашиглан үндсэн бүрэлдэхүүн хэсгүүдийн аргыг харж болно. Tse нь матриц нь тоон болон стандартчилагдсан өгөгдлийн эх байж болно гэсэн үг юм. Үүнийг зөвшөөрнө, є өгөгдөл залгах нь 300 (n) × 50 (p). Энд n нь анхааруулгын тоо, p нь урьдчилан таамаглагчдын тоо юм.

Oskіlki є агуу p = 50, p(p-1)/2 боломжтой. Энэ тохиолдолд урьдчилан таамаглагч p-ийн дэд үржүүлэгчийг сонгох нь нийтлэг арга байх болно (х<< 50), который фиксирует количество информации. Затем следует составление графика наблюдения в полученном низкоразмерном пространстве. Не следует забывать, что каждое измерение является линейной комбинацией р-функций.

Хоёр өөрчлөлтөөс матрицад зориулсан өгзөг. Толгойн бүрэлдэхүүн хэсгүүдийн аргын энэхүү хэрэглээнд Девисийн өгөгдлийн тоо бүхий хоёр ээлжлэн (том ба диагональ дохина) өгөгдлийн багцыг бий болгодог.

Бүрэлдэхүүн хэсгүүдийг хуваарилалтын диаграм дээр ийм байдлаар будаж болно.

Энэ график нь өгөгдлийн оновчтой холбоосыг хангадаг эхний эсвэл үндсэн бүрэлдэхүүн хэсгийн санааг харуулж байна - ийм график дээр өөр шугам зурсан бөгөөд энэ нь шугам дээрх өгөгдлийн цэгүүдийн урьдчилан таамагласан утгуудын багцыг үүсгэдэггүй. тархалт.

Эхний бүрэлдэхүүн хэсэг нь мөн өөрчлөгдсөн толгойн жин (RMA) бүхий регрессэд нэмж болно, энэ нь х-, тийм болон y-өөрчлөлт зэрэг нь өршөөл эсвэл ач холбогдолгүй байж болно, эсвэл хооронд нь тодорхой ялгаа байхгүй байна. толгой ба салхи.

Эконометрик дэх толгойн бүрэлдэхүүн хэсгүүдийн арга нь ҮНБ, инфляци, валютын ханш гэх мэт өөрчлөлтүүдийн дүн шинжилгээ юм. Дараа нь бид тэдгээрийг тодорхой татвар, толгойн зэрэглэл, нийт хугацааны цувралаар үнэлдэг. Гэхдээ макро эдийн засгийн хувьд биш харин баялаг хөтөлбөрүүдэд зориулж эконометрик загваруудыг өөрчилж болно. Тэгэхээр эконометрик гэдэг нь эдийн засгийн ертөнц гэсэн үг.

Мэдээллийн хамгийн сайн эконометрикс хүртэлх статистикийн аргуудыг хөгжүүлэх нь эдийн засгийн өөрчлөлтүүдийн харилцан хамаарлыг харуулж байна. Эконометрик загварын энгийн жишээ. Иргэдийн дийлэнх нь өмнөх сард амьд үлдсэн хүмүүсийн орлогоос хамаарч шугаман байдлаар сэргэх төлөвтэй байна. Ижил загвар нь эвхэгддэг

Эконометрикийн даалгавар бол a ба b параметрийн тооцоог үнэлэх явдал юм. Тооцоолсон параметрүүдийн тоо нь тэнцүү загварт ялсан тул өмнөх сарын орлогод багтаж байгаа амьдралын ирээдүйн үнэ цэнийг урьдчилан таамаглах боломжийг олгодог. Эдгээр төрлийн загваруудыг боловсруулахад хэдэн цагийг даатгах шаардлагатай байна.

өгөгдөл үүсгэдэг хөдөлгөөнт үйл явцын мөн чанар;
tse-ийн талаар мэддэг;
системийн өргөтгөл;
дүн шинжилгээ хийх хэлбэр;
obriy урьдчилсан мэдээ;
системийн математик нугалах.

Бүх шалтгаанууд нь чухал бөгөөд тэдгээрийн доторх хэлтэрхийнүүд загвар өмсөгчдийн нэгэн адил өршөөл үзүүлдэг. Үүнээс гадна эдгээр асуудлыг шийдвэрлэхийн тулд урьдчилан таамаглах аргыг боловсруулах шаардлагатай. Үүнийг шугаман загварт авчирч болох боловч энэ нь жижиг сонголт хэвээр байна. Энэ төрөл нь хамгийн чухал зүйлийн нэг бөгөөд үүний тулд та урьдчилан таамаглах дүн шинжилгээ хийх боломжтой.

Параметрийн бус статистик

Параметрийн бус өгөгдлийн толгойн бүрэлдэхүүн хэсгүүдийн арга нь өгөгдлийг доод шугамаас эрэмбэлсэн дэлхийн аргуудаас өмнө байх ёстой. Параметрийн бус статистикийн аргуудыг янз бүрийн төрлийн судалгаанд өргөн ашигладаг. Практикт, хэрэв хэвийн байдлын талаархи таамаглалыг даван туулахгүй бол параметрийн статистик аргууд нь Оманд нэвтрүүлж болох үр дүнд хүргэдэг. Navpaki, Wimirami нь rozpodіl нь бага suvori тэтгэмж хол ичиж параметрийн бус аргууд.

Тэдний суурь дээр хэвтэж буй rozpodіlіv хамгаалагчаас үл хамааран өмхий үнэр нь найдвартай байдаг. Энэхүү судалгаагаар янз бүрийн төрлийн туршилтын загваруудад дүн шинжилгээ хийхдээ олон төрлийн параметрийн бус туршилтуудыг хуваасан. Ийм төслүүдэд нэг сонголтоос дизайн, хоёр зураасаар хийсэн загвар, санамсаргүй блокоос хийсэн загвар орно. Ninі параметрийн бус bayesivsky pіdkhіd іz zastosuvannym арга osnovnymi komponentіv vykoristovuєtsya нь даацын системүүдийн найдвартай байдлын шинжилгээг хялбаршуулдаг.

Хашлага систем нь тоон бүрэлдэхүүн хэсгүүдийг солих мэт харилцан дэд систем бүхий ердийн том хэмжээний нугалах систем юм. Системийн найдвартай байдлыг техникийн үйлчилгээнээс хоёр дахь удаагаа зочлоход харгалзан үздэг бөгөөд хөрөнгийн эдийн засгийн менежментийн хувьд найдвартай байдлыг хамгийн доод түвшинд үнэн зөв үнэлэх шаардлагатай болно. Prote өгөгдөл бодит ї nadіnostі практикт үргэлж бэлэн байдаг агаарын системийн тэнцүү бүрэлдэхүүн хэсгүүдээс бага, гэхдээ дуусгах тухай. Rozpodil zhittєvih tsiklіv komponentіv vіd virobnikіv ихэвчлэн hovaєєєєє sladnyuєєєєє sladnyuєєsya бодит vikoristannyam болон ажлын дунд. Ийм байдлаар ярианы талаархи өгөгдөл байгаа эсэхэд тухайн бүрэлдэхүүн хэсгийн амьдралын цагийг үнэлэх аргачлалын эрч хүчийг шинжлэх үндэслэлтэй байдалд дүн шинжилгээ хийх болно.

Орчин үеийн шинжлэх ухаанд үндсэн бүрэлдэхүүн хэсгүүдийн арга нь хоёр үндсэн зорилтыг биелүүлэхэд ялалт байгуулдаг.

социологийн судалгааны мэдээлэлд дүн шинжилгээ хийх;
suspіlnyh yavisch-ийн загваруудыг урамшуулах.

Загваруудыг хуваарилах алгоритмууд

Үндсэн бүрэлдэхүүн хэсгүүдийн аргын алгоритмууд нь загварын бүтэц, түүний тайлбарын талаар илүү их мэдээлэл өгдөг. Өмхий үнэр нь ПЦА янз бүрийн салбарт хэрхэн ялж байгааг илтгэнэ. Сүүлийн бүрэлдэхүүн хэсгийн тооцооны аргыг ашиглан шугаман бус давталттай хэсэгчилсэн хамгийн бага квадрат NIPALS-ийн алгоритм. Хэрэв та хангалттай гэж бодож байвал тооцооллыг мөрний төгсгөлд хийж болно. Илүү олон компьютерийн багцууд NIPALS алгоритмыг ялах хандлагатай байж болох ч хоёр үндсэн давуу тал бий:

Vіn opratsovuє vіdsutnі өгөгдөл;
бүрэлдэхүүн хэсгүүдийг дараалан тооцоолох.

Алгоритмын мета харагдац:

тухайн үнэлгээг сурталчлах гэсэн утгатай нэмэлт мэдээлэл өгөх;
арьсны бүрэлдэхүүн хэсэг нь бусад бүрэлдэхүүн хэсгүүдтэй хэрхэн ортогональ байдлаар хэвтдэггүй болохыг харуулсан;
Алгоритм нь байгаа өгөгдлийг хэрхэн боловсруулж болохыг харуулах.

Алгоритм нь арьсны бүрэлдэхүүн хэсгийг дараалан зурж, эхнийхээс шууд хамгийн их хэлбэлзэлтэй, дараа нь нөгөөг нь гэх мэтээр зурдаг. NIPALS нь нэг бүрдэл хэсгүүдийг нэг бүрчлэн тооцдог. t1t1-ийн эхний эквивалент, түүнчлэн p1p1 векторуудыг тооцоолохдоо хэрэв та чадлын утга эсвэл ганц утгуудын хуваарилалтаас мэдэж байсан бол XX дахь өгөгдлийг боловсруулж болно. Vіn үргэлж нэгдэж, гэхдээ zbіzhnіst іnоdі mоzhe bіlnoy. Энэ нь чадлын векторууд болон чадлын утгыг тооцоолох битүүмжлэлийн алгоритм гэх мэт танил бөгөөд гайхалтай өгөгдлийн багцад сайн ажилладаг. Google эрчим хүч дээр суурилсан оньсого системийн эхний хувилбаруудын алгоритмыг хакерджээ.

NIPALS-ийн уншилтын алгоритмыг доор харуулав.

Дараа нь T матрицын коэффициентийн тооцооллыг T=XW гэж тооцдог ба ихэвчлэн Y-ээс X дээрх B квадратуудын регрессийн коэффициентийг B = WQ гэж тооцдог. Хэсэгчилсэн хамгийн бага квадратуудын регрессийн хэсгүүдийг тооцоолох өөр аргыг дараах байдлаар тодорхойлж болно.

Толгойн бүрэлдэхүүн хэсгүүдийн арга нь өгөгдлийн багц дахь тархалтын үндсэн тэнхлэгүүдийг тодорхойлох хэрэгсэл бөгөөд өгөгдлийн үндсэн өөрчлөлтийг хялбархан дагаж мөрдөх боломжийг олгодог. Зөв байршуулах арга нь өгөгдөлд дүн шинжилгээ хийх хэрэгслүүдийн хамгийн дэвшилтэт аргуудын нэг юм.

Бүрэлдэхүүн хэсгүүдийн шинжилгээ нь эзлэхүүнийг багасгах өөр өөр арга гэж үздэг. Vіn өшөө авах нэг арга зам - үндсэн бүрэлдэхүүн хэсгүүдийн арга. Толгойн бүрэлдэхүүн хэсгүүд нь ортогональ координатын системд байрладаг бөгөөд бүрэлдэхүүн хэсгүүдийн хэлбэлзэл нь тэдгээрийн статистик хүчийг тодорхойлдог.

Враховючи нь эдийн засгийн амжилтын объектууд нь маш олон тооны шинж тэмдгээр тодорхойлогддог бөгөөд ийм олон тооны випадковын шалтгаануудад нөлөөлдөг.

Үндсэн бүрэлдэхүүн хэсгүүдийн тооцоо

X1, X2, X3, X4, ..., Xn хоёрдогч системийн тэмдгийн эхний толгойн Z1 бүрэлдэхүүн хэсгийг дунд төвтэй-нормацлагдсан шугаман хослолууд нь хамгийн их тархалттай байдаг тул ийм төвтэй-нормацилагдсан шугаман тэмдгүүдийн хослол гэж нэрлэдэг.

Өөр нэг толгойн Z2 бүрэлдэхүүн хэсгийн хувьд бид ийм төвлөрсөн - хэвийн болсон тэмдгүүдийн хослолыг авна, жишээ нь:

эхний толгойн бүрэлдэхүүн хэсэгтэй хамааралгүй,

Эхний толгойн бүрэлдэхүүн хэсэгтэй хамааралгүй энэ хослол нь хамгийн их тархалттай байдаг.

K-р толгойн бүрэлдэхүүн хэсэг Zk (k=1…m) нь ийм төвтэй - хэвийн хосолсон тэмдэг гэж нэрлэгддэг, жишээ нь:

-1 хүртэл урагшлах толгойн бүрэлдэхүүн хэсгүүдтэй хамааралгүй,

гаднах шинж тэмдгүүдийн хамгийн боломжит хослолуудын дунд, хэрэв үгүй бол

-1 хүртэл урагшлах толгойн бүрэлдэхүүн хэсгүүдтэй хамааралгүй, энэ хослол нь хамгийн их тархалттай байдаг.

Ortogonal U матрицыг танилцуулж, X-ийн өөрчлөлтөөс Z өөрчлөлт рүү шилжье

Тархалт хамгийн их байхаар векторыг сонгоно. Хэрэв эзэмшлийг сонгосон бол тархалт нь оюун ухаанд хамгийн их байх болно, энэ нь бусадтай хамааралгүй болно.

Oskіlki znaka vymiryanі neporіvnyannymi утгуудад, дараа нь төвлөрсөн хэвийн утгууд руу явах нь дээр. Гадны төвлөрсөн хэвийн утгуудын матрицыг лавлагаанаас мэдэж болно.

шударга бус, математикийн үнэлгээг үр дүнтэй үнэлэх боломжтой,

Өөрчлөлтгүй, тархалтыг үр дүнтэй үнэлэх боломжтой.

Додатку гаднах тэмдгүүдийн утгын сэрэмжлүүлгийн матрицыг онцлон тэмдэглэв.

Төвлөрөл, стандартчилал нь "Стадиа" хөтөлбөрийн тусламжтайгаар хийгддэг.

Хэрэв төвлөрөх, хэвийн болгох шинж тэмдэг илэрвэл корреляцийн матрицын үнэлгээг дараах томъёогоор боловсруулж болно.

Үүнээс өмнө бид бүрэлдэхүүн хэсгүүдийн шинжилгээг хийхдээ гаднах шинж тэмдгүүдийн бие даасан байдалд дүн шинжилгээ хийх болно.

Вилксийн нэмэлт шалгуурын хувьд эрэгтэй корреляцийн матрицын ач холбогдлыг дахин баталгаажуулах.

Бид таамаглал дэвшүүлж байна:

H0: ач холбогдолгүй

H1: ач холбогдолтой

125,7; (0,05;3,3) = 7,8

Учир нь > , дараа нь H0 таамаглалыг авч үзсэн бөгөөд матриц нь ач холбогдолтой тул бүрэлдэхүүн хэсгийн шинжилгээ хийх боломжтой.

Ковариацын матрицын диагональ байдлын талаарх таамаглалыг буцаах

Бид таамаглал дэвшүүлж байна:

Budєmo статистик, эрх чөлөөний алхмаас хуулийн төлөө rozpodіlenu.

123,21, (0,05;10) =18,307

> тул H0 таамаглалыг авч үзээд бүрэлдэхүүний шинжилгээ хийх боломжтой.

Матрицын хүчин зүйлчлэлийг өдөөхийн тулд матрицын тохирох дугаарыг өгөх шаардлагатай бөгөөд энэ нь уялдаа холбоог зөрчих ёстой.

Матрицын тоог дараах хүчийг ашиглан эргүүлдэг тул үйл ажиллагаанд MathCAD системийн eigenvals функцийг ашиглах шаардлагатай.

Учир нь Бид тооны хүч, матрицын векторын хүчийг бус харин үнэлгээг авсан. Бидний tsіkavitime naskіlki "сайн" zі statisticheskij цэг zor vibrkovі шинж чанар нь ерөнхий ї sukupnostі нь vіdpovіdnі параметрүүдийг тайлбарлах.

i-р зэрэглэлийн тооны итгэлцлийн интервал нь дараах томьёог дагана:

Үр дүнгийн тоонуудын нэмэлт интервалууд дараах байдалтай байна.

Хэд хэдэн хамгийн сайн тоонуудын утгын үнэлгээг хамгийн бага тоонуудын итгэлийн интервалаас авдаг. Хүч чадлын олон тооны талаархи таамаглалыг өөрчлөх шаардлагатай.

Нэмэлт статистикийн хувьд олон талт байдлыг дахин шалгах шаардлагатай

de r-олон язгуурын тоо.

Шударга ёсны үеийн Tsya статистикийг эрх чөлөөний алхамуудын тооноос хуулийн дагуу хуваадаг. Висунемогийн таамаглалууд:

Oskіlki таамаглал vydkidaetsya, тиймээс тооны хүч, олон биш.

Үндсэн бүрэлдэхүүн хэсгүүдийг зөвхөн мэдээллийн түвшний 0.85 түвшинд харах шаардлагатай. Мэдээллийн ертөнц нь k-эхний толгойн бүрэлдэхүүн хэсгүүдийг бүрдүүлэхийн тулд гадаад шинж тэмдгүүдийн зарим хэсгийг эсвэл зарим хэсгийг харуулдаг. Мэдээллийн ертөнцийн хувьд бид утгыг нэрлэнэ:

Мэдээллийн өгөгдсөн түвшинд гурван үндсэн бүрэлдэхүүн хэсэг харагдсан.

= матрицыг бичье

Гаднах шинж тэмдгүүдээс үндсэн бүрэлдэхүүн хэсэг рүү шилжих хэвийн векторыг арилгахын тулд тэгшитгэх системийг өөрчлөх шаардлагатай. Системийн шийдлийг зассаны дараа залруулгын векторыг хэвийн болгох шаардлагатай.

Энэ даалгаврыг хэрэгжүүлэхийн тулд бид MathCAD системийн eigenvec функцийг ашиглан хувьсах чадлын тоог хэвийн болгох векторыг хурдасгадаг.

Бидний үзэж байгаагаар эхний дөрвөн толгой бүрэлдэхүүн хэсэг нь өгөгдсөн мэдээллийн түвшинд хүрэхэд хангалттай байдаг тул U матриц

Бид багана нь чадлын векторууд болох U матриц байх болно.

Таны коэффициентүүдийн матриц:

Матрицын коэффициентүүд нь төвлөрсөн - хэвийн болсон харааны тэмдэг ба хэвийн бус толгойн бүрэлдэхүүн хэсгүүдийн хоорондын хамаарлын коэффициентүүд бөгөөд харааны тэмдэг ба толгойн үндсэн бүрэлдэхүүн хэсгүүдийн ил тод байдал, хүч чадал, шууд шугаман холболтыг харуулдаг.

Үндсэн бүрэлдэхүүн хэсгийн арга

Үндсэн бүрэлдэхүүн хэсгийн арга(Англи. Үндсэн бүрэлдэхүүн хэсгийн шинжилгээ, PCA ) нь хамгийн бага мэдээлэл ашиглан өгөгдлийн олон янз байдлыг өөрчлөх гол аргуудын нэг юм. Винайдени К. Пирсон Карл Пирсон ) үед r. Зургийг таних, компьютерийн цирк, өгөгдөл бөөгнөрөх гэх мэт баялаг газруудад Zastosovuetsya. Үндсэн бүрэлдэхүүн хэсгүүдийн тооцоолол нь эрчим хүчний векторууд болон өгөгдлийн ковариацын матрицын чадлын утгыг тооцоолоход хүргэдэг. Үндсэн бүрэлдэхүүн хэсгүүдийн өөр нэг аргыг нэрлэдэг Кархунен-Лоевын өөрчлөлтүүд(Англи. Кархунен-Лев) эсвэл Hotelling-ийн өөрчлөлт (eng. Зочид буудлын өөрчлөлт). Өгөгдлийн олон янз байдлыг өөрчлөх бусад арга бол бие даасан бүрэлдэхүүн хэсгүүдийн арга, баялаг масштаб, тоон шугаман бус нэгтгэх арга юм: толгойн муруй ба өөрчлөлтийн арга, хаврын зураглалын арга, хамгийн сайн проекцын арга (eng. Проекцийн эрэл хайгуул), neuromerezhev арга "Дуу хоолой", тэр іn.

Асуудлын талаархи албан ёсны мэдэгдэл

Үндсэн бүрэлдэхүүн хэсгүүдэд, наад зах нь, наад зах нь зарим үндсэн хувилбаруудад дүн шинжилгээ хийх даалгавар:

бага хэмжээстийн шугаман ялгаа бүхий өгөгдлийг ойролцоолох;
yak_rozkid danih дээрх ортогональ проекц дээр жижиг хэмжээтэй дэд орон зайг мэдэх (ингэснээр дундаж утгаас квадратын дундаж хазайлт) хамгийн их байх болно;
сарлаг дээрх ортогональ проекцоор жижиг хэмжээтэй дэд орон зайг аль болох их хэмжээгээр мэдэх;
Өгөгдсөн баялаг хувьсагчийн утгын хувьд координатын ийм ортогональ хувиргалтыг өдөөж, бусад координатуудын хоорондын хамаарлын үр дүнд тэг болж хувирна.

Эхний гурван хувилбар нь өгөгдлийн эцсийн оноотой ажилладаг. Өмхий үнэр нь статистик мэдээлэл бий болгох ямар нэгэн таамаглалтай дүйцэхүйц бөгөөд ямар нэгэн таамаглал биш юм. Дөрөв дэх хувилбар нь босоо утгууд дээр суурилдаг. Kіntsevі mulіnіy yavlyayutsya yavlyayutsya энд vybіrki z өгөгдсөн rozpodіlu болон virіshennya гурван анхны zavdan шиг - Кархунен-Лоевын "жинхэнэ" хойд дүрийн ойролцоох шиг. Бид нэмэлт, аргын нарийвчлалыг бүхэлд нь буруутгаж байна.

Шугаман ялгаагаар өгөгдөлд ойртох

К.Пирсоны (1901) алдартай бүтээлийн зураглал: хавтгай дээр өгөгдсөн цэгүүд, - шулуун шугам руу яв. Shukaetsya шулуун, scho нийлбэрийг багасгах

Толгойн бүрэлдэхүүн хэсгүүдийн арга нь цэгүүдийн төгсгөлийн үржүүлэгчийг шулуун шугам, хавтгайгаар хамгийн сайн ойртуулах даалгавараас үүдэлтэй (K. Pirson, 1901). Дана kіntseva нэргүй векторууд. Арьсны орчны хувьд эрүүл мэндийн квадратуудын нийлбэр хамгийн бага гэдгийг мэдэх хэрэгтэй.

de - цэгээс шугаман ялгаа хүртэлх Евклид. Be-yak - тайван шугаман raznomanittya нь нэргүй шугаман хослолоор өгч болно, де параметрүүд ярианы шугамаар гүйдэг ба - векторуудын ортонормаль бичих.

де Евклидийн норм, - Евклидийн скаляр эргэлт, эсвэл координат хэлбэрээр:

Ойролцоо бодох асуудлыг боловсруулах нь шугаман ялгаа, . Шугаман ялгааны тоог ортонормаль векторууд (үндсэн бүрэлдэхүүн хэсгүүдийн векторууд) ба вектороор тодорхойлно. Вектор нь дараахь зүйлийг багасгах асуудлыг шийдэх шийдэл шиг харагдаж байна.

Үндсэн бүрэлдэхүүн хэсгүүдийн векторуудыг ижил төстэй оновчлолын асуудлын шийдэл болгон олж болно.

1) төвлөрсөн өгөгдөл (харагдах дундаж): . Одоо; 2) бид эхний толгойн бүрэлдэхүүн хэсгийг даалгавар гэж мэддэг; . Хэрэв нэг шийдэл байхгүй бол бид тэдгээрийн аль нэгийг нь сонгоно. 3) Эхний толгойн бүрэлдэхүүн хэсгийн энэ проекцоос бид харж болно: ; 4) нөгөө толгойн бүрэлдэхүүн нь асуудлыг хэрхэн шийдвэрлэхээ мэддэг. Хэрэв нэг шийдэл байхгүй бол бид тэдгээрийн аль нэгийг нь сонгоно. … 2k-1) Бид -р толгойн бүрэлдэхүүн хэсэг дээрх проекцийг харж болно (урд талын үндсэн хэсгүүдийн төсөөлөл аль хэдийн харагдаж байна гэж таамаглаж байна): ; 2k) k-р толгойн бүрэлдэхүүнийг асуудлын шийдэл гэж нэрлэдэг: . Хэрэв нэг шийдэл байхгүй бол бид тэдгээрийн аль нэгийг нь сонгоно. …

Арьсны үе шатанд бид урд талын толгойн бүрэлдэхүүн хэсгийн төсөөллийг хардаг. Тооцоололд өршөөл үзүүлэхгүй байх, толгойн бүрэлдэхүүн хэсгүүд дэх векторын харилцан ортогональ байдлыг устгахгүйн тулд та оновчлолын векторуудыг тайлбарласан оновчлолын асуудлыг боловсруулсны үр дүнд олж болно.

Тэмдгийг сонгохдоо (мөн ижил даалгаврыг биелүүлэхэд) өчүүхэн свавиллагийн томилогдсон гэмт хэрэгтэн хангалтгүй байгаа нь жишээлбэл, өгөгдлийн тэгш хэмийн оюун ухаанаас илүү нарийвчлалтай, авч үзэх боломжтой. Толгойн бусад бүрэлдэхүүн хэсэг нь урд талдаа ортогональ нэг вектор байна.

Хамгийн их зөрүүтэй ортогональ проекцуудыг хайх

Эхний толгойн бүрэлдэхүүн хэсэг нь өгөгдлийн төсөөллийн чичиргээний хэлбэлзлийг дээд зэргээр нэмэгдүүлдэг

Өгөгдлийн олон векторын төвлөрлийг өгье (утгын арифметик дундаж нь тэгтэй тэнцүү). Даалгавар - шинэ координатын системд ийм ортогональ хувиргалтыг мэдэх нь ийм нөхцөлийг зөв болгох болно.

Ганц тэгш байдлын онолыг J. J. Sylvester (Eng. Жеймс Жозеф Сильвестер ) м-д.

Энгийн давталттай ганцаарчилсан задралын алгоритм

Гол процедур нь матриц (de - дэлхийн вектор, a - дэлхийн вектор) хэлбэрээр хангалттай том матрицын хамгийн сайн ойролцооллыг хамгийн бага квадратын аргаар хайх явдал юм.

Асуудлын шийдлийг тодорхой томъёоны дагуу дараалсан давталтаар өгдөг. Тогтмол векторын хувьд хамгийн бага хэлбэрийг өгдөг утгууд нь тэгш байдалд өвөрмөц бөгөөд тодорхой хуваарилагдана.

Үүний нэгэн адил, тогтмол векторын хувьд дараах утгуудыг онооно.

Векторын ойролцоо утгын хувьд бид нэг утгын хувьсах вектор, тооцоолох вектор, аль вектороор тооцох вектор гэх мэтийг авна. Утга өөрчлөгдөнө. Хэлбэлзлийн шалгуурын хувьд богино давталт () эсвэл хамгийн чухал гурван функцийг багасгасан утгын гурван ялгаатай өөрчлөлт байдаг.

Матрицын үр дүнг матрицын төрлийн хамгийн ойрын ойролцоолоос хассан (энд утгуудын дээд индекс нь ойролцоолсон тоо юм). Цаашилбал, матрицаас би матрицыг харж болно, хасагдсан матрицын хувьд, жишээ нь, норм хангалттай бага болох хүртэл трик дахин ижил төрлийн хамгийн сайн ойролцооллыг хайж байна гэх мэт. Дайны явцад бид матрицыг 1-р зэрэглэлийн матрицуудын нийлбэр болгон байрлуулах давталтын процедурыг устгасан, tobto . Үүний үр дүнд ганц тоо ба ганц векторын ойролцооллыг (баруун - ба зүүн - ) хассан.

Алгоритм нь үүнийг даван туулахын өмнө түүний энгийн байдал, цоорхойтой өгөгдөл, түүнчлэн чухал өгөгдөлд өөрчлөлт оруулахгүйгээр шилжүүлэх чадвар юм.

Нарийвчлал, тогтвортой байдлыг сайжруулахын тулд үндсэн алгоритмын янз бүрийн өөрчлөлтүүдийг бий болгох. Жишээлбэл, янз бүрийн эвдрэлийн үед толгойн бүрэлдэхүүн хэсгүүдийн векторууд нь "зуршлын дагуу" ортогональ, олон тооны давталттай (их олон янз байдал, баялаг бүрэлдэхүүн хэсэг) ортогональ байдлын жижиг хазайлтууд хуримтлагддаг ба матар арьсанд тусгай засвар хийх шаардлагатай болдог. , толгойн бүрэлдэхүүн хэсгийн чухал аюулгүй байдал.

Толгойн бүрэлдэхүүн хэсгүүдийн тензорын дан зохицуулалт ба тензорын арга

Ихэнхдээ өгөгдлийн вектор нь тэгш өнцөгт хүснэгтийн бүтцэд (жишээлбэл, зургийн хавтгай) нэмж баялаг хүснэгтийг бий болгодог - tobto the tensor : , . Энэ хүнд онцгой байрлалтай байх нь бас үр дүнтэй байдаг. Алгоритмуудын үндсэн томьёог бараг ямар ч өөрчлөлтгүйгээр шилжүүлж болно: өгөгдлийн матрицыг орлуулах нь индексийн утга байж болно, эхний индекс нь өгөгдлийн цэгийн (тензор) тоо юм.

Гол процедур нь тензорын хамгийн сайн ойролцооллыг хамгийн бага квадратын аргаар (de - тынчтык вектор ( - өгөгдлийн цэгийн тоо), - хэмжээ вектор at ) хэлбэрийн тензороор хайх явдал юм.

Асуудлын шийдлийг тодорхой томъёоны дагуу дараалсан давталтаар өгдөг. Чухамдаа нэг час улаан өнгийн бүх вектор-үржүүлэгчийг тогтоосон бөгөөд орхигдсон нэгийг нь ядаж хангалттай оюун ухаанаар тодорхой төлөөлдөг.

Векторын ойрын эхэнд () эсрэг вектор ба дан утгыг авч, векторыг тооцоолно , тооцооллын вектор дахь энэ вектор болон эдгээр векторуудын хувьд өгөх гэх мэт (индексээр циклээр ангилах) Алгоритм, магадгүй нэгдэх. Хэлбэлзлийн шалгуурын хувьд мөчлөгийн хувьд багасгасан функциональ утгын гурван чухал өөрчлөлт буюу хамгийн чухал гурван өөрчлөлт байна. Цаашид тензороос ойрын байдал ба илүүдэл нь ижил төрлийн хамгийн сайн ойрхон байгааг дахин харж болно. нахиа., нудрах, жишээ нь, чергового илүүдэл норм бага байх болно.

Энэхүү баялаг бүрэлдэхүүн хэсэгтэй дан бүтэц (толгойн бүрэлдэхүүн хэсгүүдийн тензорын арга) нь зураг, видео дохио болон илүү өргөн, бага эсвэл илүү өгөгдлийг боловсруулахад амжилттай хэрэглэгддэг бөгөөд ингэснээр хүснэгт эсвэл тензор бүтэц бий болно.

Матрицыг үндсэн бүрэлдэхүүн хэсгүүдэд шилжүүлэх

Өгөгдлийг үндсэн бүрэлдэхүүн хэсэг болгон хувиргах матриц нь үндсэн бүрэлдэхүүн хэсгүүдийн утгыг өөрчлөх дарааллаар эрэмбэлсэн векторуудаас бүрдэнэ.

(шилжүүлэх гэсэн үг),

Тобто, матриц нь ортогональ байна.

Эдгээр өгөгдлийн ихэнх өөрчлөлтийг эхний координатууд дээр тэмдэглэсэн байх бөгөөд энэ нь танд бага зайтай газар руу явах боломжийг олгоно.

Залишковын тархалт

Төвлөрсөн өгөгдлийг өгөх, . Эхний толгойн бүрэлдэхүүн хэсгийн үндсэн проекц дээрх өгөгдлийн векторуудыг солихдоо нэг өгөгдлийн вектор тутамд амилалтын өршөөлийн дундаж квадратыг оруулна.

Энд эмпирик ковариацын матрицын утгуудыг өөрчлөлтийн дарааллаар эрэмбэлж, үржвэрийг тохируулна.

Tsya утгыг гэж нэрлэдэг илүүдэл тархалт. Үнэ цэнэ

дуудсан тархалтыг тайлбарлав. Їhnya нийлбэр dorivnyuє vibrkovіy хэлбэлзэл. Vіdpovіdny квадрат vіdnoї өршөөл - tsі vіdnennia илүүдэл хэлбэлзэл нь vibrіkovo хэлбэлзэл (tobto) тайлбарлагдаагүй дисперсийн нэг хэсэг):

Гайхалтай өршөөлийн хувьд үндсэн бүрэлдэхүүн хэсгүүдийн аргын үнэлгээг эхний бүрэлдэхүүн хэсгүүдийн дизайнтай хамт үнэлдэг.

Хүндэтгэл: ихэнх дугаарлах алгоритмуудад хамгийн хүчирхэг чадлын вектор бүхий чадлын тоонууд - толгойн бүрэлдэхүүн хэсгүүдийг "хамгийн томоос хамгийн бага хүртэлх" дарааллаар тоолдог. Тооцооллын хувьд эхний тоонууд болон дараагийн эмпирик ковариацын матрицыг (диагональ элементүүдийн нийлбэр, өөрөөр хэлбэл тэнхлэгийн дагуух хэлбэлзэл) тооцоолоход хангалттай. Тоди

Кайзерын дүрмийн дагуу үндсэн бүрэлдэхүүн хэсгүүдийг сонгох

Tsіlovy pіdhіd шаардлагатай байнга тайлбарласан хэлбэлзэл албан ёсоор zastosovuє zavzhd, prote далд шилжүүлэх, scho podіl нь "дохио" болон "дуу чимээ" болон мэдрэгчийн нарийвчлалыг урьдчилан тодорхойлсон эсэх нь толгой бүрэлдэхүүн хэсгүүдийн тоог тооцоолохоос өмнө pіdhіd. Тийм ч учраас энэ нь ихэвчлэн "дохио" (жигд бага хэмжээ, тодорхой том далайц) ба "дуу чимээ" (их хэмжээ, тодорхой бага далайц) байгаа тухай таамаглал дээр суурилдаг бусад эвристик нь үр дүнтэй байдаг. Эхлээд харахад үндсэн бүрэлдэхүүн хэсгүүдийн арга нь шүүлтүүрийн үүрэг гүйцэтгэдэг: дохио нь хамгийн чухал нь эхний үндсэн бүрэлдэхүүн хэсгүүдийн төсөөлөлд арилдаг бөгөөд бусад бүрэлдэхүүн хэсгүүдэд дуу чимээний эзлэх хувь илүү баялаг байдаг.

Хоол тэжээл: дохио / дуу чимээний харьцааг урьдчилан мэдэхгүй байгаа мэт шаардлагатай үндсэн бүрэлдэхүүн хэсгүүдийн тоог хэрхэн үнэлэх вэ?

Толгойн бүрэлдэхүүн хэсгүүдийг сонгох хамгийн энгийн бөгөөд эртний аргыг өгөгдсөн Кайзерын дүрэм(Англи. Кайзерын дүрэм): чухал ач холбогдолтой үндсэн бүрэлдэхүүн хэсгүүд, аль нь

дундаж утгыг өөрчлөх (өгөгдлийн векторын координатын дундаж чичиргээний тархалт). Кайзерын дүрэм нь хамгийн энгийн тохиолдлуудад сайн хэрэгждэг, хэрвээ үндсэн бүрэлдэхүүн хэсгүүдийн цөөхөн байдаг бол дундаж утгыг баялагаар эргүүлж, бусад хүчний тоонууд нь шинэ нэгээс бага байдаг. Эвхэх тохиолдолд энэ нь илүү чухал үндсэн бүрэлдэхүүн хэсгүүдийг өгч чадна. Тэнхлэгийн дагуух нэг чичиргээний тархалтыг хэвийн болгож өгснөөр Кайзерын дүрэм нь гадаад төрхөөрөө маш энгийн байдаг: чухал үндсэн бүрэлдэхүүн хэсгүүд.

Муу нишингийн дүрмийн дагуу үндсэн бүрэлдэхүүн хэсгүүдийн тоог тооцоолох

Жишээ: 5-р хэмжээтэй хугарсан зэгсний дүрмийн дагуу үндсэн бүрэлдэхүүн хэсгүүдийн тоог тооцоолох.

Шаардлагатай толгойн бүрэлдэхүүн хэсгүүдийн тоог үнэлэх хамгийн түгээмэл эвристик аргуудын нэг юм муу таягны дүрэм(Англи. Эвдэрсэн саваа загвар). Бүх тооны нэг нийлбэр (, )-ийн нормчлолын багц нь нэг дожингийн зэгсний ulamkіv-ийн dozhin-ийн тархалттай тэнцүү, эвдэрсэн цэг нь эвдэрсэн (тасрах цэгүүдийг бие даан сонгож, тэнцүү хуваана) зэгсний тагтаагаар). Нааш ир () - Dovzhini otrimanih shmatkіv зэгс, dozhini өөрчлөх дарааллаар дугаарласан:. Математикийн сайжруулалтыг мэдэх нь хамаагүй:

Муу таягны дүрмийн дагуу хүч чадлын векторыг (эрчим хүчний тоонуудын өөрчлөлтийн дарааллаар) толгойн бүрэлдэхүүн хэсгүүдийн жагсаалтаас авдаг.

Цагаан будаа. 5 нугалах vipad-ийн өгзөгийг зааж өгсөн:

=(1+1/2+1/3+1/4+1/5)/5; =(1/2+1/3+1/4+1/5)/5; =(1/3+1/4+1/5)/5; =(1/4+1/5)/5; =(1/5)/5.

Өгзөгөөр сонгосон

=0.5; =0.3; =0.1; =0.06; =0.04.

Муу зэгсний дүрмийн дагуу энэ өгзөгт 2 өмхий бүрэлдхүүн байдаг.

Користувачуудын тооцоолсноор муу нишингийн дүрэм нь чухал ач холбогдолтой үндсэн бүрэлдэхүүн хэсгүүдийн тоог дутуу үнэлэх хандлагатай байдаг.

Үнэлгээ

Үндсэн бүрэлдэхүүн хэсгүүдэд бууруулсны дараа хуваарилах

Дараа ньэхний үндсэн бүрэлдэхүүн хэсгүүд дээр зураг төсөл боловсруулж, тэнхлэгийн дагуух нэг (сонгомол) тархалтыг гараар хэвийн болгох. Агаарын тархалт ба толгойн бүрэлдэхүүн хэсэг нь илүү үнэтэй байдаг тул хэвийн болгохын тулд харгалзах координатыг хуваах шаардлагатай. Энэ хувиргалт нь ортогональ биш бөгөөд скаляр бүтээлийг авдаггүй. Өгөгдлийн проекцын ковариацын матриц нь нормчилсны дараа дан болж, хоёр ортогональ шугам нь бие даасан хэмжигдэхүүн болох эсэх, ортонормаль суурь нь үндсэн бүрэлдэхүүн хэсгүүдийн суурь болох эсэх (нормалчлал нь тэгшитгэлийн ортогональ байдлыг өөрчилнө гэж таамаглах) проекцууд болно. вектор). Эхний толгойн бүрэлдэхүүн хэсгүүдийн гаралтын өгөгдлийн өргөн хүрээнээс Vіdobrazhennya болон хэвийн болгохын зэрэгцээ матрицаар өгөгдсөн.

Өөрчлөлтийг ихэвчлэн Кархунен-Лоевын хувиргалт гэж нэрлэдэг. Энд векторууд байгаа бөгөөд дээд индекс нь шилжүүлэг гэсэн үг юм.

Үндсэн бүрэлдэхүүн хэсгүүдийн тооцоолол хүртэл хуваарилах

Урьдчилгаа: үндсэн бүрэлдэхүүн хэсгүүдэд шилжсэний дараа хэвийн болгох, "мэдрэлийн" үед хийх ёстой алдаатай хэвийн байдлын ул мөр биш. өгөгдлийг дахин хуваарилах, энэ нь үндсэн бүрэлдэхүүн хэсгүүдийг тооцоолохоос өмнө хийгддэг. Өгөгдлийн хамгийн сайн ойролцооллыг тооцоолох эсвэл хамгийн том тархалтын хамгийн шулуун шугамыг (энэ нь тэнцүү) тооцоолох боломжтой хэмжигдэхүүнийг дугуйрсан сонгоход урагшаа хэвийн болгох шаардлагатай. Жишээлбэл, хэрэв "метр, литр, килограмм" гэсэн гурван хэмжээст векторуудаар өгөгдсөн бол стандарт Евклидийн зөрүү нь эхний координатын дагуу 1 метр байвал нөгөө талаас 1 литрийн зөрүүтэй адил хувь нэмэр ажиллах болно. Гурав дахь нь 1 кг. Харааны өгөгдлийг харуулсан 1-ийн системийг дуудаж, тэнхлэгийн дагуу байгалийн масштабын талаархи бидний мэдэгдлийг хангалтгүй тусгаж, "зэвсэггүй болгох" ажлыг гүйцэтгэнэ: арьсны координат нь өгөгдөл, тоогоор тодорхойлогддог дууны хуваарьт хуваагдана. тэдгээрийн боловсруулалт, vimiryuvannya-ийн үйл явц, мэдээлэл цуглуулах.

Ийм стандартчилалд гурван өөр стандарт хандлага байдаг: нэг хэлбэлзэлтэнхлэгийн дагуу (тэнхлэгийн дагуух масштаб нь дундаж квадрат сайжруулалттай тэнцүү байна - ковариацын матрицыг хоёр дахь хувиргасны дараа корреляцийн коэффициентийн матрицаар хуваана), дээр дэлхийн нарийвчлалтай тэнцүү байна(Өгөгдсөн утгын пропорциональ нарийвчлалын тэнхлэгийн дагуу масштаблах) ба дээр тэнцүү вимогидаалгаварт (тэнхлэгийн дагуух масштабыг өгөгдсөн утгыг урьдчилан таамаглах шаардлагатай нарийвчлал, эсвэл зөвшөөрөгдөх үйл явдлуудаар - тэнцүү хүлцэлээр тодорхойлно). Даалгаврын чичиргээнд даалгаврын vibilization танилцуулга, би Dones олж авахын тулд ажиллаж байсан (Якшко Диа Диа Диа Дани нь бодол дуусаагүй байна, дараа нь nerazіonially Vyibrates Normuvnaya чанд dispersion таних, Navischko Tseva Vіdpovіє Zm_sta Delivani, Oskilki Tsey otrimannya шинэ хэсгийг ухаалгаар стандарт хэрэглээг ойролцоогоор үнэлж, боломжийн хуваарь сонгож, цаашид өөрчлөх хэрэггүй).

Тэнхлэгүүд нь толгойн бүрэлдэхүүн хэсгүүд байдаг тул тэнхлэгүүдийн дагуу нэг тархалт руу урагшлах хэвийн байдал нь координатын системийг эргүүлэх замаар нурдаг бөгөөд өгөгдлийг дахин хийх үед хэвийн болгох нь толгойн бүрэлдэхүүн хэсгүүдэд буурсны дараа хэвийн байдлыг орлохгүй.

Мэдээллийг эрэмблэх механик аналоги ба толгойн бүрэлдэхүүн хэсгүүдийн арга

Өгөгдлийн арьсны векторыг нэг масстай тааруулахын тулд эмпирик ковариацын матриц нь цэгийн массын системийн инерцийн тензороор өөрчлөгддөг (ижил массаар хувааж үзье), толгойн бүрэлдэхүүн хэсгүүдийн асуудал - даалгавараас толгойн тэнхлэгүүдийн инерцийн тензорыг багасгах. Өгөгдлийн цэгүүдийн ач холбогдол эсвэл тэдгээрийн үнэ цэнийн давуу байдлын хувьд массын үнэ цэнийг сонгохдоо нэмэлт эрх чөлөөг олж авах боломжтой (том олон түмэнд томоохон хүндэтгэл эсвэл хүндэтгэл үзүүлдэг). Якчо мэдээллийн найдварын вектор Масса,дараа нь эмпирик ковариацын матрицыг орлуулахыг авна

Багасгахаас эхлээд үндсэн бүрэлдэхүүн хэсэг хүртэлх цаашдын бүх үйлдлүүд нь аргын үндсэн хувилбартай адил чичиргээтэй байна: бид чадлын баазын ортонормалчлалыг шүүж, чадлын утгыг өөрчлөх боломжтой, дундаж утгыг үнэлдэг. эхний бүрэлдэхүүн хэсгүүдийн нийлбэрээр өгөгдсөн тоонуудын нормчиллын ойролцоо утгыг;

Дуудлагын илүү халуун аргыг өгсөн хосолсон үзлийн нийлбэрийн утгыг дээд зэргээр нэмэгдүүлэхтөсөөллийн хооронд. Арьсны хувьд хоёр цэгийн өгөгдлийн хувьд вага нэвтрүүлсэн; тэр . Эмпирик ковариацын матрицыг солих нь ялалт юм

Тэгш хэмт матрицыг эерэгээр хуваарилах үед масштабууд эерэг квадрат хэлбэртэй байна.

Бид үндсэн алгоритмтай яг адилхан арга замаар, эрчим хүчний утгууд унасны дараа үүнийг захиалж, эхний бүрэлдэхүүн хэсгүүдээр өгөгдлийн ойролцоох дундаж өршөөлийг тооцоолох гэх мэт хүчин чадлын үндэслэлийн ортонормацилалыг өгсөн.

Хэний арга нь зогсонги байдалд орох вэ ангиудын ил тод байдлын төлөө: өөр ангиудын хувьд вага вага нь илүү өндөр, нэг ангийн онооны хувьд бага сонгогддог. Ийм байдлаар, зэрэглэл дээр хэтийн төлөв, өөр өөр анги "rozsuvayutsya" гол бүрэлдэхүүн хэсэг нь том хэмжээний.

Илүү zastosuvannya - агуу заль мэхний дусаахыг багасгах(Outlayer, Eng. Хэт их ); Ийм байдлаар толгойн бүрэлдэхүүн хэсгийн аргын өөрчлөлтийг тайлбарласан бөгөөд энэ нь илүү бат бөх, сонгодог биш юм.

Тусгай нэр томъёо

Толгойн бүрэлдэхүүн хэсгийн аргын статистик нь хэд хэдэн тусгай нэр томъёотой байдаг.

Өгөгдлийн матриц; арьсан эгнээ - вектор давтан сургахДаних ( төвлөрөхба зөв норм), мөрийн тоо - (өгөгдлийн векторын тоо), баганын тоо - (өгөгдлийн өргөтгөл);

Навтаген матриц(Ачаалах); kozhen stovpets - толгойн бүрэлдэхүүн хэсгүүдийн вектор, эгнээний тоо - (өгөгдлийн орон зайг өргөтгөх), stovpts тоо - (толгойн бүрэлдэхүүн хэсгүүдийн векторын тоо, сонгосон загвар);

Рачункив матриц(Оноо); арьсны эгнээ - толгойн бүрэлдэхүүн хэсэг дээрх өгөгдлийн векторын төсөөлөл; мөрийн тоо - (өгөгдлийн векторын тоо), баганын тоо - (дизайнаар сонгосон үндсэн бүрэлдэхүүн хэсгүүдийн векторын тоо);

Z-rachunkiv матриц(Z оноо); арьсны эгнээ - үндсэн бүрэлдэхүүн хэсгүүдийн өгөгдлийн векторын проекц, нэг чичиргээний хэлбэлзлийг хэвийн болгох; мөрийн тоо - (өгөгдлийн векторын тоо), баганын тоо - (дизайнаар сонгосон үндсэн бүрэлдэхүүн хэсгүүдийн векторын тоо);

өршөөлийн матриц(өөрөөр бол илүүдэл) (Алдаа эсвэл үлдэгдэл) .

Үндсэн томъёо:

Mezhі zastosuvannya болон zamezhennya effektivnosti арга

Үндсэн бүрэлдэхүүн хэсгийн арга Зөвхөн хэвийн тархсан өгөгдлөөр зогсонги байдалд ордог хүмүүсийн тухай (өөрөөр хэлбэл, хэвийн хэмжээнд ойрхон сарнайн хувьд) илүү өргөн хүрээтэй мэдэгдэл нь тийм биш юм: К.Пирсоны стандарт томъёо нь ийм байх ёстой. ойролцоогоорөгөгдлийн сүүлчийн үржүүлэлт, дараагийн өдөр нь тэдний статистикийн талаархи таамаглалыг бий болгох, энэ талаар аль хэдийн санагдахгүйгээр.

Нарийвчлалтай шохойжилтыг тохируулахдаа rozmіrnіst-ийг үргэлж үр дүнтэй бууруулдаг Prote арга. Шулуун онгоц нь үргэлж сайн ойролцоо дүгнэлт өгдөггүй. Жишээлбэл, өгөгдөл нь муруй эсэхээс үл хамааран сайн нарийвчлалтайгаар дагаж мөрддөг бөгөөд энэ муруйг өгөгдлийн өргөн хүрээнд нарийн эрэмбэлэх боломжтой. Энэ тохиолдолд хүлээн зөвшөөрөгдөх нарийвчлалын хувьд толгойн бүрэлдэхүүн хэсгүүдийн арга нь бүрэлдэхүүн хэсгүүдийн тооноос их байх ёстой (нэг нэгийг нь солих), эс тэгвээс энэ нь зөвшөөрөгдөх нарийвчлалтайгаар хэмжээ буурахгүй байх болно. Ийм "муруй" толгойн бүрэлдэхүүн хэсгүүдтэй ажиллахын тулд толгойн ялгааны арга, шугаман бус толгойн бүрэлдэхүүн хэсгийн аргын янз бүрийн хувилбаруудыг олсон. Илүү их алдаа нь өгөгдсөн нугалах топологид хүргэж болзошгүй. Тэдгээрийг ойртуулахын тулд бид өөр өөр аргуудыг олсон, жишээлбэл, Кохонены газрын зураг нь өөрөө зохион байгуулалттай, мэдрэлийн хий эсвэл топологийн дүрэм юм. Өгөгдсөн өгөгдөл нь ердийнх шиг харагдах үндсэн бүрэлдэхүүн хэсгээс статистикийн хувьд үүсгэгдсэн бол үндсэн бүрэлдэхүүн хэсгийг ойролцоогоор тооцоолохын тулд үндсэн бүрэлдэхүүн хэсгийг ойролцоогоор гаргана. бие даасан бүрэлдэхүүн хэсгүүд, Хэдийгээр энэ нь Nareshti-ийн гаднах скаляр бүтээхэд ортогональ байхаа больсон ч изотроп rozpodіl (navіt хэвийн) хувьд elіpsoїda rozsiyuvannya-ийн орлуулалтыг бөмбөлөгөөр авдаг бөгөөд rozmirnіst-ийг ойролцоолсон аргуудаар өөрчлөх боломжгүй юм.

Викториа өргөдөл гаргах

Өгөгдлийн дүрслэл

Мэдээллийн дүрслэл - туршилтын болон онолын судалгааны үр дүнг анхны хэлбэрээр танилцуулах.

Өгөгдлийн үржүүлэгчийг дүрслэх эхний сонголт бол толгойн эхний хоёр бүрэлдэхүүн хэсгийн (эсвэл эхний гурван толгойн бүрэлдэхүүн хэсгийн 3 хэмжээст орон зай) хавтгай дээрх ортогональ проекц юм. Дизайн талбай нь үнэн хэрэгтээ хавтгай хоёр хэмжээст "дэлгэц" бөгөөд хамгийн жижиг бүтээлүүдтэй өгөгдлийн "зураг" -ыг өгөхийн тулд эргэлддэг. Ийм төсөөлөл нь гурван төсөөллийн хувьд оновчтой байх болно (өөр өөр хоёр хэмжээст дэлгэц дээрх дунд ортогональ проекцууд).

Өгөгдлийн хоорондох квадратуудын хамгийн бага нийлбэр нь толгойн эхний хэсгүүдийн талбайн проекцийг зааж өгдөг бөгөөд ингэснээр өргөтгөлийн дэлгэц нь гунигтай цэгүүдэд проекцын хувьд аль болох ойр байх болно.
Квадратуудын хоорондох квадрат үүсгэх хамгийн бага хэмжээ нь хавтгай дээрх цэгийг зохион бүтээсний дараа өгөгдлийн харанхуйгаас авсан хос цэг юм.
Квадрат үүсгэх хамгийн бага хэмжээ нь өгөгдлийн цэгүүд ба "хүндийн төв" хооронд байна.

Өгөгдлийн дүрслэл нь толгойн бүрэлдэхүүн хэсгүүд болон шугаман бус асуудлуудын аргын хамгийн өргөн хэрэглэгддэг нэмэлтүүдийн нэг юм.

Зураг болон видео шахалт

Пикселийн гаднах орон зайн зайг өөрчлөхийн тулд зураг, видеог кодлох цагийг пикселийн блокуудын шугаман хувиргалтаар тоглуулна. Орхих коэффицентийн тоон тооцоо, хаягдалгүйгээр кодлох алхамууд нь шахалтын чухал коэффициентийг орхих боломжийг олгодог. Шугаман хувиргалт хэлбэрээр PCA-ийн өөр хувиргалт нь ижил өгөгдлөөс нэгэн зэрэг авсан өгөгдлийн хэмжээнүүдийн хувьд тодорхой төрлийн өгөгдлийн хувьд оновчтой байдаг. Одоогийн байдлаар энэ аргыг идэвхтэй сурталчлахгүй байгаа нь гол төлөв тооцооллын нарийн төвөгтэй байдлаас шалтгаална. Тиймээс эдгээр өгөгдлийг шахаж, хувиргалтын үлдсэн коэффициентүүдийг харуулах боломжтой болно.

Зурган дээрх дуу чимээг дарах

Химиометр

Толгойн бүрэлдэхүүн хэсгийн арга нь химометрийн үндсэн аргуудын нэг юм. Химиометр ). X гаралтын өгөгдлийн матрицыг "солих" ба "дуу чимээ" гэсэн хоёр хэсэгт хуваах боломжийг танд олгоно. Naybіlsh алдартай viznachennyam нь "Chemometrics - tse hіmіchna distsiplіna scho zastosovuє matematichnі, statistichnі гэж INSHI арга zasnovanі дээр formalnіy logіtsі нь pobudovi abo vіdboru optimally metodіv vimіhliuciv at o planіvnyaiuciv at o planіvnyaiuciv нь o planıvіzhiuman."

Сэтгэлзүйн оношлогоо

өгөгдлийн шинжилгээ (тоон өгөгдлийн массивыг харахтай адил бусад зарим үр дүнгийн туршилтын үр дүнгийн тайлбар);
нийгмийн үзэгдлийн тодорхойлолт (үзэгдэл, зокрема ба математик загваруудын эерэг загвар).

Улс төрийн шинжлэх ухаанд толгойн бүрэлдэхүүн хэсгүүдийн арга нь "Дэлхийн улс төрийн атлас" төслийн үндсэн хэрэгсэл нь дэлхийн 192 орны таван тусгай нэгдсэн интеграл индексийн (амьдралын тэгшитгэл, олон улсын орлого, аюул занал, эрх мэдэл). Энэхүү шинжилгээний үр дүнгийн зураг зүйн хувьд газарзүйн өргөн цар хүрээтэй байдлын шинж тэмдэг болох тусгай GIS (Газарзүйн мэдээллийн систем) боловсруулсан. Мөн улс төрийн атласын өгөгдлийн газрын зургийг бүтээсэн бөгөөд энэ нь улс орны таван ертөнцийн хоёр ертөнцийн гол ялгааны үндэс болсон. Газарзүйн газрын зурагт зааврууд нь ижил төстэй газарзүйн координаттай объектуудыг харуулдаг бол өгөгдлийн газрын зурагт зааврууд нь ижил төстэй тэмдэг (индекс) бүхий объектуудыг (ирмэг) харуулдаг тул газарзүйн газрын зураг хэлбэрээр өгөгдлийн картуудын таних тэмдэг. .

Энэ нийтлэлд би эдгээрийн талаар ярихыг хүсч байна, үндсэн бүрэлдэхүүн хэсгүүдийн дүн шинжилгээ хийх хамгийн практик арга (PCA - үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ) нь математикийн аппаратын цаана байгаа ойлголтын үүднээс. Naib_sh энгийн боловч мэдээлдэг.

Математик vzagali аль хэдийн Garna гэж vitonchen шинжлэх ухаан, гэхдээ тэр үед гоо сайхны hovaetsya хийсвэрлэлийн бөмбөг нь холбон ард. Энгийн өгзөг дээр өөрийнхөө гоо үзэсгэлэнг хамгийн гоё харуулаарай, тийм байлгүй дээ, мушгиад л, хагалж, хүрч ч болно, буруу бодож байгаа нэг рүүгээ, бүх зүйлийг харахад хялбар, анхны харцаар харахад амархан. , энэ нь илүү ойлгомжтой, ил тод болсон.

Мэдээллийн дүн шинжилгээ хийхдээ, бусад шинжилгээний нэгэн адил бид нэг цагийн турш жинхэнэ баазыг аль болох нарийвчлалтай дүрсэлсэн энгийн загварыг бий болгож чадахгүй. Ихэнхдээ ийм шинж тэмдгүүд нь нэг цагийн дотор байх нь трансцендент шинж чанартай байдаг.

Жишээлбэл, манайд байгаа түлшний хэмжээг 100 км тутамд литрээр, АНУ-д нэг галлон мильээр хэмждэг. Өнгөцхөн харвал хэр их зөрүүтэй ч үнэн хэрэгтээ өмхий үнэр ар араасаа хэвтдэг. Нэг миль нь 1600 км, галлон нь 3.8 литр юм. Нэг тэмдгийг нөгөө талдаа хатуу хадгалдаг, нэгийг нь мэддэг, нөгөөг нь мэддэг.

Гэхдээ ихэнхдээ энэ нь маш баян байдаг тул нэг нэгээр нь худал хэлэх шинж тэмдгүүд нь тийм ч хатуу биш бөгөөд (чухал!) тийм ч тод биш байдаг. Хөдөлгүүрийн эзэлхүүн нь бүхэлдээ 100 км / жил жолоодоход эерэгээр нөлөөлдөг боловч асааж болохгүй. Өнгөц харахад харагдахгүй хүчин зүйлүүд (галын хүч нэмэгдэх, хөнгөн материал ашиглах болон бусад өнөөгийн ололт амжилт гэх мэт) сайжирч, машины дуу чимээ тийм ч хүчтэй биш байгааг харуулж магадгүй юм. , гэхдээ энэ нь бас його руу асгардаг.

Энэ хүч чадал нь хуучирсан гэдгийг мэдэж байгаа тул бид нэгээр дамжуулан спрат тэмдгийг ашиглаж, илүү их уур хилэнг худалдаж авах боломжтой тул түүнийг хөдөлгөж, илүү том энгийн загвараар аль хэдийн дасгал хийж болно. Юуны өмнө, мэдээллээ өөртөө хадгалаарай, бүх зүйл дээр, бүү бууж өг, гэхдээ ядаж л PCA аргыг ашиглахад тусална уу.

Vyslovlyuyuchis suvoro, tsey арга нь elіpsoїda (tezh n-virіrnogo), pіvosі kakogo би ирээдүйн гол бүрэлдэхүүн хэсэг байх болно n-хэмжээ khmara харуулын ойролцоо байна. І ийм тэнхлэгүүдийн төсөөллийн хувьд (багасгасан хэмжээст) хамгийн их мэдээлэл цуглуулдаг.

Крок 1. Өгөгдөл бэлтгэх

Энд, энгийн байх үүднээс би олон арван тэмдэг, олон зуун анхааруулгын жинхэнэ үндсэн мэдээллийн багцыг авахгүй, гэхдээ би хамгийн энгийн тоглоомон өгзөгөө өргөжүүлэх болно. Юу болохыг тайлбарлахад 2 тэмдэг, 10 анхааруулга хангалттай байх бөгөөд хамгийн чухал нь алгоритмыг харах явдал юм.

Бид доргиулагч үүсгэдэг:

X = np.arange(1,11) y = 2 * x + np.random.randn(10)*2 X = np.vstack((x,y)) хэвлэх X OUT: [[ 1. 2. 3. 4.5.6.7.8.9.10.] [ 2.73446908 4.35122722 7.21132988 11.24872601 9.58103444 12.09865079 129 3.9

Энэ сонголтонд бид хоёр тэмдэгт байгаа бөгөөд тэдгээр нь нэгтэй нягт уялдаатай байдаг. PCA алгоритмын тусламжтайгаар бид мэдээллийн нэг хэсэг дэх тэмдгийн хослол, үнийг хялбархан мэдэж, тэмдгийн зөрчлийг шинэ нэгээр нь тодорхойлох боломжтой. Тиймээс үрж байцгаая!

Коб трохи статистикийн хувьд. Vipadical магнитудын тайлбарт мөчүүд байдаг гэж таамаглаж байна. Бидэнд матюки хэрэгтэй байна. гэсэн зөрүүг ochіkuvannya. Та ямар дэвсгэр болохыг зоригтой хэлж чадна. ochіkuvannya - tse "хүндийн төв"-ийн хэмжээ, дисперс - tse її "razmіri". Ойролцоогоор кажучи, матюки. масштабаар тооцох нь босоо утгын байрлалыг зааж, хэлбэлзэл - її razmіr.

Вектор дээр проекц хийх үйл явц нь дундаж утгуудад ямар ч байдлаар нөлөөлдөггүй тул мэдээллийн алдагдлыг багасгахын тулд манай вектор түүврийн төвөөр дамжин өнгөрч болно. Үүнд аймшигтай зүйл байхгүй, учир нь бид сонголтоо төвлөрсөн шугаман устгагдах боломжтой тул тэмдгийн дундаж утга 0-д хүрэв.
Дундаж утгын вектор руу утгыг буцаадаг оператор - vin нь гадаад эзэлхүүний сонголтыг сэргээхэд шаардлагатай.

Xcentered = (X - x.mean(), X - y.mean()) m = (x.mean(), y.mean()) хэвлэх Xcentered хэвлэх "Дундаж вектор: ", m OUT: (массив([ --4.5, -1.5, 0.5, 1.5, 1.52141-0.930051, 4.5.94400-614446-601441-61444-4044., 6.52449.) (дундаж вектор : (5.5, 10.314393916)

дисперс нь уналтын утгын хэмжээний дараалалд ордог, өөрөөр хэлбэл. масштабын хувьд мэдрэмтгий. Тиймээс, дэлхий дээрх ганцаардлын шинж тэмдэгийн хувьд тэд өөрсдийн тушаалаар хүчтэй бухимддаг тул тэдгээрийг стандартчилахыг зөвлөж байна. Манай тохиолдолд утга нь дарааллаар тийм ч их өөрчлөгддөггүй тул энгийн байх үүднээс би энэ үйлдлийг өөрчлөхгүй.

Krok 2. Ковариацын матриц

Баялаг vipad утгатай vipad-д (vipad вектор) төвийн байрлал ижил байх болно. ochіkuvannyami її тэнхлэг дээр төсөөлөл. Мөн її хэлбэрийн тайлбарын тэнхлэг нь тэнхлэгийн дагуу зөвхөн її хэлбэлзэл аль хэдийн хангалтгүй байна. Графикуудыг хараарай, утгуудын гурван хэлбэлзэлд тэнхлэг дээрх проекцууд шиг ижил математикийн хүлээлт, тархалт ижил харагдаж байна!

Випад векторын хэлбэрийг тодорхойлохын тулд матриц хэрэгтэй.

Tse матриц, сарлаг має (и, ж)-Элемент - корреляцийн тэмдэг (X i, X j). Ковариацын томъёог тааж үзье:

Бидний оюун ухаан E(X i) = E(X j) = 0 гэж хэлэхэд хялбар байдаг.

Хүндэтгэсэн, хэрэв X i = X j бол:

Мөн энэ нь ямар ч vipadkovyh үнэ цэнийн хувьд үнэн юм.

Энэ дарааллаар диагональ дагуух бидний матриц дисперсийн тэмдэгтэй (учир нь i = j), матрицын төвд хоёр тэмдгийн хосын ковариацууд байх болно. Мөн ковариацын тэгш хэмийн улмаас матриц нь мөн тэгш хэмтэй байх болно.

Хүндэтгэсэн:Ковариацын матриц є zagalnenny хэлбэлзэл нь янз бүрийн баялаг хувьсагчийн утгууд - вон сарлаг ба выпадковын үнэ цэнийн хэлбэрийг (rozkid), сарлагийн вариацийг тодорхойлдог.

Юуны өмнө, нэг хэмжээст хувьсагчийн утгын дисперс нь Cov(X,X) = Var(X) томъёогоор даалгаврын нэг гишүүнтэй 1х1 матриц юм.

Дараа нь ковариацын матрицыг байгуулъя Σ бидний сонголтын хувьд. Аль вариацын хувьд X i і X j, мөн тэдгээрийн ковариац. Та бичмэл томъёогоор хурдасгаж болно, гэхдээ хэрэв бид Python-д дассан бол функцийг хурдасгахгүй байх нь нүгэл болно. numpy.cov(X). Тэрээр хувьсах хэмжигдэхүүний бүх шинж тэмдгүүдийн жагсаалтыг оролт болгон хүлээн авч, ковариацын матриц болон de X - n-бүх нийтийн хувьсах векторыг (n-мөрний тоо) эргүүлнэ. Функц vіdmіnno і dkhodit і шударга бус дисперсийг тэлэх, і хоёр хэмжигдэхүүний ковариацын хувьд, і ковариацын матрицыг нугалахад зориулагдсан.
(Python-д матриц нь массив-мөрүүдийн массив гэж би таамаглаж байна.)

Covmat = np.cov(Xcentered) covmat хэвлэх, "n" хэвлэх "X-ийн хэлбэлзэл:", np.cov(Xcentered) хэвлэх "Y-ийн хэлбэлзэл: ", np.cov(Xcentered) хэвлэх "X ба Y-ийн ковариац:" , np.cov(Xcentered) OUT: [[ 9.16666667 17.93002811] [ 17.93002811 37.26438587]] X-ийн хэлбэлзэл: 9.16666666667 Y:33-ын хэлбэлзэл

Крок 3

За, бид дуслын хэмжээг дүрсэлсэн матрицыг авсан тул үүнийг x ба y (энэ нь X 1 ба X 2), мөн хавтгай дээрх хавтгай хэлбэрийг ялгаж авах боломжтой. Одоо бид мэдэх хэрэгтэй. ийм вектор (зөвхөн нэг төрөл), бидний сонгосон проекцын тэлэлтийг (тархалтыг) хамгийн их байлгахын зэрэгцээ шинэ зүйл дээр.

Хүндэтгэсэн:Бодит ертөнцийн гол ялгаа нь боломжтой матриц бөгөөд хоёр ойлголт нь тэнцүү юм. Вектор дээр проекц хийхдээ проекцын дисперсийг хамгийн их байлгах ба өргөн хүрээний том захиалгын дагуу проекцлох үед ковариацын матрицыг бүхэлд нь нэмэгдүүлэх болно.

Мөн манай X проекцын векторын зарим проекц дээр нэг векторыг ав. Дараа нь шинэ зам руу v T X проекц хийнэ. Вектор дээрх проекцын дисперс нь Var(v T X)-тэй төстэй байх болно. Глобал үзэмжийн хувьд вектор хэлбэрээр (төвлөлтийн утгуудын хувьд) дисперсийг дараах байдлаар илэрхийлнэ.

Мэдээжийн хэрэг, проекцийн тархалт:

Хамгийн их утга v T Σv-ээс давсан хэлбэлзэл хамгийн ихэсдэг гэдгийг санахад хялбар байдаг. Энд Рэйлигийн тохиргоо бидэнд туслах болно. Математик руу хэт гүнзгий орохгүйгээр Рэйлигийн зураг төсөл нь ковариацын матрицын хувьд онцгой тохиолдол болж чадна гэдгийг л хэлье.

Үлдсэн томьёо нь векторын долгион дээр матрицыг байрлуулах сэдвээс болон энэ утгаараа мэдэгдэж болно. x нь дурын вектор бөгөөд дурын утга юм. Өөрийн векторуудын тоо ба энэ утга нь матрицын хэмжээтэй тэнцүү байна (i утгыг давтаж болно).

Илтгэлийн өмнө англи хэлээр тэр векторын утгыг нэрлэдэг хувийн үнэ цэнэі хувийн векторуудойлгомжтой.
Meni zdaєtsya, tse баян сайхан (болон хэв маяг) сонсогдож, бидний нэр томъёог бууруулна.

Ийм байдлаар шууд проекцын хамгийн их дисперс нь хувийн вектортой үргэлж өөрчлөгддөг бөгөөд энэ нь дисперсийн хувьд илүү үнэ цэнэтэй хамгийн их утгатай байж болно.

Энэ нь илүү олон тооны хувьсагчийн проекцуудын хувьд мөн үнэн юм - m-дэлхийн орон зай дээрх проекцын дисперс (ковариацын матриц) нь хамгийн их чадлын утгатай байж болох шууд m хувийн векторуудын хувьд хамгийн их байх болно.

Бидний сонголтын олон талт байдал нь хоёрт сайн бөгөөд түүний доторх хувийн векторуудын тоо тодорхой байна 2. Бид тэдгээрийг мэднэ.

numpy номын сан энэ функцийг хэрэгжүүлсэн numpy.linalg.eig(X)Энд X нь квадрат матриц юм. Та 2 массивыг эргүүлнэ - хувийн утгын массив ба хувийн векторын массив (вектор). Нормалжуулах І векторууд - їhnya dozhina dorіvnyuє 1. Шаардлагатай нь маш чухал. Qi 2 векторууд нь сонголтын шинэ суурийг тавьсан бөгөөд түүний тэнхлэг нь бидний сонгосон эллипсийн ойролцоо зарчмууд дээр суурилдаг.

Энэ диаграм дээр бид сонголтоо 2 сигма радиустай эллипсээр ойролцоолсон (тиймээс бүх сэрэмжлүүлгийн 95% нь өшөө авалтын буруутай байдаг - бид энд юу хийж чадах вэ). Би илүү том векторыг урвуулсан (eig(X) функц нь урвуу чиглэлд чиглүүлсэн) - энэ нь бидний хувьд векторын чиг баримжаа биш харин түүнийг чиглүүлэх нь чухал юм.

Krok 4. Хэмжээ багассан (проекц)

Хамгийн том вектор нь шууд урагшаа, регрессийн шугамтай төстэй бөгөөд регрессийн илүүдэл нөхцлүүдийн нийлбэрээс гаргаж авсан шинэ сонголт, танилцуулга мэдээлэл дээр байж болно (зөвхөн одоо Евклидийн, Y-ийн дельта биш). Заримдаа тэмдгүүдийн хоорондох шинж тэмдгүүд аль хэдийн хүчтэй байдаг тул мэдээллийн алдагдал хамгийн бага байх болно. Урд талын графикаас харахад проекцын "үнэ" - жижиг өөрийн векторын арын тархалт нь аль хэдийн бага байна.

Хүндэтгэсэн:ковариацын матрицын диагональ элементүүд нь анхдагч үндэслэлийн дагуу хэлбэлзлийг харуулдаг бөгөөд эдгээр хүчин чадлын утгууд нь шинэ (үндсэн бүрэлдэхүүн хэсгүүдийн дагуу).

Ихэнхдээ зарцуулсан (болон хадгалсан) мэдээллийн хэмжээг үнэлэх шаардлагатай байдаг. Үүнийг олж мэдэх хамгийн сайн арга бол хэдэн зуун. Бид арьсны тэнхлэгийн дагуух дисперсийг авч, тэнхлэгүүдийн дагуух дисперсийн нийт нийлбэрээр (өөрөөр хэлбэл, боломжтой матрицын бүх чадлын тоонуудын нийлбэр) хуваана.
Тэгэхээр бидний том вектор нь 45.994/46.431*100% = 99.06%, жижиг нь 0.94% орчим байх шиг байна. Жижиг векторыг нэвтрүүлж, илүү том хэмжээтэй өгөгдлийг төлөвлөхөд бид мэдээллийн 1% -иас бага зарцуулдаг! Сайхан үр дүн!

Хүндэтгэсэн:Үнэхээр zdebіshogo, мэдээллийн нийт оролт нь 10-20% -иас их байх тул та rozmirnіst-ийг тайван бууруулж чадна.

Урьдчилан croc 3 дээр төлөвлөж байсан шиг төсөөллийг хэрэгжүүлэхийн тулд v T X үйлдлийг хийх шаардлагатай (вектор нь бути дожини 1-ээс үүдэлтэй). Үгүй бол бидэнд нэг вектор биш, харин гипер хавтгай байгаа тул v T векторын оронд V T суурь векторуудын матрицыг авна. Хасах вектор (эсвэл матриц) нь проекцын массив болно.

V = (-vecs, -vecs) Xnew = цэг (v, Xcentered)

цэг(X,Y)- memberwise tvir (бид Python дээр вектор ба матрицыг ингэж үржүүлдэг)

Урд талын график дээрх зургуудын төсөөлөл ямар утгатай болохыг санах нь чухал биш юм.

Крок 5

Төсөлөөс гар аргаар боловсруулж, таамаглал дээр үндэслэн загвараа өргөжүүл. Гол бүрэлдэхүүн хэсгүүдийг салгахаа бүү мартаарай, гуравдагч этгээдийн ойлгомжтой, мэдрэмжтэй хүмүүс, мэдрэмжтэй хүмүүс. Заримдаа, corisno үлээж, жишээ нь, vyyavlenі wikidi, schob ярих, scho тэднийг манаж зогсох.

Цэ дүжэ энгийн. Бидэнд шаардлагатай бүх мэдээлэл байгаа бөгөөд гадаад суурь дахь суурь векторуудын координатууд (тэдгээрийг төлөвлөсөн векторууд) болон дундаж үзүүлэлтүүдийн векторууд (төвлөлтөд зориулагдсан). Жишээлбэл, хамгийн их утгыг ав: 10.596… Үүний тулд бид iogo-г баруун гарыг шилжүүлэн суулгах вектороор үржүүлнэ i dodamo дундын вектор эсвэл бүх вибокигийн глобал дүр төрх: X T v T +m

X Restored = dot(Xnew,v) + m print "Сэргээгдсэн: ", Xretored хэвлэл "Эх: ", X[:,9] OUT: Сэргээгдсэн: [ 10.13864361 19.84190935] Эх: [ 10. 19.9094

Жижиглэнгийн худалдаа жижиг, гэхдээ илүү олон зүйл байдаг. Adzhe vtrachena мэдээлэл батлагдаагүй байна. Проте, учир нь энгийн байдал нь үнэн зөв байхын тулд чухал бөгөөд энэ нь үнэ цэнэ нь өдөрт ойртож байгаа нь батлагдсан.

Тавиурын орлогч - алгоритмыг дахин шалгах

Хожим нь дэлхий алгоритмыг авч, тоглоомын өгзөг дээр хэрхэн ажилладагийг харуулсан, одоо йогийг PCA-тай тааруулах нь хангалтгүй, бид үүнийг sklearn-д хэрэгжүүлэх болно - бид өөрсдөө засч залруулсан ч гэсэн.

sklearn.decomposition импортын PCA pca = PCA(n_components = 1) XPCAreduced = pca.fit_transform(transpose(X))

Параметр n_бүрэлдэхүүнБи проекц хэрхэн хийгдсэн талаар вимирюваны тоог зааж өгсөн тул бид өгөгдлийн багцаа вимирюваны түвшинд хүртэл бууруулахыг хүсч байна. Өөрөөр хэлбэл - боломжит хамгийн их тоотой n хувийн векторын тоо. Эзлэхүүн буурсан үр дүнг дахин авч үзье.

Хэвлэх "Манай X буурсан: N", Xnew хэвлэх "Sklearn X буурсан: N", XPCAreduced OUT: [[-9,56404106: [-9,56404106 -9,02021625 -5,52974822 -2,96481262 0,68933859 0,74406645 2,33433492 7,39307974 5,3212742 10,59672425] Sklearn X бууруулж: Манай X буурсан ] [ -9.02021625] [ -5.52974822] [ -2.96481262] [ 0.68933859] [ 0.74406645] [ 2.33433492] [ 7.39307974] [7]5

Бид үр дүнг вектор баганын матриц болгон эргүүлэв (шугаман алгебрийн үүднээс хамгийн каноник үзэл бодол), sklearn дахь PCA босоо массивыг эргүүлэв.

Зарчмын хувьд үнэ нь чухал биш, зүгээр л varto нь шугаман алгебрт вектор-стоптоор дамжуулан матрицыг бичих нь каноник шинж чанартай болохыг илэрхийлдэг бөгөөд өгөгдөлд дүн шинжилгээ хийх (МБ талбарын бусад талууд) анхааруулга (гүйлгээ, бүртгэл) байдаг. эгнээнд тэмдэглэсэн.

Загварын бусад параметрүүдийг буцаах - функц нь завсрын хувьсагчдад хандах боломжийг олгодог хэд хэдэн шинж чанартай байж болно:

Дундаж вектор: дундаж_
- Проекцийн вектор (матриц): бүрэлдэхүүн хэсгүүд_
- Проекцийн тэнхлэгүүдийн тархалт (чичиргээ): тайлбарласан_хувиралт_
- мэдээллийн хэсэг (дэлхийн тархалтын хэсэг): тайлбарласан_хугацааны_харьцаа

Хүндэтгэсэн:тайлбарласан_хугацаанд_ харуулах вибирковадисперс, түүнчлэн ковариацын матриц үүсгэх cov() функц өршөөлгүйтархалт!

Бид номын сангийн функцын утгуудтай адил утгыг авдаг.

"Дундж вектор: ", pca.дундаж_, m хэвлэх "Төсөл: ", pca.components_, v хэвлэх "Тайлбарласан дисперсийн харьцаа: ", pca.explained_variance_ratio_, l/sum(l) OUT: Дундаж вектор: [ 5.5 10.31439 ( хэлбэлзэл харьцаа [41.39455058] 45,9939450918 тайлбарласан нь: 5.5, 10.314393916) Төсөөлөл: [[0,43774316 0,89910006]] (0.43774316434772387, 0.89910006232167594) тайлбарлаж хэлбэлзэл [0,99058588] 0,99058588818

Цорын ганц ялгаа нь хэлбэлзэл, гэхдээ бид аль хэдийн таамаглаж байсанчлан, ялсан шударга дисперсийн нэгэн адил cov() функцийг ялж, дараа нь тайлбарласан_хугацаа_ шинж чанар нь vibrkov болж хувирдаг. өмхий vіdrіznyayutsya бага Тим, otrimannya дэвсгэр нь scho persha. оноог (n-1), найзыг n-д хуваана. 45.99 ∙ (10 - 1) / 10 = 41.39 гэдгийг буруу тайлбарлахад хялбар байдаг.

Бусад бүх утгууд харилцан адилгүй байгаа нь бидний алгоритмууд тэнцүү гэсэн үг юм. Номын сангийн алгоритмын шинж чанарууд нь нарийвчлал багатай, дарсны хэлтэрхий, дуу дуулах, swidcode-ийн оновчлол, эсвэл тодорхой болгох үүднээс утгуудыг тойрсон байж болохыг би хүндэтгэж байна (эсвэл надад зарим алдаа байна).

Хүндэтгэсэн:Номын сангийн арга нь хэлбэлзлийг хамгийн их байлгах тэнхлэгт автоматаар төлөвлөгддөг. Битгий ухаалаг бай. Жишээлбэл, би энэ бяцхан нялх хүүхдийг ангилах боломжгүй болтлоо буруугаар буулгасан. Жижиг вектор дээрх проекц нь хэмжээг амжилттай өөрчилж, ангилагчийг хадгалах боломжтой.

Дараа нь бид PCA алгоритмын ажлын зарчмууд болон түүнийг склерн дээр хэрэгжүүлэх талаар авч үзсэн. Энэ нийтлэлийг зөвхөн өгөгдөлд дүн шинжилгээ хийж эхэлж буй хүмүүст ойлгомжтой болгож, алгоритмыг сайн мэддэг хүмүүст бага ч гэсэн мэдээлэл өгсөн гэдэгт би итгэлтэй байна. Зөн совингийн дүр төрх нь аргыг хэрхэн дадлага хийхийг ойлгоход илүү тохиромжтой бөгөөд сонгосон загварыг зөв тохируулахад ойлгох нь илүү чухал юм. Хүндэтгэлийн төлөө!

Жич:Прохання алдаа гаргаж болзошгүй гэж зохиолчийг хуцдаггүй. Зохиогч өөрөө өгөгдлийн шинжилгээний талаар суралцах шатандаа явж байгаа бөгөөд гайхалтай мэдлэгийн үнэ цэнийг эзэмшиж байгаа шигээ туслахыг хүсч байна! Ale, бүтээлч шүүмжлэл болон rіznomanіtny dosvіd у vitayutsya!