Статистикийн ач холбогдол: тодорхойлолт, ойлголт, ач холбогдол, регрессийн тэгшитгэл, таамаглалыг шалгах

Агуулгын хүснэгт:

Статистикийн ач холбогдол: тодорхойлолт, ойлголт, ач холбогдол, регрессийн тэгшитгэл, таамаглалыг шалгах
Статистикийн ач холбогдол: тодорхойлолт, ойлголт, ач холбогдол, регрессийн тэгшитгэл, таамаглалыг шалгах

Видео: Статистикийн ач холбогдол: тодорхойлолт, ойлголт, ач холбогдол, регрессийн тэгшитгэл, таамаглалыг шалгах

Видео: Статистикийн ач холбогдол: тодорхойлолт, ойлголт, ач холбогдол, регрессийн тэгшитгэл, таамаглалыг шалгах
Видео: #15 - Үнэний хувийн харьцаат шинжүүр, регрессийн шугаман загвар @ Магадлал ба Статистик 2024, May
Anonim

Статистик нь амьдралын салшгүй хэсэг байсаар ирсэн. Хүмүүс хаа сайгүй үүнтэй тулгардаг. Статистик мэдээлэлд үндэслэн хаана, ямар өвчин түгээмэл байдаг, тухайн бүс нутагт эсвэл хүн амын тодорхой хэсэгт юу илүү эрэлт хэрэгцээтэй байгаа талаар дүгнэлт гаргадаг. Төрийн байгууллагад нэр дэвшигчдийн улс төрийн хөтөлбөрийг хүртэл статистик тоо баримтад тулгуурладаг. Эдгээрийг мөн жижиглэн худалдааны сүлжээнүүд бараа бүтээгдэхүүн худалдан авахдаа ашигладаг бөгөөд үйлдвэрлэгчид саналдаа эдгээр өгөгдлийг удирддаг.

Статистик нь нийгмийн амьдралд чухал үүрэг гүйцэтгэдэг бөгөөд тус бүрийн гишүүн бүрт жижиг зүйлд ч нөлөөлдөг. Жишээлбэл, статистикийн дагуу ихэнх хүмүүс тодорхой хот, бүс нутагт бараан өнгийн хувцас өмсөхийг илүүд үздэг бол орон нутгийн дэлгүүрүүдээс цэцгийн хэвлэмэл бүхий тод шар өнгийн борооны цув олох нь маш хэцүү байх болно. Гэхдээ ямар хэмжээгээрЭдгээр өгөгдөл нийлээд ийм нөлөө үзүүлэх үү? Жишээлбэл, "статистикийн ач холбогдолтой" гэж юу вэ? Энэ тодорхойлолт нь яг юу гэсэн үг вэ?

Энэ юу вэ?

Статистик нь шинжлэх ухаан болохын хувьд янз бүрийн хэмжигдэхүүн, ойлголтуудын хослолоос бүрддэг. Үүний нэг нь "статистикийн ач холбогдол" гэсэн ойлголт юм. Энэ нь хувьсагчийн утгын нэр бөгөөд бусад үзүүлэлтүүдийн харагдах магадлал нь ач холбогдолгүй юм.

Статистикийн үзүүлэлтүүдийн тооцоо
Статистикийн үзүүлэлтүүдийн тооцоо

Жишээ нь бороотой шөнийн дараа намрын ойд мөөг түүж өглөө алхаж байхдаа 10 хүн тутмын 9 нь хөлөндөө резинэн гутал өмсдөг. Хэзээ нэгэн цагт тэдний 8 нь зотон мокасин өмссөн байх магадлал маш бага юм. Тиймээс, энэ жишээнд 9-ийн тоог "статистикийн ач холбогдол" гэж нэрлэдэг.

Үүний дагуу бид өгөгдсөн практик жишээг цаашид хөгжүүлбэл зуны улирал дуустал гутлын дэлгүүрүүд бусад цагуудаас илүү их хэмжээгээр резинэн гутал худалдаж авдаг. Тиймээс статистикийн утгын хэмжээ нь энгийн амьдралд нөлөөлдөг.

Мэдээж нарийн төвөгтэй тооцоололд вирусын тархалтыг урьдчилан таамаглахдаа олон тооны хувьсагчдыг харгалзан үздэг. Гэхдээ тооцооллын нарийн төвөгтэй байдал, хувьсах утгуудын тооноос үл хамааран статистик мэдээллийн чухал үзүүлэлтийг тодорхойлохын мөн чанар нь ижил төстэй юм.

Хэрхэн тооцдог вэ?

Тэгшитгэлийн "статистикийн ач холбогдол"-ын үзүүлэлтийн утгыг тооцоолоход хэрэглэнэ. Өөрөөр хэлбэл, энэ тохиолдолд бүх зүйлийг математик шийддэг гэж маргаж болно. Тооцооллын хамгийн энгийн сонголт бол математикийн үйлдлүүдийн гинжин хэлхээ бөгөөд үүнд дараах параметрүүд орно:

  • худалдан авалтын хэмжээ гэх мэт судалгаа эсвэл объектив өгөгдлийн судалгаанаас олж авсан хоёр төрлийн үр дүн, а ба b-ээр тэмдэглэгдсэн;
  • хоёр бүлгийн түүврийн хэмжээ заагч – n;
  • нийлмэл түүврийн хуваалтын утга - p;
  • стандарт алдаа - SE.

Дараагийн алхам бол тестийн ерөнхий оноог тодорхойлох явдал юм - t, түүний утгыг 1.96 тоотой харьцуулна. 1.96 нь Оюутны t-тархалтын функцийн дагуу 95%-ийн мужийг дамжуулдаг дундаж утга юм.

Энгийн тооцооллын томъёо
Энгийн тооцооллын томъёо

n болон p-ийн утгуудын хооронд ямар ялгаа байдаг вэ гэсэн асуулт ихэвчлэн гарч ирдэг. Энэ нюансыг жишээгээр тодруулахад хялбар байдаг. Эрэгтэй, эмэгтэй хүмүүсийн аливаа бүтээгдэхүүн, брэндэд үнэнч байхын статистикийн ач холбогдлыг тооцоолсон гэж бодъё.

Энэ тохиолдолд үсгүүдийн араас дараах үсэг бичигдэнэ:

  • n - судалгаанд оролцогчдын тоо;
  • p - бүтээгдэхүүнд сэтгэл хангалуун байгаа хүмүүсийн тоо.

Энэ тохиолдолд ярилцлагад хамрагдсан эмэгтэйчүүдийн тоог n1 гэж тооцно. Үүний дагуу эрэгтэйчүүд - n2. Ижил утга нь p. тэмдгийн "1" ба "2" тоотой байна.

Тестийн оноог Оюутны хүснэгтийн дундажтай харьцуулснаар "статистикийн ач холбогдол" гэж нэрлэгддэг.

Баталгаажуулалт гэж юу гэсэн үг вэ?

Ямар ч математик тооцооны үр дүнг байнга шалгаж болно, үүнийг бага ангийн хүүхдүүдэд заадаг. Таамаглах нь логик юмТооцооллын гинжин хэлхээг ашиглан статистикийг тодорхойлдог тул тэдгээрийг шалгана.

Гэхдээ статистикийн ач холбогдлыг шалгах нь зөвхөн математик биш юм. Статистик нь олон тооны хувьсагч, янз бүрийн магадлалыг авч үздэг бөгөөд эдгээр нь үргэлж тооцоолох боломжгүй байдаг. Өөрөөр хэлбэл, нийтлэлийн эхэнд байгаа резинэн гутлын жишээ рүү буцах юм бол дэлгүүрийн бараа худалдан авагчдын найдах статистик мэдээллийн логик бүтэц нь намрын улиралд ердийн бус хуурай, халуун цаг агаарт саад болж болзошгүй юм.. Энэ үзэгдлийн үр дүнд резинэн гутал худалдан авах иргэдийн тоо буурч, худалдааны цэгүүд алдагдал хүлээх болно. Мэдээжийн хэрэг, математикийн томъёо нь цаг агаарын гажигыг урьдчилан таамаглах боломжгүй юм. Энэ мөчийг "алдаа" гэж нэрлэдэг.

Статистик мэдээллийг дүрслэн харуулах хэрэгслүүд
Статистик мэдээллийг дүрслэн харуулах хэрэгслүүд

Энэ бол зөвхөн ийм алдаа гарах магадлал бөгөөд тооцоолсон ач холбогдлын түвшинг шалгахад тооцдог. Энэ нь тооцоолсон үзүүлэлтүүд болон хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин, түүнчлэн таамаглал гэж нэрлэгддэг хэмжигдэхүүнүүдийг харгалзан үздэг.

Ач холбогдол нь юу вэ?

Статистикийн ач холбогдлын үндсэн шалгуурт "түвшин" гэсэн ойлголт багтсан. Үүнийг хэрэглээний болон практик статистикт ашигладаг. Энэ нь хазайлт, алдаа гарах магадлалыг харгалзан үздэг нэг төрлийн утга юм.

Түвшин нь бэлэн дээжийн ялгааг тодорхойлоход суурилдаг бөгөөд энэ нь тэдгээрийн ач холбогдол эсвэл эсрэгээр санамсаргүй байдлыг тогтоох боломжийг олгодог. Энэ ухагдахуун нь зөвхөн дижитал утгатай төдийгүй тэдний өвөрмөц тайлбартай байдаг. Тэд тайлбарлаж байнаТа үнэ цэнийг хэрхэн ойлгох хэрэгтэй бөгөөд үр дүнг дундаж индекстэй харьцуулах замаар түвшинг өөрөө тодорхойлдог бөгөөд энэ нь ялгааны найдвартай байдлын түвшинг харуулдаг.

Статистикийн талаархи хэлэлцүүлэг
Статистикийн талаархи хэлэлцүүлэг

Тиймээс бид түвшний тухай ойлголтыг энгийнээр төсөөлж болох юм - энэ нь хүлээн авсан статистик мэдээллээс гаргасан дүгнэлтэнд хүлээн зөвшөөрөгдөх, магадлалтай алдаа эсвэл алдааны үзүүлэлт юм.

Ямар түвшний ач холбогдлыг ашигладаг вэ?

Практикт алдааны магадлалын коэффициентүүдийн статистик ач холбогдол нь үндсэн гурван түвшинд суурилдаг.

Эхний түвшин нь 5% байх босго юм. Өөрөөр хэлбэл, алдаа гарах магадлал 5% -иас хэтрэхгүй байна. Энэ нь статистикийн судалгааны мэдээлэлд үндэслэн гаргасан дүгнэлтийн өөгүй, алдаагүй гэдэгт итгэх итгэл 95% байна гэсэн үг.

Хоёр дахь түвшин нь 1% босго юм. Иймээс энэ тоо нь статистикийн тооцооллын явцад олж авсан мэдээллээр 99% итгэлтэйгээр удирдаж болно гэсэн үг.

Гурав дахь түвшин - 0.1%. Энэ утгын хувьд алдаа гарах магадлал хувьтай тэнцэх бөгөөд өөрөөр хэлбэл алдааг бараг арилгана.

Статистикийн таамаглал гэж юу вэ?

Алдааг үзэл баримтлалын хувьд тэг таамаглалыг хүлээн зөвшөөрөх эсвэл үгүйсгэх гэсэн хоёр хэсэгт хуваадаг. Таамаглал гэдэг нь тодорхойлолтын дагуу судалгааны үр дүн, бусад өгөгдөл эсвэл мэдэгдлийн багцыг нуусан ойлголт юм. Өөрөөр хэлбэл, статистикийн нягтлан бодох бүртгэлийн сэдэвтэй холбоотой аливаа зүйлийн магадлалын хуваарилалтын тодорхойлолт.

регрессийн статистик ач холбогдол
регрессийн статистик ач холбогдол

Энгийн тооцоололд тэг ба хувилбар гэсэн хоёр таамаглал байдаг. Тэдний хоорондын ялгаа нь тэг таамаглал нь статистикийн ач холбогдлыг тодорхойлоход оролцсон түүврийн хооронд үндсэн ялгаа байхгүй гэсэн санаан дээр үндэслэсэн бөгөөд өөр хувилбар нь түүний эсрэг тэсрэг байдаг. Өөрөөр хэлбэл, өөр таамаглал нь эдгээр түүврүүдэд мэдэгдэхүйц ялгаа байгаа эсэх дээр үндэслэсэн болно.

Ямар алдаа байна?

Алдаа нь статистикийн ойлголт болох энэ эсвэл тэр таамаглалыг үнэн гэж хүлээн зөвшөөрөхтэй шууд пропорциональ байдаг. Тэдгээрийг хоёр чиглэл эсвэл төрөлд хувааж болно:

  • эхний төрөл нь тэг таамаглалыг хүлээн зөвшөөрсөнтэй холбоотой бөгөөд энэ нь буруу болсон;
  • секунд - өөр хувилбарыг дагаснаас үүдэлтэй.
Статистикийн графикуудыг үзэх
Статистикийн графикуудыг үзэх

Эхний төрлийн алдааг худал эерэг гэж нэрлэдэг бөгөөд статистик мэдээлэл ашигладаг бүх салбарт нэлээд түгээмэл тохиолддог. Үүний дагуу хоёр дахь төрлийн алдааг худал сөрөг гэж нэрлэдэг.

Бидэнд яагаад статистикт регресс хэрэгтэй байна вэ?

Регрессийн статистик ач холбогдол нь түүний тусламжтайгаар өгөгдөлд үндэслэн тооцсон янз бүрийн хамаарлын загвар бодит байдалтай хэр зэрэг нийцэж байгааг тогтоох боломжтой юм; Нягтлан бодох бүртгэл, дүгнэлт гаргах хүчин зүйлсийн хүрэлцээ, дутагдалтай байдлыг тодорхойлох боломжийг танд олгоно.

Регрессийн утгыг Фишерийн хүснэгтэд жагсаасан өгөгдөлтэй үр дүнг харьцуулан тодорхойлно. Эсвэл дисперсийн шинжилгээ ашиглан. Хэзээ регрессийн үзүүлэлтүүд чухал байдаголон тооны хувьсагч, санамсаргүй өгөгдөл болон болзошгүй өөрчлөлтүүдийг агуулсан нарийн төвөгтэй статистик судалгаа, тооцоолол.

Зөвлөмж болгож буй: