با اهمیت p value در مقالات آشنا شوید. |
يکي از مواردي که مي تواند منجر به بروز اشتباه در قضاوت شود اين است که پژوهشگر بيان کند که تفاوتي بين گروه درمان و شاهد وجود دارد در حالي که چنين تفاوتي وجود ندارد. در اصطلاح آماري اين نوع خطا که در آن به اشتباه نتيجه گيري شود که اختلافي بين دو گروه وجود دارد به عنوان خطاي نوع 1 (Type I error) در نظر گرفته مي شود و احتمال بروز اين خطا به عنوان سطح آلفا (alpha level) در نظر گرفته مي شود. تصور کنيد که در موقعيتي نياز به انداختن سکه داريد و نمي توانيد اطمينان حاصل کنيد که آيا اين سکه بدون بروز خطا کار مي کند يا نه. پرتاب سکه مي تواند يکي از نتايج شير يا خط را ايجاد کند. در يک بررسي يک فرد مي تواند فرضيه اي بيان کند که احتمال اينکه شير يا خط بيايد برابر است که در اين صورت سکه بدون هيچ خطايي کار مي کند. در چنين فرضيه اي احتمال اينکه در هر بار پرتاب سکه شير يا خط ظاهر شود براي هر کدام 50 درصد مي باشد. اين فرضيه را مي توان به اين صورت مورد آزمايش قرار داد که در يک روند آزمايشي اقدام به پرتاب سکه در چند نوبت مختلف کنيم. بررسي آماري نتايج به دست آمده به صورت شير يا خط مي تواند براي پاسخ دادن به اين سؤال که آيا احتمال آمدن شير يا خط در هر بار پرتاب سکه با هم برابرند يا نه به کار رود.
براي درک بهتر اين مفهوم اجازه بدهيد شرايطي را در نظر بگيريم که در آن اين سکه 100 بار پرتاب مي شود و در آن هر 10 بار جواب به دست آمده شير بوده است. در صورتي که اين سکه سالم باشد و خطايي نداشته باشد چقدر احتمال دارد اين حالت بروز کند؟ بسياري از افراد در مواجهه با چنين موقعيتي نتيجه مي گيرند که احتمال اينکه تنها شانس بتواند چنين نتيجه گيري را توجيه کند بسيار پايين است. بنابراين به نظر مي رسد که در برخورد با چنين موقعيتي بيشتر افراد فرضيه اوليه اي (فرضيه صفر) را رد کرده و بيان مي کنند که اين سکه داراي درصدي خطا است. روش هاي آماري در برخورد با چنين مواردي به ما کمک مي کنند تا به صورت دقيق تر بتوانيم تصميم بگيريم که چقدر احتمال دارد نتيجه به دست آمده بر اساس شانس بوده باشد و سکه مورد نظر بدون خطا باشد. اگر احتمال آمدن هر يک از موارد شير يا خط در هر پرتاب 0.5 باشد بر اساس قانون وقايع غير مرتبط احتمال آمدن شير در 10 پرتاب متوالي به صورت ضرب عدد 0.5 به تعداد 10 بار خواهد بود. عدد به دست آمده در اين حالت کمتر از يک در هزار خواهد بود. در بررسي هاي علمي و نيز در مقالات چاپ شده در مجلات مختلف اين احتمال با لفظ p value بيان مي شود. به عنوان مثال بيان مي شود p value< 0.001 . براي درک دقيق معناي p value مراحل زير را در نظر بگيريد:
در صورتي که يک سکه فاقد خطا باشد (يعني احتمال به دست آمدن شير يا خط در هر بار پرتاب برابر و عدد آن 0.5 باشد) و فردي آن را 10 بار پرتاب نمايد احتمال به دست آمدن شير در تمامي 10 پرتاب متوالي برابر عددي کمتر از 1 در هزار خواهد بود. اين در حالي است که در صورتي که چنين پرتابي تکرار شود احتمال به دست آمدن10 شير يا خط در هر سري از پرتابها برابر با حاصل ضرب اين احتمالات خواهد بود که برابر با عددي نزديک به دو در هزار خواهد بود.
در انجام پژوهش ها براي رسيدن به پاسخ اين سؤال که آيا فرضيه صفر رد خواهد شد يا نه معمولا حد و مرزهايي در نظر گرفته مي شود. ميزان اين حدود به اين موضوع وابسته است که پژوهشگر چقدر تمايل دارد فرضيه صفر را رد کرده يا بپذيرد. به عبارت ديگر محقق بايد در نظر بگيرد که تا چه ميزان مي تواند اين ريسک را بپذيرد که شانس باعث به وجود آمدن اين اختلاف شده است. در حقيقت پژوهشگر بايد حدودي را در نظر بگيرد که در صورتي که ميزان خطاي مطالعه بيش از آن مقدار بود نتوان اين اختلاف را ناشي از شانس در نظر گرفت. در مثال مربوط به پرتاب سکه ميتوان به اين صورت بيان کرد که در صورتي که بروز اين پديده به صورت شانسي در نظر گرفته شود که احتمال آن کمتر از يک در هزار باشد.
در انجام مطالعات مختلف اين حدود به عنوان p value در نظر گرفته ميشود و مقدار آن برابر 0.05 خواهد بود. با در نظر گرفتن اين مقدار نتايجي که در زير اين مقدار قرار ميگيرند از نظر آماري معني دار خواهند بود؛ يعني به احتمال بسيار بالايي نتيجه به دست آمده ناشي از شانس نبوده و به اين ترتيب پژوهشگر قادر خواهد بود فرضيه صفر را رد کند.
در مطالعات مختلف زماني که پژوهشگران دو روش درماني را مورد مقايسه قرار ميدهند اين پرسش مطرح ميشود که چقدر احتمال دارد نتايج ناشي از شانس باشد. به منظور پاسخ به اين سؤال ميزان p value کمتر از 0.05 در نظر گرفته ميشود و به اين معني است که در صورتي که اين مطالعه تکرار شود و نتيجه حاصل از آن در 5 بار يا کمتر از آن مشابه باشد ميتوان اثر شانس را در بروز آن رد کرد و بيان کرد که نتيجه به دست آمده به واقعيت نزديک است. در صورتي که نتيجه به دست آمده با احتمالي بيش از اين مقدار تکرار شودو p value مطالعه بيش از 0.05 باشد نمي توان فرضيه صفر را رد کرد و بيان کرد که دو روش درماني مقايسه شده داراي تفاوت آماري معنادار هستند.
در این فلش نکاتی مربوط به فاصله اطمینان و P value را مرور می کنیم. با کلیک بر روی آیکون فراسا وارد فلش می شویم.
در این فلش با مثال مطرح شده با مفهوم p value بیشتر آشنا می شویم.