ISSN 2477-1686  

 Vol. 12 No. 52 Februari 2026

 

Kenapa p-value Harus Dibawah 0.05?

 

Oleh:

Chandra Yudistira Purnama

Fakultas Psikologi Universitas Jenderal Achmad Yani Cimahi

 

P-value adalah salah satu konsep fundamental dalam statistik inferensial yang digunakan untuk menentukan signifikansi hasil penelitian (Andrade, 2019; Chén et al., 2023). Dalam konteks penelitian ilmiah, khususnya di bidang psikologi, p-value yang berada di bawah 0.05 dianggap sebagai batas signifikan yang menunjukkan bahwa hasil yang diperoleh tidak mungkin terjadi hanya karena kebetulan semata (Chén et al., 2023). Pada umumnya, p-value berfungsi untuk mengukur probabilitas bahwa hasil yang diamati dalam suatu penelitian terjadi jika hipotesis nol (H) benar, di mana hipotesis nol menyatakan bahwa tidak ada efek atau hubungan antara variabel yang sedang diuji (Biau et al., 2010). Jika p-value lebih kecil dari 0.05, kita dapat menolak hipotesis nol, yang berarti ada bukti yang cukup untuk mendukung bahwa temuan tersebut bukanlah kebetulan.

 

Angka 0.05 pertama kali diperkenalkan oleh Ronald Fisher pada tahun 1925 sebagai batas untuk menilai signifikansi statistik dalam eksperimen (Fisher, 1992). Fisher berpendapat bahwa jika p-value lebih kecil dari 0.05, hasil penelitian cukup kuat untuk dianggap signifikan (Fisher, 1992). Dalam disiplin psikologi, p-value dengan ambang batas 0.05 menjadi instrumen krusial dalam menilai signifikansi statistik serta validitas sebuah temuan penelitian. Standar ini dianggap mampu menyeimbangkan risiko kesalahan Tipe I (menolak hipotesis nol yang benar) dan Tipe II (gagal menolak hipotesis nol yang salah), serta membedakan antara faktor kebetulan dengan efek yang nyata. Dengan menekan risiko kesalahan Tipe I, peneliti dapat memastikan bahwa temuan mereka valid dan tidak menyesatkan, sehingga menjaga integritas ilmiah.

Pentingnya nilai p-value di bawah 0.05 dalam penelitian psikologi terletak pada sifat eksperimen yang sering melibatkan banyak variabel dan data yang beragam. Psikologi sebagai ilmu yang mempelajari perilaku manusia memiliki banyak faktor yang dapat mempengaruhi hasil eksperimen (Uher, 2021), sehingga rentan terhadap kesalahan statistik. Misalnya, dalam penelitian terapi kognitif oleh Hofmann, pencapaian p-value sebesar 0,03 memberikan bukti yang kuat untuk mendukung efektivitas terapi kognitif dalam mengurangi depresi (Hofmann et al., 2012). Sebaliknya, jika p-value melampaui batas signifikansi, temuan tersebut tidak dapat dianggap signifikan secara statistik, yang pada gilirannya mengurangi kredibilitas hasil penelitian (Wasserstein & Lazar, 2016).

 

Namun, meskipun p-value di bawah 0.05 sering digunakan sebagai patokan, hal ini tidak menjamin bahwa hasil penelitian bebas dari bias atau kesalahan. Sebuah penelitian mengingatkan bahwa p-value tidak memberikan bukti mutlak terhadap hipotesis alternatif, melainkan hanya ukuran probabilitas berdasarkan asumsi tertentu yang dapat berubah seiring dengan metode yang digunakan dan kualitas data yang dikumpulkan (Andrade, 2019; Cohen, 1994). Oleh karena itu, meskipun p-value kecil memberikan indikasi adanya hubungan yang signifikan, hasil ini tidak seharusnya digunakan sebagai satu-satunya alat untuk menarik kesimpulan ilmiah (Andrade, 2019; Chén et al., 2023).

Lebih lanjut, meskipun standar p-value 0.05 telah menjadi konvensi yang diterima secara luas, batas ini juga memiliki keterbatasan. Dalam beberapa kasus, seperti eksperimen dengan ukuran sampel kecil atau efek yang sangat kecil, p-value di bawah 0.05 mungkin tidak cukup untuk menjamin temuan yang benar-benar signifikan secara praktis. Dalam hal ini, para peneliti disarankan untuk melaporkan ukuran efek (effect size) bersama dengan p-value untuk memberikan gambaran yang lebih lengkap mengenai signifikansi temuan mereka (Lakens, 2013). Sebagai contoh, dua studi dengan p-value yang sama dapat menghasilkan implikasi praktis yang sangat berbeda, tergantung pada besar efek yang ditemukan.

 

Namun demikian, penggunaan p-value di bawah 0.05 tetap menjadi standar emas dalam banyak disiplin ilmu (Kennedy-Shaffer, 2019), termasuk psikologi, karena kemampuannya dalam menyeimbangkan antara menghindari kesalahan tipe I dan tipe II. Penerapan batas ini memberikan pedoman yang jelas bagi para peneliti untuk menentukan apakah hasil mereka cukup kuat untuk dipertimbangkan sebagai bukti dari hipotesis alternatif yang diajukan. Oleh karena itu, meskipun tidak sempurna, p-value di bawah 0.05 tetap memainkan peran sentral dalam menjaga integritas dan kredibilitas penelitian (Andrade, 2019; Chén et al., 2023; Wasserstein & Lazar, 2016), serta memastikan bahwa temuan-temuan dalam psikologi benar-benar didukung oleh bukti yang kuat dan tidak sekadar kebetulan belaka.

 

Referensi:

Andrade, C. (2019). The P value and statistical significance: Misunderstandings, explanations, challenges, and alternatives. In Indian Journal of Psychological Medicine (Vol. 41, Number 3, pp. 210–215). Wolters Kluwer Medknow Publications. https://doi.org/10.4103/IJPSYM.IJPSYM_193_19

Biau, D. J., Jolles, B. M., & Porcher, R. (2010). P value and the theory of hypothesis testing: An explanation for new researchers. In Clinical Orthopaedics and Related Research (Vol. 468, Number 3, pp. 885–892). Springer New York LLC. https://doi.org/10.1007/s11999-009-1164-4

Chén, O. Y., Bodelet, J. S., Saraiva, R. G., Phan, H., Di, J., Nagels, G., Schwantje, T., Cao, H., Gou, J., Reinen, J. M., Xiong, B., Zhi, B., Wang, X., & de Vos, M. (2023). The roles, challenges, and merits of the p value. In Patterns (Vol. 4, Number 12). Cell Press. https://doi.org/10.1016/j.patter.2023.100878

Cohen, J. (1994). The Earth Is Round (p < .05). https://doi.org/https://doi.org/10.1037/0003-066X.49.12.997

Fisher, R. A. (1992). Statistical Methods for Research Workers. In S. Kotz & N. L. Johnson (Eds.), Breakthroughs in Statistics: Methodology and Distribution (pp. 66–70). Springer New York. https://doi.org/10.1007/978-1-4612-4380-9_6

Hofmann, S. G., Asnaani, A., Vonk, I. J. J., Sawyer, A. T., & Fang, A. (2012). The efficacy of cognitive behavioral therapy: A review of meta-analyses. In Cognitive Therapy and Research (Vol. 36, Number 5, pp. 427–440). Springer New York LLC. https://doi.org/10.1007/s10608-012-9476-1

Kennedy-Shaffer, L. (2019). Before p < 0.05 to Beyond p < 0.05: Using History to Contextualize p-Values and Significance Testing. American Statistician, 73(sup1), 82–90. https://doi.org/10.1080/00031305.2018.1537891

Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science: A practical primer for t-tests and ANOVAs. Frontiers in Psychology, 4(NOV). https://doi.org/10.3389/fpsyg.2013.00863

Uher, J. (2021). Psychology’s Status as a Science: Peculiarities and Intrinsic Challenges. Moving Beyond its Current Deadlock Towards Conceptual Integration. Integrative Psychological and Behavioral Science, 55(1), 212–224. https://doi.org/10.1007/s12124-020-09545-0

Wasserstein, R. L., & Lazar, N. A. (2016). The ASA’s Statement on p-Values: Context, Process, and Purpose. In American Statistician (Vol. 70, Number 2, pp. 129–133). American Statistical Association. https://doi.org/10.1080/00031305.2016.1154108