Propensity Score vs Prognosis Summary Score: สองคะแนนที่หน้าตาคล้ายกัน แต่ตอบคนละคำถาม & How to Matching

Mayta
23 เม.ย.
ยาว 4 นาที

ในงานวิจัยเชิงสังเกต (observational studies) เรามักพูดถึงคำว่า “matching” เหมือนเป็นแค่เทคนิคทางสถิติขั้นหนึ่ง แต่ความจริงแล้ว matching ไม่ได้เริ่มจาก algorithm ก่อน มันเริ่มจากคำถามที่ลึกกว่านั้น:

เราต้องการทำให้คนสองกลุ่ม “เทียบกันได้” ในเรื่องอะไร?

ถ้าคำถามของเราคือ“ใครมีโอกาสได้รับการรักษาใกล้เคียงกัน?”เครื่องมือที่มักใช้คือ Propensity Score (PS)

แต่ถ้าคำถามของเราคือ“ถ้าคนนี้ปกติ ค่า outcome ควรได้เท่าไหร่?”หรือพูดให้ชัดขึ้นว่า“ถ้าคนนี้ไม่มีโรค เป็น control แต่ยังมีอายุ เพศ BSA HR เหมือนเดิม ค่า CMR ควรเป็นเท่าไร?”คำตอบจะขยับไปอยู่ฝั่ง Prognosis Summary Score (PSS)

แม้ทั้งสองวิธีจะย่อข้อมูลหลายตัวแปรให้กลายเป็น “เลขตัวเดียวต่อหนึ่งคน” เหมือนกัน แต่สิ่งที่เลขนั้นแทนความหมาย กลับต่างกันโดยสิ้นเชิง

ก่อนจะ match เราต้องเลือกก่อนว่า จะทำให้ “อะไร” comparable

ในภาษาของระบาดวิทยาและ causal inference เรามักคิดโจทย์ผ่านกรอบว่า outcome เกิดจาก exposure ร่วมกับ confounders และแหล่งอคติอื่น ๆ ไม่ใช่จาก exposure ลอย ๆ ตัวเดียว ดังนั้นการเปรียบเทียบคนสองกลุ่มให้แฟร์จึงต้องเริ่มจากการทำให้ปัจจัยพื้นฐานสมดุลกันก่อน

แต่คำว่า “สมดุล” มีได้มากกว่าหนึ่งแบบ

แบบแรก คือสมดุลใน โอกาสได้รับ treatment/exposure
แบบที่สอง คือสมดุลใน ค่าผลลัพธ์ที่ควรจะเป็นตั้งต้น

Propensity Score และ Prognosis Summary Score จึงเหมือนพี่น้องคนละฝา: หนึ่งคนมองไปที่กลไกการได้รับ exposure อีกคนมองไปที่กลไกการเกิด outcome

Propensity Score: ทำให้สองคน “มีโอกาสได้รับ treatment ใกล้กัน”

Propensity Score คือความน่าจะเป็นที่แต่ละคนจะได้รับ treatment หรือ exposure จาก covariates ที่สังเกตได้ เช่น อายุ เพศ โรคร่วม ความรุนแรงของโรค baseline labs หรือปัจจัยทางคลินิกอื่น ๆ ที่อาจทำให้แพทย์เลือกให้หรือไม่ให้การรักษา

เขียนเป็นสมการง่าย ๆ ได้ว่า

สิ่งสำคัญมากคือ PS ไม่ได้โมเดล outcomeมันไม่ตอบว่าใคร “ควร” ได้ treatment และไม่ตอบว่า outcome จะเป็นอย่างไรมันตอบเพียงว่า

“จากข้อมูลพื้นฐานที่เห็น คนนี้มีแนวโน้มจะได้รับ treatment มากแค่ไหน”

ในทางปฏิบัติ เรามัก fit โมเดลนี้จาก ข้อมูลทั้งหมด คือทั้ง treated และ untreated เพราะเราต้องการเรียนรู้ “กลไกการได้รับ treatment” ตามที่เกิดขึ้นจริงใน dataset นั้น หลังจาก fit โมเดลแล้ว เราจะได้ propensity score หนึ่งค่าต่อหนึ่งคน ซึ่งมักเป็นเลขระหว่าง 0 ถึง 1 [2,4,8]

จากนั้นจึงนำเลขนี้ไปใช้หลายแบบ เช่น matching, weighting, stratification หรือ covariate adjustment แต่ถ้าพูดเฉพาะเรื่อง matching หลักคิดคือ:

จับคู่คนที่ได้รับ treatment กับคนที่ไม่ได้รับ treatment ซึ่งมี propensity score ใกล้กัน

ตัวอย่างเช่น ผู้ป่วย A ที่ได้รับ treatment มี PS = 0.72 อาจถูกจับคู่กับผู้ป่วย B ที่ไม่ได้รับ treatment แต่มี PS = 0.70 เพราะทั้งสองคน “มีแนวโน้มจะได้รับ treatment ใกล้กัน” ตาม covariates ที่วัดได้ แม้สุดท้ายคนหนึ่งได้รับ treatment แต่อีกคนไม่ได้รับ

นี่คือหัวใจของการลด confounding by indication หรือ confounding by contraindication ในงาน comparative effectiveness research เพราะถ้าไม่ทำแบบนี้ กลุ่มที่ได้รับ treatment อาจดูป่วยกว่าตั้งแต่ต้น หรือในบางกรณีอาจดูแข็งแรงกว่าเพราะคนที่เปราะบางถูกงด treatment ทำให้การเปรียบเทียบ outcome ตรง ๆ มี bias ได้ง่าย

แต่ Propensity Score ไม่ได้บอกว่า outcome “ควรเป็นเท่าไร”

นี่คือจุดที่คนจำนวนมากสับสน

แม้ PS จะช่วยทำให้ treated และ untreated comparable ในแง่ treatment assignment mechanism แต่ PS ไม่ได้สนใจ outcome โดยตรงมันไม่รู้เลยว่า CMR, LV mass, T1, strain หรือ biomarker ของคุณ “ควร” เป็นเท่าไรในคนที่มีอายุ เพศ BSA HR แบบนี้

ดังนั้นในงานที่โจทย์จริงคือการเปรียบเทียบ ความเบี่ยงเบนจากสรีรวิทยาปกติ โดยเฉพาะงาน case-control หรือ disease-control comparisons ที่ outcome เป็น continuous physiologic phenotype การใช้ PS อย่างเดียวอาจยังไม่ตอบคำถามที่ลึกพอ

Prognosis Summary Score: ทำให้สองคน “ควรมี outcome เท่ากันถ้าปกติ”

Prognosis Summary Score หรือ PSS ขยับจุดโฟกัสจาก exposure ไปสู่ outcome

แทนที่จะถามว่า“ใครมีโอกาสได้รับ treatment เท่าไร?” PSS ถามว่า

“ถ้าคนนี้ปกติ ไม่มีโรค เป็น control แต่ยังมี covariates เหมือนเดิม ค่า Y ควรได้เท่าไร?”

เขียนเชิงแนวคิดได้ว่า

นี่คือ outcome-side analogue ของ propensity score:PS สรุปความน่าจะเป็นของ exposure assignmentPSS สรุปค่าที่คาดหวังของ outcome ภายใต้สถานะ control

สิ่งสำคัญมากอีกอย่างคือ PSS ไม่ได้ fit จากทุกคนโดยทั่วไป PSS ควรถูกสร้างจาก control data only เพราะเราต้องการเรียนรู้ “ความสัมพันธ์แบบปกติ” ระหว่าง covariates กับ outcome ในคนที่ไม่มีโรค ถ้าเราเอา case เข้าไป fit ด้วย โรคจะปนเข้าไปในสมการ และสิ่งที่ควรเป็น “ค่าปกติ” ก็จะถูกทำให้ผิดรูป

ยกตัวอย่างในงาน CMR ถ้า outcome คือ LV mass เราอาจสร้างโมเดลดังนี้ใน controls:

เมื่อ fit เสร็จแล้ว เราจึงนำโมเดลนี้ไป predict สำหรับ ทุกคน ทั้ง controls และ cases ค่า predicted ที่ได้คือคำตอบของคำถามว่า

“ถ้าคนนี้ปกติ ค่า LV mass ควรเป็นเท่าไร?”

นี่แหละคือ PSS

PSS ไม่ได้จับคู่จาก Y ที่สังเกตจริง แต่จับคู่จาก “Y ที่ควรเป็น aka. Expected Y”

นี่เป็นอีกจุดที่ต้องแยกให้ออก

PSS ไม่ใช่การเอา observed outcome ไป match ตรง ๆเราไม่ได้จับคู่ case ที่ LV mass = 150 g กับ control ที่ LV mass = 150 g เพราะถ้าทำแบบนั้น เราอาจกำลัง match disease effect เข้าด้วยกันโดยไม่รู้ตัว

สิ่งที่ PSS ใช้ match คือ predicted healthy outcome หรือ Ŷ healthy

เช่น ชายอายุ 60 ปี เพศชาย BSA 2.0 HR 90 อาจมี observed LV mass = 150 g ในกลุ่ม case แต่เมื่อใช้โมเดล control-only ทำนาย เราอาจได้ว่า “ถ้าเขาปกติ” ค่า LV mass ที่ควรเป็นคือ 110 g

ดังนั้น PSS ของเขาคือ 110 ไม่ใช่ 150

จากนั้นเราจึงหา control ที่มี PSS ใกล้ 110 เช่น 108 หรือ 112 เพื่อให้ได้คนที่ “ควรมี physiology ตั้งต้นใกล้กัน” แล้วค่อยดูว่าคนที่เป็นโรคเบี่ยงเบนจากค่าที่ควรเป็นไปเท่าไร

พูดให้ง่ายที่สุด:

PS match คนที่มีโอกาสได้รับ treatment ใกล้กัน
PSS match คนที่ควรมี outcome ปกติใกล้กัน

ตารางสรุป: Propensity Score vs Prognosis Summary Score

ประเด็น	Propensity Score (PS)	Prognosis Summary Score (PSS)
คำถามหลัก	คนนี้มีโอกาสได้รับ treatment/exposure เท่าไร?	ถ้าคนนี้ปกติ outcome ควรเป็นเท่าไร?
โมเดลอะไร	Exposure/Treatment model	Outcome/Prognostic model
สมการแนวคิด	P(Treatment∣Confounders)	E(Y∣Confounders,Control)
fit จากใคร	ทุกคนใน dataset โดยทั่วไป	control only
ค่าที่ได้	probability 0–1	predicted outcome บน scale ของ Y
ใช้ outcome ในโมเดลไหม	ไม่ใช้	ใช้ Y เป็นตัวแปรตาม
ใช้ match อะไร	treated vs untreated / exposed vs unexposed	case vs control หรือ disease vs reference
เหมาะเมื่อ	กังวล confounding by indication/contraindication	กังวล baseline prognosis/physiology difference

ตัวอย่างเชิงคลินิก: ทำไม PSS จึง intuitive ใช้งานง่าย มากในงาน CMR

ลองนึกถึงนักวิจัยที่สนใจเปรียบเทียบ CMR parameter ระหว่างผู้ป่วย cardiomyopathy กับ healthy controls

ถ้าใช้ propensity score คำถามจะออกแนวว่า“ใครมีโอกาสอยู่ในกลุ่ม case มากกว่ากันจากอายุ เพศ BSA HR?”

คำถามนี้อาจมีประโยชน์ในบางสถานการณ์ แต่ยังไม่แตะหัวใจของโจทย์สรีรวิทยาโดยตรง

ในทางกลับกัน PSS จะถามว่า“ชายอายุ 60 ปี เพศชาย BSA 2.0 HR 90 ถ้าไม่มีโรค ค่า native T1 หรือ LV mass ควรเป็นเท่าไร?”

เมื่อเราได้คำตอบนี้ เราไม่เพียงแค่จับคู่ case กับ control ให้คล้ายกันในระดับ covariates แต่เรายังได้ baseline physiologic expectation ที่นำไปใช้ต่อได้อีกหลายทาง เช่น

ใช้ match จับคู่ case กับ control ที่มี expected normal outcome ใกล้กัน
ใช้ adjust ใน regressionเช่นเปรียบเทียบ observed outcome ระหว่างกลุ่ม โดยปรับ PSS เป็น covariate
ใช้ residual analysis คำนวณ

เพื่อแปลเป็น “disease-related deviation” ได้อย่างเป็นรูปธรรม

นี่ทำให้ PSS มีความหมายทางคลินิกสูงมาก โดยเฉพาะเมื่อ outcome มีหน่วยที่ตีความได้จริง เช่น grams, ms, %, mL/m² ไม่ใช่แค่ probability

แล้วควรเลือกอะไร เมื่อไร?

คำตอบสั้น ๆ คือ: เลือกตามคำถามวิจัย ไม่ใช่เลือกตามความคุ้นเคยของสถิติ

ใช้ Propensity Score เมื่อ

โจทย์หลักคือการเปรียบเทียบ treatment/exposure groups และ bias สำคัญอยู่ที่การที่คนสองกลุ่มมีโอกาสได้รับ treatment ไม่เท่ากัน เช่น therapeutic หรือ etiologic observational studies ที่แพทย์เลือก treatment ตามความรุนแรง โรคร่วม หรือข้อห้ามใช้ยา

ใช้ Prognosis Summary Score เมื่อ

โจทย์หลักคือการเปรียบเทียบ case vs control หรือ disease vs reference โดยต้องการทำให้เทียบกันได้ในระดับ expected outcome under normal state โดยเฉพาะอย่างยิ่งเมื่อ outcome เป็น continuous physiologic marker และคำถามทางคลินิกมีลักษณะว่า “โรคทำให้ค่าที่ควรเป็นเบี่ยงไปเท่าไร”

ที่สำคัญ PS และ PSS ไม่ใช่เครื่องมือแทนกันตรง ๆทั้งสองอาจดูคล้ายกันเพราะให้เลขตัวเดียวต่อหนึ่งคนเหมือนกัน แต่คนละตัวเลขนั้นมาจากคนละโลกของคำถามวิจัย

ความเข้าใจผิดที่พบบ่อย

ความเข้าใจผิดแรกคือคิดว่า propensity score คือ “probability ว่าใครควรได้ treatment”ความจริงมันคือ probability ว่าใครน่าจะได้รับ treatment ตามสิ่งที่เกิดขึ้นในข้อมูล ไม่ใช่คำตัดสินเชิงคลินิกว่าควรหรือไม่ควร

ความเข้าใจผิดที่สองคือคิดว่า PSS คือ observed outcomeความจริง PSS คือ predicted outcome ภายใต้ control state ไม่ใช่ค่าที่เกิดขึ้นจริงในผู้ป่วย

ความเข้าใจผิดที่สามคือ fit PSS จาก cases และ controls รวมกันการทำเช่นนั้นทำให้ disease effect เข้าไปปนในสมการปกติ และทำลายความหมายของคำว่า “ถ้าคนนี้ปกติ”

ความเข้าใจผิดที่สี่คือใส่ตัวแปรที่เป็น mediator, collider หรือเป็นผลของ disease/treatment ลงในโมเดลโดยไม่คิด causal structure ก่อน ทั้ง PS และ PSS ต่างพึ่งพาคุณภาพของ covariate selection อย่างมาก ถ้าเลือกตัวแปรผิด score ก็พา analysis ผิดทิศได้เหมือนกัน

บทสรุป

ถ้าจะสรุปความต่างของสองวิธีนี้ในประโยคเดียว:

Propensity Score ทำให้คนสองกลุ่มมี “โอกาสได้รับ treatment” ใกล้กันPrognosis Summary Score ทำให้คนสองกลุ่มมี “ค่าที่ควรเป็นของ outcome” ใกล้กัน

PS จึงเหมาะกับคำถามแบบ treatment allocationPSS จึงเหมาะกับคำถามแบบ physiologic expectation

และนี่คือเหตุผลที่ในงานระบาดวิทยา เราไม่ควรถามแค่ว่า “จะ match ด้วย score อะไร”แต่ต้องถามก่อนว่า

เรากำลังพยายามทำให้คนสองกลุ่ม comparable ในเรื่องไหนกันแน่?

เมื่อคำถามชัด วิธีการจะชัดเอง

Key takeaways

Propensity Score คือ probability ของการได้รับ treatment/exposure จาก covariates และมัก fit จากข้อมูลทุกคน
PSS คือ predicted outcome ภายใต้สถานะ control และมัก fit จาก control only
PS ใช้เพื่อ balance treatment assignment; PSS ใช้เพื่อ balance expected normal outcome
PSS ไม่ได้ match ที่ observed Y แต่ match ที่ predicted healthy Y
การเลือกใช้ score ควรยึดตาม causal question และ clinical meaning ของ study ไม่ใช่เลือกเพราะคุ้นมือ