Google search engine
Google search engine

Bài 1: Chuẩn hay bình thường ?

LGT: Việc ứng dụng suy luận thống kêcùng với xử lý số liệu và thiết kế thực nghiệm,ngày nay được coi là một tiêu chí bắt buộc và đương nhiên phải có trong các nghiên cứu khoa học nói chung và tim mạch học nói riêng.

Nguyễn Anh Vũ

 Đại học Y Dược TPHCM

Trong thời đạicủakhoa học số liệunhư hiện nay, với điều kiện mọi thứ đều được “vi tính hóa”, bác sĩ nào cũng muốn áp dụng algorithm chạy máy tính luôn cho nhanh, nhưngkhoa học luôn đòi hỏi “thực lực”của nghiên cứu viên và “thực chứng” dựa trên những nền tảng kiến thức được kế thừa và chắt lọc. Vì vậy, việc nắm được cơ chế suy luận thống kê và ý nghĩa củacác phép toán dùng trongnghiên cứu của mình, điều cần thiết mà chúng ta sẽ cùng tìm hiểu và trao đổi…

Bắt đầu từ kỳ T03 năm 2017, Chuyên đề Tim Mạch học mở thêm Chuyên mục “THỐNG KÊ ỨNG DỤNG TRONG NGHIÊN CỨU TIM MẠCH HỌC”, do TS. Nguyễn Anh Vũ (Trưởng Bộ môn Toán, Đại học Y Dược TP.Hồ Chí Minh) phụ trách. Đây là chuyên mục mới, nên rất cần các ý kiến đóng góp xây dựng, để đáp ứng nhu cầu của bạn đọc ngày càng thiết thực hơn…

Trân trọng giới thiệu cùng bạn đọc.    

Bài 1: CHUẨN HAY BÌNH THƯỜNG?

Tóm tắt: Bài viết đề cập đến một trong những phân phối quan trọng nhất thường được dùng trong suy luận thống kê thông qua diễn giải ý nghĩa, nguồn gốc tên gọi, mô hình và ứng dụng trong cơ sở xây dựng khoảng trị số tham chiếu, một công cụ phổ biến của y học chẩn đoán.

Từ khóa: khoảng giá trị tham chiếu, phân phối Gauss, chuẩn, bình thường.

Normal: từ gốc tiếng Latin, danh từ norma là cây thước vuông của thợ mộc, tính từ normalis nghĩa đen là “vuông góc”, từ thế kỷ 15 được dùng theo nghĩa “trong trạng thái bình thường,điều kiện bình thường”, đến thế kỷ 19 được mở rộng sang nghĩa “thuộc về tiêu chuẩn, hình mẫu”.

Standard: từ gốc tiếng Pháp cổ, danh từ estandart là cây cờ lệnh, hay vật làm tiêu để tập họp quân đội. Từ thế kỷ 15, dùng theo nghĩa “mẫu mực được công nhận cho chất lượng hoặc sự đúng đắn”, sang thế kỷ 16 được dùng với nghĩa “luật, nguyên tắc phương tiện để quyết định”, đến thế kỷ 18 là “một mức độ nhất định được đạt đến”.(Trích, lược dịch:Từ ngữ toán học, Steven Schwartzman [11]; Từ điển Từ nguyên học Anh ngữ hiện đại, Ernest Weekley [12])

Trong quá trình chẩn đoán,điều trị và quản lý bệnh nhân, các số đo tiêu chuẩn sinh lý sinh hóa được sử dụng dưới dạng ngưỡng tham chiếu hoặc khoảng giá trị tham chiếu. Ví dụ, nhiệt độ bình thường là khoảng 37oC và nồng độ glucose máu lúc đói 4,4 – 6,1 mmol/L. Khi được khám bệnh, tình trạng của bệnh nhân được đánh giá qua so sánh các số đo của bệnh nhân với khoảng tham chiếu. Đánh giá sẽ có ý nghĩa hơn và ít mạo hiểm hơn khi khoảng giá trị làm chuẩn được thiết lập trên nền tảng các nguyên lý của khoa học đo lường. Về bản chất, đó là luật phân phối xác suất của các số đo [3].

Đối với người bình thường khỏe mạnh, nhiều số đo như nồng độ cholesterol, đường huyết, sắt huyết thanh, có chiều hướng phân phối khá đều đặn. Các tần số cao thường thấy ở các giá trị trung tâm và nhanh chóng hạ thấp về hai phía. Đường cong hình chuông (bell-shaped curve) rất quen thuộc trong suy luận thống kê cũng như trong khoa học đo lường, phân phối của sai số ngẫu nhiên cũng có dáng điệu như thế [3].

Một chức năng quan trọng của hệ tim mạch là thực hiện trao đổi nhiệt giữa nội tạng với da, ổn định thân nhiệt theo cơ chế đối lưu nhiệt qua dòng chảy của máu [1,2]. Thân nhiệt bình thường, được Karl Reinhold August Wunderlich (1815-1877) xác định sau khi đo nhiệt độ khoang miệng cho hàng ngàn người, có số đo trung bình là 37oC và cao nhất là 38oC [13,14]. Năm 1992, Mackowiak, Wasserman và Levine [5,6,7] chỉ ra rằng nhiệt độ cơ thể thay đối trong ngày, theo phân phối tần suất hình chuông với trung bình 36,8oC và mức biến động trung bình 0,5oC. Phân phối này (normal distribution) được gọi là phân phối chuẩn hay bình thường, cũng được gọi là phân phối Gauss [4].

Về mặt thực hành, nếu gọi là phân phối bình thường thì cũng có lý, vì cần phải dựa vào nó để chỉ ra các giá trị số đo thường thấy ở đa số các đối tượng bình thường. Hơn nữa, rất nhiều đại lượng ngẫu nhiên gặp phải trong thực hành đều tuân theo phân phối này, vì hay gặp quá nên coi là bình thường thôi. Còn gọi là phân phối chuẩn cũng có lý, vì cần dựa vào phân phối đó mà tính ra khoảng giá trị tham chiếu làm chuẩn để so sánh các số đo.

Về mặt toán học giữa các phân phối hay gặp trong thực hành, luật phân phối chuẩn chiếm vị trí trung tâm. Karl Frederic Gauss (1777-1855) sử dụng luật phân phối này như mô hình khái quát cho sai số thực nghiệm và thu được nhiều kết quả, theo luật danh định Merton-Stigler thì phân phối được mang tên ông. Ông cũng dùng từ “normal” với nghĩa vuông góc chứ không phải với nghĩa bình thường hay chuẩn tắc. Đến năm 1920, Karl Pearson (1857-1936) mới đặt tên phân phối là “normal distribution”. Ông cũng lưu ý rằng tên gọi mới này có chútbất lợi khi nó gợi lên ý nghĩ là tất cả các phân phối khác đều không được…bình thường (abnormal) [5].

Trở lại với thực nghiệm, bình thường được hiểu theo nhiều nghĩa, tùy theo mỗi ngữ cảnh. Mắt kém khi tuổi già là bình thường, rụng tóc do xạ trị điều trị ung thư cũng là bình thường. Bình thường ở đây không phải là tiêu chuẩn hay hình mẫu mà là mức độ tốt nhất có thể đạt được. Theo đó, số đo bình thường là các số đo thường thấy ở những người khỏe mạnh.

Một mặt, mỗi người là một cá thể có số đo bình thường riêng cho người đó. Số đo này được xác định nhờ theo dõi trong thời gian dài, có thể làm chuẩn tuy rằng chuẩn vẫn có thể biến động. Nếu một người nữ có huyết áp bình thường là 110/70 mmHg thì 130/80 mmHg là tăng huyết áp rõ rệt. Nhưngtrongtrường hợp người này đang mang thai thì huyết áp như vậy(130/80)lại là bình thường.

Mặt khác, số đo chuẩn của một người mới đến khám lần đầu là không biết được. Khi đó bác sĩ đánh giá tình trạng bệnh theo số đo chuẩn của dân số, nghĩa là số đo thường thấy trong cả quần thể dân số. Khi sự biến động giữa cá thể là lớn thì một giá trị làm chuẩn không đủ, cần một khoảng các giá trị chuẩn để tham chiếu [3]. Với phân phối Gauss, giá trị bình thường nằm trong khoảng 2 lần độ lệch chuẩn so với trung bình. Như vậy khoảng tham chiếu chứa khoảng 95% các giá trị thường thấy, loại trừ các giá trị hiếm thấy gồm 2,5% quá lớn và 2,5% quá nhỏ. Với phân phối khác, khoảng giá trị nằm giữa các điểm phân vị 2,5% và 97,5%. [9]

Trên cấp độ dân số, luôn có sự trùng lặp giá trị giữa những đối tượng bình thường và bất thường. Như vậy, có những người bình thường có số đo nằm ngoài khoảng tham chiếu. Các giá trị này được coi là bất thường theo nghĩa hiếm thấy ở những đối tượng khỏe mạnh. Trong những trường hợp này đánh giá đơn thuần dựa vào khoảng tham chiếu sẽ mắc sai lầm. Tiếp cận thống kê chỉ rõ và định lượng khả năng sai lầm, trong khi các cách tiếp cận khác rất khó nhận biết được.

Vậy cơ chế sinh ra các số đo có thể được giải thích như thế nào? Vì sao luật phân phối Gauss lại phổ biến như vậy? Cách giải thích được chấp nhận rộng rãi nhất dựa vào một kết quả toán học mang tên “Định lý giới hạn trung tâm” [8], do Alexander Michailovich Liapunov (1857-1918) chứng minh đầu tiên vào năm 1901, được tu chỉnh và mở rộng bới Jarl Waldemar Lindeberg (1876-1932) vào năm 1922 và Sergei Natanovich Berstein (1880-1965) vào năm 1964.

Ý nghĩa của kết quả đó là: “Khi một lượng ngẫu nhiên là kết quả việc cộng rất nhiều lượng ngẫu nhiên độc lập và rất nhỏ khác, thì luật phân phối của lượng ngẫu nhiên ấy về thực nghiệm được coi là phân phối Gauss” [9]. Vì lượng ngẫu nhiên luôn được sinh ra bởi vô số các nguyên nhân, không nguyên nhân nào chiếm ưu thế so với các nguyên nhân còn lại, nên có nhiều lượng ngẫu nhiên thường gặp trong thực hành tuân theo phân phối Gauss.

Như vậy, mô hình phân phối Gauss như sau:

Tài liệu tham khảo

[1] Bernard S.A., Gray T.W. et al. (2002),“Treatment of comatose survivors of out-of-hospital cardiac arrest with induced hypothermia”, New England Journal of Medicine,  346(8): 557-563.
[2] Gonzales-Alonso J. (2012) “Human thermoregulation and the cardiovascular system”, Experimental Phisiology 97(3):340–346.
[3] Indrayan A. (2013), Medical Biostatistics, Chapman & Hall, Boca Raton- London- New Ỷork.
[4] Kelly G. (2006), “Body temperature variability”, Alternative Medicine Review, 11(4): 278-293.
[5] Le Cam L. (1986), “The Central Limit Theorem around 1935”, Statistical Science 1(1) : 78-91.
[6] Mackowiak P.A, Worden G. (1994), “Carl Reinhold August Wunderlich and the evolution of clinical thermometry”, Clinical Infectious diseases, 18(3): 458-467.
[7] Mackowiak P.A, Wasserman S.S, Levine M.M. (1992), “Temperature, and other legacies of Carl Reinhold August Wunderlich”, JAMA, 268(12): 1578-1580.
[8] Mackowiak, P. A., Wasserman, S. S., and Levine, M. M. (1992), “A Critical Appraisal of 98.6 Degrees F, the Upper Limit of the Normal Body Temperature, and Other Legacies of Carl Reinhold August Wunderlich,”Journal of the American Medical Association, 268, 1578-1580.
[9] Pugachev V.S. (1965), Theory of random functions and its application to control problems, Pergamon Press, Poland.
[10] Pugachev V.S. (1984), Probability Theory and Mathematical Statistics for Engineers, Pergamon Press,  Poland.
[11] Shoemaker A.L. (1996), “Whats normal? Temperaturre, gender and heart rate”. Journal of Statistics Education, Vol 4, No 2.
[12] Schwartzman S. (1994), The words of mathematics: An etymological dictionary of mathematical terms used in English, American Mathematics Society, USA.
[13] Weekley E.(1921), An etymological dictionary of modern English, John Murray-Albermale Street, London.
[14] Wunderlich K.R.A. (1869), “The course of temperaturein disease: a guide to clinical thermometry”, American Journal of Medical Sciences, 57, 425-447.
[15] Wunderlich K.R.A. (1871), On the temperature in diseases: a manual of medical thermometry, Finsbury, London.

BÀI VIẾT LIÊN QUAN
XEM THÊM

DANH MỤC

THÔNG BÁO