thongke y-sinh hoc_bài 1 một số kiến thức toán cơ bản

29
THỐNG KÊ SINH HỌC Mt skiến thức toán học cơ bản 1 BÀI GIẢNG THỐNG KÊ SINH HỌC nguyên bn tiếng Anh : Nguyễn Văn Tuấn THAY LI NÓI ĐU Hơn một thế ktrước, nhà toán học Pháp Pierre Louis đã xây dựng và cổ vũ "phương pháp số" dùng để thẩm định việc điều trị. Tuy nhiên, ông đã bị hu hết các thầy thuốc hàng đầu lúc bấy giphản đối. Đáng tranh cãi là Claude Bernard, cha đẻ ca y học thưc nghiệm hiện đại đã phê phán việc áp dụng toán học vào y học; ông tuyên bố: các nhà toán học cào bằng quá nhiều và suy lun vcác hiện tượng như họ vra trong đầu chkhông như chúng tồn ti trong tnhiên. Ông không ngừng kêu gọi các thầy thuc "tkhước việc dùng thống kê làm cơ sở cho khoa hc thc nghim vđiều trvà bệnh lí.” Trớ trêu thay, gần 100 năm sau, các học trò của ông đã vứt bhoàn toàn lời khuyên của ông. Thống kê đã trở nên một phn thiết yếu trong nghiên cứu y học. Ngày nay hầu như mọi công bố y học đều có phần "phương pháp thống kê" để chng ttính đáng tin cậy của công trình. Tuy nhiên, trong những năm gần đây, việc sdng phbiến thống kê đã trở thành việc lm dng phbiến thống kê. Y văn bị nhét đầy với thông tin thống kê bbn và với những phát hiện mâu thuẫn không dứt. Có nhiều bng chứng hùng hồn cho thy rng vic sdụng không phù hợp và thao tác chưa thuần thc vcác số liu thống kê đã góp phần đáng kể vào bi kịch vsnhm lẫn này của tri thc. Nhiều người viết sách và các bài báo dựa trên ứng dụng không phù hp ca thống kê. Một stác giả rất được nhiều người biết đến vì họ chng ngại ngùng tung ra các lời giải cho các vấn đề chưa được gii quyết. Tuy nhiên, một snhà điều tra không nhận ra rng hđã phạm các lỗi lm trong thống kê hoặc do dốt nát hoặc do thiếu kiến thc thống kê. Dù với lí do gì, dựa vào phân tích thống kê khi không hiểu bn cht của nó là bước đầu tiên trong việc đánh mất tính trung thực trí tuệ. Vì vậy, hiu biết nguyên tắc đứng phía sau một phân tích thống kê là rất quan yếu trong vic giải thích dữ liu. Mười mt chđề thống kê sinh học sau đây tiêu biểu cho mt tp hợp các nguyên lí thống kê, định lí, tiên đề và định nghĩa sơ đẳng được trình bày dưới dng gần như phi kĩ thuật. Các chủ đề được chia thành hai phần: phn một bàn về xác suất và các khái niệm thống kê; phần hai bàn

Upload: hau-pham

Post on 28-Jan-2018

227 views

Category:

Health & Medicine


3 download

TRANSCRIPT

Page 1: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

1

BÀI GIẢNG THỐNG KÊ SINH HỌC

nguyên bản tiếng Anh: Nguyễn Văn Tuấn

THAY LỜI NÓI ĐẦU

Hơn một thế kỉ trước, nhà toán học Pháp Pierre Louis đã xây dựng và cổ vũ "phương pháp số"

dùng để thẩm định việc điều trị. Tuy nhiên, ông đã bị hầu hết các thầy thuốc hàng đầu lúc bấy

giờ phản đối. Đáng tranh cãi là Claude Bernard, cha đẻ của y học thưc nghiệm hiện đại đã phê

phán việc áp dụng toán học vào y học; ông tuyên bố: các nhà toán học cào bằng quá nhiều và

suy luận về các hiện tượng như họ vẽ ra trong đầu chứ không như chúng tồn tại trong tự nhiên.

Ông không ngừng kêu gọi các thầy thuốc "từ khước việc dùng thống kê làm cơ sở cho khoa học

thực nghiệm về điều trị và bệnh lí.” Trớ trêu thay, gần 100 năm sau, các học trò của ông đã vứt

bỏ hoàn toàn lời khuyên của ông. Thống kê đã trở nên một phần thiết yếu trong nghiên cứu y

học. Ngày nay hầu như mọi công bố y học đều có phần "phương pháp thống kê" để chứng tỏ

tính đáng tin cậy của công trình.

Tuy nhiên, trong những năm gần đây, việc sử dụng phổ biến thống kê đã trở thành việc lạm

dụng phổ biến thống kê. Y văn bị nhét đầy với thông tin thống kê bề bộn và với những phát hiện

mâu thuẫn không dứt. Có nhiều bằng chứng hùng hồn cho thấy rằng việc sử dụng không phù

hợp và thao tác chưa thuần thục về các số liệu thống kê đã góp phần đáng kể vào bi kịch về sự

nhầm lẫn này của tri thức. Nhiều người viết sách và các bài báo dựa trên ứng dụng không phù

hợp của thống kê. Một số tác giả rất được nhiều người biết đến vì họ chẳng ngại ngùng tung ra

các lời giải cho các vấn đề chưa được giải quyết. Tuy nhiên, một số nhà điều tra không nhận ra

rằng họ đã phạm các lỗi lầm trong thống kê hoặc do dốt nát hoặc do thiếu kiến thức thống kê.

Dù với lí do gì, dựa vào phân tích thống kê khi không hiểu bản chất của nó là bước đầu tiên

trong việc đánh mất tính trung thực trí tuệ. Vì vậy, hiểu biết nguyên tắc đứng phía sau một phân

tích thống kê là rất quan yếu trong việc giải thích dữ liệu.

Mười một chủ đề thống kê sinh học sau đây tiêu biểu cho một tập hợp các nguyên lí thống kê,

định lí, tiên đề và định nghĩa sơ đẳng được trình bày dưới dạng gần như phi kĩ thuật. Các chủ đề

được chia thành hai phần: phần một bàn về xác suất và các khái niệm thống kê; phần hai bàn

Page 2: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

2

về thống kê ứng dụng, trong đó sẽ thảo luận về phân tích thống kê dữ liệu và các kết luận. Do

đối tượng dự kiến của khóa học này là những người nghiên cứu với ít hoặc không có kiến thức

thống kê, do đó, tất cả các phát biểu thống kê trong các bài học này được trình bày không có

chứng minh toán học kèm theo.

Bất kì việc học tập nào cũng sẽ không đầy đủ nếu không có một sự tiêu hóa nào đó các nguyên

lí bộ môn. Để minh họa cho ý tưởng và nguyên lí đằng sau mỗi chủ đề, tôi cũng có trình bày một

bộ sưu tập các bài tập và các bài toán để giải hay thảo luận. Một số câu hỏi có thể được xếp loại

như là "bài tập" nhằm mục đích minh họa nguyên tắc cơ bản; các câu hỏi khác có thể được xếp

loại như là "bài toán" mà thông thường sẽ đòi hỏi nhiều kĩ năng hơn để giải quyết chúng. Hầu

hết những câu hỏi này đã được trích ra từ các tạp chí y học và kinh nghiệm của cuộc sống thực.

Nếu bạn không thể giải được một câu hỏi, đừng tuyệt vọng. Phương pháp giảng dạy của

Socrate không nhằm vào việc luyện tập để người ta đưa ra nhanh chóng những câu trả lời,

nhưng để giáo dục qua các câu hỏi. Nếu đã nỗ lực nhiều lần nhưng không thành công, bạn có

thể liên hệ với tôi và chúng ta hi vọng sẽ có cách xử lí nó. Hãy nhớ rằng các lời giải cho bất kì

bài toán có giá trị nào hiếm khi đến với chúng ta một cách dễ dàng mà không cần sự làm việc

chăm chỉ, đó phải là kết quả của nỗ lực trí tuệ trong nhiều ngày, nhiều tuần, hoặc nhiều tháng,

thậm chí nhiều năm. Vâng, không có câu hỏi nào trong khóa học này đòi hỏi bạn mất nhiều năm

hay nhiều tháng để giải, nhưng có thể phải mất nhiều giờ để giải ra.

Sự xuất hiện của máy tính điện tử chắc chắn đã cách mạng hóa việc thực hành thống kê . Máy

tính đã thay thế bút chì để giải các phương trình phức tạp khi phân tích dữ liệu. Tuy nhiên, thống

kê không chỉ là một tập hợp các định lí hoặc công thức, nó là một phong cách tư duy. Máy tính

cũng là một phong cách tư duy. Vì vậy, tôi không tin rằng số liệu thống kê có thể được rút gọn

thành một cái nhấn nút trên máy tính mà vẫn giữ được phong cách suy nghĩ, mặc dù có những

người tuyên bố đã làm như vậy. Với niềm tin này trong đầu, hầu hết các bài tập trong khóa học

này có dụng ý để giải bằng tay với sự trợ giúp của một máy tính hoặc một phần mềm bảng tính

(spreadsheet) nói chung − không phải bởi một phần mềm thống kê. Tôi luôn luôn tin rằng trong

làm bài tập, một lời giải bằng tay sẽ thú vị hơn và trọn vẹn hơn một lời giải "tự động".

Các bài giảng này là kết quả từ nỗ lực của một người thiếu kinh nghiệm. Nó khó có thể hoàn

hảo và còn rất nhiều vấn đề bỏ ngõ. Hơn nữa, tài liệu này đã được viết trong một thời gian rất

ngắn và do đó sai sót là không thể tránh khỏi. Nếu bạn tìm thấy xin vui lòng cho tôi biết để chỉnh

lại cho đúng.

Chúc may mắn.

Page 3: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

3

THỐNG KÊ SINH HỌC

Chủ đề 1: MỘT SỐ KIẾN THỨC TOÁN HỌC CƠ BẢN

Ngay cả một người chậm trí mà được đào tạo và luyện tập

trong số học, nếu anh ta không thu được cái gì khác từ nó,

ít ra cũng hoàn thiện và trở nên sắc nét hơn trước.

Plato

Nhà thông thái Bertrand Russell gần đây đã viết trong một cuốn sách của ông: "có một lối đi dẫn

qua các cánh đồng ở New Southgate, và tôi thường đi đến đó một mình đề ngắm hoàng hôn và

dự định tự tử. Tuy nhiên tôi không tự tử bởi vì tôi muốn tìm hiểu thêm về toán học”. Tôi chắc

chắn hầu hết chúng ta sẽ không phủ nhận sức mạnh của toán học, nhưng có thể có nhiều hơn

một người trong chúng ta đã không ưa môn học này. Nếu chúng ta suy nghĩ nghiêm túc về toán

học, chúng ta thấy rằng nó là cơ sở cho tất cả mọi thứ mà chúng ta làm hiện nay. Không ngạc

nhiên rằng toán học được coi là hoàng tử của khoa học. Một trong những đồng nghiệp của tôi ở

viện Garvan mô tả ý tưởng toán học như là “chân lí vĩnh cửu ". Tôi thích cách mô tả đó. Trong

hầu hết các khoa học, đặc biệt là khoa sinh học, tốc độ các "khám phá" làm ta chóng mặt; rủi

thay, những cái gọi là khám phá thường phá đổ những ý tưởng mà người khác đã cố xây dựng

nên. Thậm chí tệ hơn, cái người này thiết lập lại bị người khác dỡ bỏ đi. Riêng trong toán học

mỗi thế hệ lại thêm một câu chuyện mới vào cấu trúc cũ (thường trực), bởi vì đơn giản ý tưởng là

vô tận.

Thống kê thường được định nghĩa như là một ngành của toán học ứng dụng, tới lượt mình nó lại

là một ngành hiện đại của của toán học hiện đại. Trong thực hành, toán học hiện đại là một

trong những công cụ chủ yếu của thống kê. Vì vậy, để hiểu thống kê, có được một số kiến thức

về toán học sơ đẳng là một điều bắt buộc. Trong chủ đề này, chúng ta sẽ khảo sát một số ý

tưởng cơ bản của toán học hiện đại như các khái niệm về hàm số, phương trình, các phép toán

lấy tổng, v.v… trước khi đi vào các cuộc thảo luận thống kê.

Page 4: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

4

0. BẢNG CHỮ HI LẠP THÔNG DỤNG VÀ CÁC KÍ HIỆU TOÁN

A. CÁC CHỮ CÁI HI LẠP THÔNG DỤNG

Trong thống kê, gần như quy ước người ta kí hiệu các tham số của một quần thể (dân số) bằng

chữ cái Hi Lạp và các tham số tương ứng bằng chữ cái Latin, Chữ cái Latin mọi người đều quen

thuộc trong khi chữ cái Hi Lạp có lẽ cần phải ôn lại. Bảng sau đây liệt kê các chữ cái Hi Lạp

thông dụng nhất mà ta sẽ dùng hoặc gặp trong các bài học sau này.

CHỮ IN CHỮ THƯỜNG CÁCH ĐỌC

Α α alpha

Β β beta

Γ γ gamma

Δ δ delta

Ε ε epsilon

Θ θ theta

Κ κ kappa

Λ λ lambda

Μ μ mu(y)

Ν ν nu(y)

Π π pi

Ρ ρ rho

ς sigma

Σ τ tau

Φ φ phi

Χ χ chi

Ω ω omega

B. CÁC KÍ HIỆU TOÁN THÔNG DỤNG

Và tất nhiên, việc học toán không thể hoàn thành nếu không thể giao tiếp bằng ngôn ngữ toán

học. Đây là một số trong những kí hiệu thường được sử dụng trong toán học đòi hỏi bạn phải

thông thạo:

Page 5: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

5

KÍ HIỆU Ý NGHĨA

─────────────────────────────────────────────────

∈ thuộc về

∉ không thuộc về

⇒ bao hàm / suy ra rằng

⇐ được suy ra từ

⇔ tương đương với / nếu và chỉ nếu

N số tự nhiên

Z số nguyên

Q số hữu tỉ

R số thực

[a, b] khoảng đóng a, b (tập hợp các số x ∈ R: a ≤ x ≤ b)

(a, b) khoảng mở a, b (tập hợp các số x ∈ R: a < x < b)

[a,b) khoảng nửa mở (đóng) a, b (tập hợp các số x ∈ R: a ≤ x < b)

(a,b] khoảng nửa đóng(mở) a, b (tập hợp các số x ∈ R: a < x ≤ b)

∀ với mọi

∃ tồn tại

I. KÍ HIỆU TỔNG Σ

Nhiều tính toán thống kê dính dáng tới kí hiệu này. Trước khi đi vào thống kê chúng ta cần quen

thuộc với kí hiệu sigma , đây là một cách viết tắt của tổng.

Ví dụ, thay vì viết x1 + x2 + x3 + x4 + x5 ta viết

(đọc là tổng của x chỉ số i, với i chạy từ 1 đến 5).

Hay

5

Tương tự, chúng ta cũng có thể viết

Page 6: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

6

Lưu ý rằng

vì chúng đều là cách viết tắt của tổng tức

là tên gọi của chỉ số là không quan trọng.

Ngoài ra trong trường hợp không có nhầm lẫn về các giá trị đầu và cuối của chỉ số, thay vì viết

đầy đủ ta có thể viết ngắn gọn là hay đơn giản hơn là .

Dễ dàng suy ra các đẳng thức sau đây:

Ví dụ: cho cấp số nhân xi = aq i , i = 0, 1, 2, 3, ..... Ta đã biết: tổng của n số hạng đầu tiên của cấp

số này có công thức là:

Giả sử |q| < 1, khi n → ∞ thì qn+1 → , do đó →

, từ đó khá hợp lí khi nói rằng tổng vô

hạn các số hạng của cấp số nhân này là

và ta viết:

Tổng quát, người ta cũng đã mở rộng kí hiệu cho tổng vô hạn các số hạng khi tổng này “tính

được” như trong ví dụ trên:

Ví dụ: Ta có:

Page 7: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

7

Hiển nhiên nhiều biểu thức cũng có thể viết đơn giản hơn bằng kí hiệu này. Một số đẳng thức

thú vị khác sẽ được đưa vào phần bài tập để các bạn tự làm.

II. KÍ HIỆU TÍCH Π

2.1. KÍ HIỆU GIAI THỪA

Giả sử chúng ta có n vật, người ta có thể chứng mình rằng số các cách sắp xếp (hoán vị) n vật

này trên một đường thẳng là n! (đọc là n giai thừa), kí hiệu này được định nghĩa như sau:

n! = n(n – 1)(n – 2)(n – 3). ... .3.2.1

Để tiện trình bày các kết quả tổng quát người ta cũng quy ước thêm: 0! = 1! =1.

Ví dụ: 3! = 3 × 2 × 1 = 6

5! = 1× 2 ×3 ×4 × 5 = 120

Như chúng ta có thể thấy, với n lớn thì n! sẽ hết sức lớn và có thể không tính nổi bằng các máy

tính cầm tay, lúc đó ta có thể dùng công thức tính xấp xỉ sau đây:

Trong đó e .7 8 8…là cơ số của logarit tự nhiên và π 3. 4 58… Công thức này được gọi là

công thức xấp xỉ Stirling.

2.2. KÍ HIỆU TÍCH Π

Kí hiệu này được định nghĩa như sau:

Theo đó:

Page 8: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

8

Cũng có thể chứng minh được:

Với kí hiệu tích ta có thể viết lại định nghĩa giai thừa trên đây như sau:

hay cũng có thể viết cách khác là

hoặc đơn giản hơn là

.

Việc kiểm chứng các đẳng thức này hoặc viết lại dưới dạng khác hơn nữa xem như bài tập nhỏ

dành cho các bạn.

Người ta cũng mở rộng kí hiệu này cho tích vô hạn các thừa số như ở kí hiệu tổng miễn là tích

đó “tính được”:

III. HỆ THỐNG SỐ THỰC

Trong phần này, chúng ta sẽ ôn lại ngắn gọn cấu trúc của hệ thống số thực.

3.1. Số tự nhiên:

Các số 1, 2, 3, và cứ thế tiếp tục được gọi là số tự nhiên.1]

Tập hợp các số tự nhiên được kí hiệu là N.

N { 3 n ... }

1 Để thuận tiện, nhiều tác giả coi tập số tự nhiên N có chứa cả số 0.

Page 9: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

9

Nếu chúng ta cộng hoặc nhân hai số tự nhiên bất kì, kết quả luôn luôn là một số tự nhiên. Tuy

nhiên, nếu chúng ta trừ hoặc chia hai số tự nhiên, kết quả không luôn luôn là một số tự nhiên.

Chẳng hạn, 8 − 5 = 3 và 8 ÷ 2 = 4 là số tự nhiên, nhưng 5 − 8 = −3 và 2 ÷ 7 không cho kết quả

trong số tự nhiên.

Như vậy, trong hệ thống số tự nhiên, chúng ta có thể cộng và nhân, nhưng không phải luôn luôn

có thể trừ hoặc chia.

3.2. Số nguyên:

Để khắc phục những hạn chế trong phép trừ, chúng ta mở rộng hệ thống số tự nhiên ra thành

hệ thống các số nguyên bằng cách lấy hết tất cả các số tự nhiên rồi thêm vào các số đối của

chúng (số âm) và số không (0).

Tập hợp các số nguyên được kí hiệu là Z .

Z = { ... 3, 2, 3 }

3.3. Số hữu tỉ:

Nhưng chúng ta vẫn không thể luôn luôn chia được hai số nguyên bất kì.

Chẳng hạn, 8 ÷ (−2) = −4 là một số nguyên, nhưng 8 ÷ 3 không phải là một số nguyên.

Để khắc phục vấn đề này, chúng ta mở rộng hệ thống số nguyên thành hệ thống số hữu tỉ.

Chúng ta định nghĩa một số là hữu tỉ nếu nó có thể biểu diễn được như là một tỉ số của hai số

nguyên.

Tập hợp các số hữu tỉ được kí hiệu là Q.

Q { m/n | ∀ m n ∊ Z & n ≠ }

Theo đó, tất cả bốn phép tính số học cơ bản (cộng, trừ, nhân và chia) đều có thể thực hiện được

trong Q.

3.4. Số vô tỉ:

Trong sử dụng hàng ngày cũng tồn tại nhiều số không phải là số hữu tỉ; nghĩa là chúng không

thể biểu diễn được dưới dạng một tỉ số của hai số nguyên.

Ví dụ , 3, π, v.v... không là số hữu tỉ; những số như thế gọi là số vô tỉ.

Page 10: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

10

3.5. Số thực

Từ số thực được dùng để chỉ chung cho số hữu tỉ hoặc vô tỉ.

Tập hợp các số thực được kí hiệu là R.

Để có một định nghĩa đầy đủ của số thực sẽ phải liên quan đến việc giới thiệu một số ý tưởng

mới, và chúng ta không đi vào nhiệm vụ này ở đây. Tuy nhiên, có thể có được một ý niệm đúng

đắn về số thực bằng cách hiểu nó dưới dạng số thập phân. Bất kì số hữu tỉ nào cũng có thể

được biểu diễn dưới dạng thập phân, đơn giản bằng cách chia tử cho mẫu trong phép chia dài

(chia bằng tay). Có hai trường hợp xảy ra:

phần thập phân dừng lại hẳn ở một vị trí nào đó;

kể từ một vị trí nào đó phần thập phân phát triển theo hướng lập lại vô hạn một nhóm

chữ số theo một khuôn mẫu nào đó (được gọi là vô hạn tuần hoàn).

Ví dụ ¼ = 0.252 (dừng sau 2 chữ số thập phân) còn 1/6 = 0.161616... (lặp lại vô hạn cặp số 16

ngay từ chữ số thập phân đầu tiên).

Đối với trường hợp hai, trong thực hành tính toán, ta không thể làm việc với vô hạn chữ số của

phần thập phân mà phải chấp nhận tính toán với một số nhất định các chữ số sau dấu phẩy tuỳ

độ chính xác cho phép, tức là ta chỉ tính toán gần đúng mà thôi3.

Số vô tỉ cũng có thể biểu diễn với dạng thập phân4 nhưng phần thập phân không bao giờ dừng

lại và cũng không lập lại tuần hoàn như số hữu tỉ.5

3.6. Số phức:

Trong hệ thống số thực, phép lấy căn bậc hai chỉ có thể thực hiện cho các số không âm (dương

hay bằng 0). Mỗi số a > 0 có 2 căn bậc hai đối nhau và ta dùng kí hiệu để chỉ căn bậc hai

dương của a.

2 Thật ra có thể viết ¼ = 0.25000… hoặc 0,24999… (phần thập phân lập lại vô hạn theo khuôn mẫu là 0,0,0…hoặc

9,9,9,…) nhưng những trường hợp như thế này thường được xem là có khai triển thập phân hữu hạn (theo cách đầu). 3 Trong tính toán ta chỉ làm việc với tập các số hữu tỉ thập phân

∈ | ∈ { 9} ∈

mà thôi.

4 Việc biểu diễn số thập phân thường đòi hỏi phải có kiến thức toán học cao cấp nên ta sẽ không bàn ở đây. Một ví

dụ mịnh hoạ là ta có thể biểu diễn e dưới dạng thập phân bằng cách tính toán dựa vào công thức:

e =1/1! + 1/2! + 1/3! + ..... + 1/n! + …

5 Trong thực hành tính toán, ta chỉ sử dụng dạng thập phân gần đúng của số vô tỉ, ví dụ π ≈ 3.141592 tức vẫn chỉ

dùng số hữu tỉ, thật ra chỉ dùng số thập phân trong Q10 như đã nêu ở cước chú 3.

Page 11: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

11

Nếu chúng ta chỉ xem xét số thực thì căn bậc hai của một số âm không có nghĩa, chẳng hạn

hoặc

không tồn tại và chẳng có ý nghĩa gì trong hệ thống số thực. Tuy nhiên, những

con số này lại tồn tại trong hệ thống số phức (một hệ mở rộng của hệ thống số thực, kí hiệu là C)

mà chúng ta không xét tới ở đây.

IV. LUỸ THỪA NGUYÊN VÀ PHÉP TOÁN MŨ.

Nếu x, y là 2 số thực bất kì và m, n là 2 số nguyên bất kì thì các quan hệ sau đây là đúng:

(a) (b)

(c)

≠ (d)

(e) (f)

(g) /

Từ (g) ta suy ra: (h) /

và: (i) | |

Biểu thức (g) là một mở rộng của khái niệm luỹ thừa với số mũ nguyên sang số mũ hữu tỉ và từ

(g), người ta có thể tiếp tục mở rộng định nghĩa luỹ thừa sang số mũ thực để có phép toán mũ:

với x > 0 và r là một số thực bất kì.

Phép toán mũ có đủ tất cả các tính chất (a) – (g) ở trên với m, n bây giờ là số thực.

Khi chúng ta ở trong chủ đề này, có thể sẽ hữu ích khi lưu ý rằng có nhiều hơn một sự khác biệt

cơ bản giữa x² + y² và (x + y)² (hãy tự kiểm chứng lại điều này). Sự khác biệt đó sẽ được khai

thác về sau trong loạt bài này, tuy nhiên, một số đẳng thức về nhị thức có thể hữu ích ở đây:

(x ± y)² = x² ± 2xy + y²

x ± y ³ x³ ± 3x²y 3xy² ± y³

Loại khai triển này sẽ được bàn tới trong chủ đề xác suất.

Page 12: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

12

V. LOGARIT (LOGARITHM)

ĐỊNH NGHĨA:

Cho 0 < a ≠ x > và y là số thực, nếu x = ay , thì y được gọi là logarit cơ số a của x và ta viết

y = logax .

Như vậy: y= loga x ⇔ x a y nên phép lấy mũ cơ số a là phép toán ngược của phép toán

lấy loga nên còn được gọi là phép toán anti loga

* Dễ thấy từ định nghĩa logaa =1 và loga1 = 0.

Người ta thường kí hiệu logex là lnx (e = 2.71828… là cơ số của logarit tự nhiên hay logarit

Napier) và log10x là logx.

Một vài tính chất quan trọng của logarit như sau:

(a) logaxy = logax + logay

(b) loga(x/y) = logax logay

(c) loga xn = nlogax

(d) loga x = logbx / logba (quy tắc đổi cơ số)

VI. HÀM SỐ

6.1. HÀM SỐ TỔNG QUÁT:

Khái niệm hàm số là một trong những khái niệm cơ bản của toán học hiện đại.

Một hàm số diễn đạt giả thuyết về một đại lượng này phụ thuộc vào (xác định bởi) một đại lượng

khác.

I. Khối lượng xương phụ thuộc vào tuổi của chủ thể.

II. Chiều cao phụ thuộc vào chủng tộc …

Nếu một hàm f gán một giá tri y (duy nhất) cho một đối tượng x nào đó, ta viết:

y = f(x)

Trong toán học hình thức, ta gọi tập các giá trị có thể có được của x là miền xác định (domain)

và tập các giá trị có thể có được của y (thuộc về một tập nào đó) là miền giá trị (range). Trong

thống kê hiện đại, x được gọi là biến số “độc lập” và y là biến số “phụ thuộc”.

Page 13: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

13

Một hàm f có miền xác định A và (tập chứa) miền giá trị B cũng có thể diễn tả dưới dạng kí hiệu

như sau:

f : A → B x ↦ y

Ví dụ: f(x) = 3x² + 7x +2

với x = 3 ta có f( 3) = 3( 3)² + 7( 3) +2 = 50

Theo thói quen trong toán học, nhiều khi người ta chỉ cho một hàm số dưới dạng công thức.

Trong trường hợp này, chúng ta phải tự xác định miền xác định của hàm số, đó là tập hợp các

phần tử làm cho công thức có nghĩa.

Ví dụ, với hàm số , miền xác định không phải là toàn bộ tập số thực R mà chỉ là tập các

số x vì chúng ta không thể lấy căn của một số âm; với y = logax, giá trị của x phải lớn hơn 0 vì

với x ≤ y không xác định. Tương tự, đối với hàm số có dạng y = 1/x thì miền xác định phải là

tập các số thực x ≠ 0.

Trường hợp miền xác định của một hàm f là tập con của tích 2, 3, … , n tập hợp, ta có hàm với

2, 3, … , n biến số. Tương tự như trường hợp một biến, hàm nhiều biến y = f(x1, x2 xn) từ tập

tích A1×A2× ×An đến tập B có thể diễn tả bằng kí hiệu như sau:

f: A1×A2× ×An → B (x1, x2 xn ↦ y

Ví dụ, * y = f(u, v, t) = 1+ 2uvt – u + t2 là một hàm 3 biến

Ta có f(1, 2, 1) = 1 +2×1×2×( 1) – 1 + ( 1)2 = 3

* mật độ khoáng trong xương(BMD) là một hàm 2 biến (tuổi và trọng lượng):

BMD = a + b.Age + c.Weight

6.2. HÀM TUYẾN TÍNH

Một hàm tuyến tính có dạng:

y = a + bx [1]

trong đó a được gọi là tung độ gốc hay hệ số chắn (intercept) (khi x = 0 thì y = a) và b được gọi

là độ dốc hay hệ số góc (slope/gradient) (biểu thị mức độ thay đổi của y ứng với thay đổi 1 đơn

vị của x).

Page 14: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

14

Khi biểu diễn trong không gian 2 chiều x y (mặt phẳng toạ độ) thì đồ thị của hàm tuyến tính là

một đường thẳng.

Nếu 2 biến x và y thoả mãn [1] ta nói x và y có quan hệ tuyến tính.6

Cho 2 điểm bất kì (x1, y1) và (x2, y2) trên đồ thị của hàm tuyến tính (Hình 1A) thì độ dốc có thể

xác định bằng hệ thức sau đây:

Tuy nhiên trong thực nghiệm, việc đo đạc thường không cho ta các giá trị chính xác của x và y,

nhưng ta có thể đo được một loạt các giá trị gần đúng của x và y. Nếu các cặp số (x, y) thoả một

số điều kiện nhất định, chẳng hạn khi biểu diễn các cặp giá trị (x, y) đó trên một mặt phẳng toạ

độ, thấy chúng gần như thẳng hàng. Khi đó quan hệ của x và y có thể là một quan hệ tuyến tính

với các hệ số a và b chưa biết và với các giá trị (x, y) đo được ta có thể lập ra một hệ nhiều

phương trình, từ đó có thể dùng phương pháp bình phương nhỏ nhất (có trong nhiều phần mềm

thống kê) để ước tính a và b. Nếu không dùng các phần mềm thống kê, ta có thể tính b theo

công thức (xem như một mở rộng của công thức trên).

b [ xi )(yi ] / [ xi )2]

Nếu có 2 đường thẳng y = a1 + b1x và y = a2 + b2y, ta có một vài nhận xét sau:

a. Hai đường thẳng là song song khi và chỉ khi độ dốc của chúng bằng nhau, tức là b1 =b2.

b. Mặt khác, nếu b1 ≠ b2 thì hai đường thẳng không song song. Trong thống kê ta gọi hiện

tượng này là “sự tương tác” (interaction) (Hình 1C).

Hính 1 (A) hàm tuyến tính dạng y = a + bx (B) 2 đthẳng song song (C) “tương tác”

Hệ thức [1] có thể mở rộng hơn nữa bao gồm nhiều hơn một biến số như sau:

6 Hay một cách tương đương thoả phương trình: Ax +By +C = 0

Page 15: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

15

y= b0 + b1x1 +b2x2 bnxn [1’]

Phương trình tuyến tính [1’] xác định một siêu phẳng (n chiều) trong không gian n+1 chiều.

Ví dụ mật độ khoáng trong xương(BMD) phụ thuộc rất nặng vào tuổi và trọng lượng cơ thể,

chúng ta có thể viết mệnh đề về mối quan hệ này như sau:

BMD = a + b.Age + c.Weight

trong đó a, b, c là 3 hằng số đã được ước tính. Từ đó, với mỗi giá trị của Age và Weight, ta có thể

ước lượng BMD từ công thức trên.

Chúng ta sẽ khảo sát hàm số này trong bối cảnh phân tích hồi quy sau này trong loạt bài giảng

này.

6.3. HÀM BẬC HAI

Chúng ta thường gặp những trường hợp mà mối quan hệ hàm số giữa biến phụ thuộc (y) và các

biến độc lập (x) không tuyến tính mà có tính cong.

Một trong những hàm phổ biến là hàm bậc hai, có dạng:

y = f (x) = ax² + bx + c [2]

trong đó a, b và c là hằng số và a ≠ 0.

Khi y = 0 và 4 ta được: ±

Khi

thì hàm bậc hai đạt giá trị cực đại / cực tiểu

/ f

4

Ví dụ: quan hệ giữa BMD và tuổi (của các đối tượng già) là theo quan hệ bậc hai:

BMD = a (Age)² + b (Age) + c

6.4. BẤT ĐẲNG THỨC

Ta đã quen thuộc với các kí hiệu bất đẳng thức sau đây:

> và < "lớn hơn" và "bé hơn", tương ứng.

≥ và ≤ "lớn hơn hoặc bằng" và "bé hơn hoặc bằng", tương ứng.

Page 16: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

16

Mốt số tính chất của bất đẳng thức cần lưu ý:

Cho x, y là các số thực:

(i) Nếu y > x thì y ± a > x ± a ∀a ∈ R

(ii) Nếu y > x thì −y < x

(iii) Nếu y > x thì y/a > x/a và ay > ax ∀a > 0

và y/a < x/a và ay < ax ∀a < 0

(iv) Nếu y > x > 0 thì xn > yn ∀ n. ∈ N

Các tính chất (i) – (iv) vẫn còn đúng nếu thay > và < tương ứng bằng ≥ và ≤.

6.5. TUYẾN TÍNH HOÁ

Có lẽ là không cần thiết để nói rằng một hàm tuyến tính rất dễ giải thích hơn là một hàm không

tuyến tính (phi tuyến). Do đó, nhiều nỗ lực đã được thực hiện để biến đổi các hàm không tuyến

tính thành một hàm tuyến tính.

Ví dụ: nếu , chúng ta có thể sử dụng logarit để tuyến tính hoá nó như sau:

log . Biểu thức cuối cùng cho thấy logy rõ ràng là một hàm tuyến

tính đối với x.

Ở đây cần lưu ý rằng, chính thức có sự khác biệt giữa hàm tuyến tính và mô hình tuyến tính.

Ví dụ y = a + bx, y = a + bx + cx² v.v... đều là các mô hình tuyến tính nhưng hàm sau là hàm

không tuyến tính trong khi hàm đầu là một hàm tuyến tính. Chúng ta nói "tuyến tính" do các

tham số a, b, và c là tuyến tính. Tuy nhiên, y = a²x + b hoặc y = a bx đều là mô hình "phi tuyến"

và hàm phi tuyến bởi vì cả các tham số lẫn các đường cong đều không tuyến tính.

VII. HỆ PHƯƠNG TRÌNH TUYẾN TÍNH VÀ MA TRẬN

7.1. Ma trận:

7.1.1. Định nghĩa:

Ma trận m hàng n cột (thường được gọi là ma trận m×n) là bảng số có dạng:

Page 17: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

17

trong đó aij ∈ R i m và j n được gọi là các số hạng của ma trận.

Ma trận không là ma trận mà tất cả các số hạng đều bằng 0.

Khi m = n ta có ma trận vuông.

Một ma trận vuông có các số hạng không nằm trên đường chéo chính (đi từ a11, a22 đến ann)

đều bằng 0 gọi là ma trận chéo:

Một ma trận chéo có các số hạng trên đường chéo chính đều bằng 1 gọi là ma trận đơn vị và kí

hiệu là I, ví dụ ma trận đơn vị 3×3:

7.1.2. Phép toán trên ma trận:

- Phép cộng: cho 2 ma trận A = (aij) và B = (bij) có cùng kích thước (cùng số hàng và số

cột) ta định nghĩa: A + B = (aij+bji).

- Phép nhân với một số : tích của số thực α và ma trận A = (aij) đưọc định nghĩa là:

α A α×aij)

- Phép nhân: Cho ma trận A=(aij) có kích thước m×n và ma trận B=(bjk) có kích thước

n×p thí tích của A và B là ma trận C=(crq) có kích thước m×p trong đó

Tức là số hạng ở hàng r cột q của C là tổng của tích các số hạng ở hàng r của A tương

ứng với số hạng ở cột q của B. Ta kí hiệu

C =A×B (hay đơn giản là AB)

Ta chỉ nhân được A cho B khi số cột của A bằng số hàng của B, vì vậy nói chung B×A có

thể không tồn tại dù A×B tồn tại.

- Phép chuyển vị: ma trận chuyển vị của ma trận A = (aij) có kích thước m×n là ma trận

A’ = a’ji) có kích thước n×m với a’ji = aij.

7.1.3. Định thức của ma trận vuông:

Định thức của ma trận vuông A, kí hiệu là det(A) hay ||jA||, được định nghĩa như sau:

- Ma trận 2×2:

Page 18: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

18

- Ma trận 3×3:

= aei + bfg + cdh – afh – bdi – ceg

- Ma trận n×n:

với Aki là ma trận (n 1)×(n 1) có được bằng cách bỏ đi hàng k và cột i trong ma trận

gốc.

Ví dụ: Tìm định thức của ma trận:

3 3

Ta có thể dùng công thức cuối cùng, chẳng hạn với i = 2 (khai triển theo hàng 2):

de × × 3

× × 3

× 3 ×

= (−1)×(−1)×(−2) + 1×1×8 + (−1)×3×(−4) =−2 + 8 +12 = 18.

(Bạn đọc có thể kiểm tra lại kết quả bằng cách khai triển với giá trị i khác hoặc dùng công thức

cho ma trận 3×3).

7.2. Hệ phương trình tuyến tính:

7.2.1. Hệ phương trình tuyến tính theo 2 ẩn x và y là cặp phương trình có dạng:

trong đó a, b, c, d, e, f là những số đã biết và x, y là hai số chưa biết thoả cà 2 phương trình trên

mà ta cần tìm.

Khi ad – bc ≠ thì hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:7

x= (de – bf)/(ad – bc) và y=(af – ce)/(ad – bc)

Hệ trên cũng có thể viết lại dưới dạng ma trận là:

với

7 Dĩ nhiên cũng có thể giải bằng các phương pháp thông thường như thế, khử, so sánh như đã biết.

Page 19: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

19

Khi det(A) ≠ 0,(hay ad – bc ≠ , nghiệm của hệ cho bởi công thức Cramer như sau:

de i A l ma n c c b ng c ch hay c ong A b ng B

de i A l ma n c c b ng c ch hay c ong A b ng B

(Bạn đọc tự kiểm tra lại công thức Cramer dạng định thức và dạng thông thường là như nhau.)

7.2.2. Hệ phương trình tuyến tính n ẩn là n phương trình đồng thời:

a11x1 + a12x2 a1nxn = b1

a21x1 + a22x2 a2nxn = b2

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

an1x1 + an2x2 annxn = bn

với aij i j n là những số đã biết và xi (i n là các số chưa biết thoả cả n

phương trình trên mà ta cần tìm.

Tương tự như trường hợp 2 ẩn cũng có thể viết phương trình này dưới dạng ma trận như sau:

Khi det(A) ≠ 0, hệ có nghiệm duy nhất cho bởi công thức Cramer như sau:

i A l ma n c c b ng c ch hay c i ong A b ng B. 8

Ví dụ: Giải hệ phương trình sau:

3 3

Hệ này có thể viết dưới dạng ma trận như sau:

3 3

8 Cũng có thể giải trực tiếp bằng cách nhân cả 2 vế với ma trận nghịch đảo A-1 của A như cách giải

phương trình bậc nhất thông thường và được X , tuy nhiên việc tìm ma trận nghịch đảo hơi phức tạp nên

không trình bày ở đây.

Page 20: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

20

Ta có det(A) = 18, det(A1) = 4, det(A2) = 2 và det(A3) = 10 nên

x = 4/18 = 2/9, y = 2/18 = 1/9 và z = 10/18 = 5/9.9

VIII. ĐẠO HÀM VÀ TÍCH PHÂN

8.1. Đạo hàm:

8.1.1. Định nghĩa:

Cho hàm số y = f(x) liên tục trên một khoảng (a, b), x0 ∊ (a, b), nếu tỉ

có giới hạn là l

khi h→ thì l được gọi là đạo hàm của hàm số y = f(x) tại x0 và được kí hiệu là f’ x0) hay

lim

* Ý nghĩa hình học: Gọi M0 và M lần lượt là 2 điểm có hoành độ là x0 và x0+h trên đồ thị của hàm

y = f(x). Lưu ý rằng tỉ

là hệ số góc của cát tuyến M0M (xem hình 2). Khi h→ thì

M → M0 và cát tuyến M0M trở thành tiếp tuyến M0t của đồ thị. Do đó, tỉ

tiến đến hệ

số góc của cát tuyến M0t, tức là:

f’ x0) = hệ số số góc của tiếp tuyến M0t

Hình 2 : Đạo hàm bằng hệ số góc của tiếp tuyến

* y’ f’ x cũng là một hàm số và nếu f’ x có đạo hàm thì đạo hàm này đuợc gọi là đạo hàm

bậc hai của y= f(x) và được kí hiệu là y” f” x hay

..

Tương tự ta cũng có thể định nghĩa đạo hàm bậc n của y = f(x) và kí hiệu đạo hàm bậc n là

9 Hiện nay có nhiều phần mềm có thể giúp ta tính toán định thức tự động sau khi nhập các số hạng của

ma trận.

Page 21: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

21

8.1.2. Tính chất:

Cho f, g, h là các hàm số có đạo hàm, khi đó:

(i) f ± g ’ f’ ± g’

(ii) fg ’ f’g fg’

(iii) 1/f = f’/f2

(iv) (fn ’ n f’ fn 1

Nếu hàm số y = f(x) có đạo hàm trên khoảng (a, b) và x0 ∊ (a, b), khi đó:

− f(x) đạt giá trị cực đại tại x0 khi và chỉ khi f’ x0) = 0 và f’ x > 0 với x < x0 , f’ x < với x >

x0.

− f(x) đạt giá trị cực tiểu tại x0 khi và chỉ khi f’ x0) = 0 và f’ x < với x < x0 , f’ x > với x >

x0.

8.1.3. Đạo hàm một số hàm thông dụng:

(C ’ C l hằng số) (xn ’ nxn 1 ∀n ∊ Z

(ex ’ ex lnx ’ /x

sinx ’ cosx cosx ’ sinx

gx ’ / g2x) co gx ’ 1/(1+cotg2x)

8.1. 4. Đạo hàm hàm nhiều biến:

Định nghĩa:

Cho hàm y = f(x1, x2, xn) liên tục trên , và k là số nguyên sao cho

≤ k ≤ n. Khi giữ các biến xi cố định với i ≠ k lúc đó có thể xem y = f(x1, x2, xn) như một hàm

chỉ theo biến xk và nếu hàm này có đạo hàm theo xk thì đạo hàm này được gọi là đạo hàm riêng

của f theo xk và được kí hiệu là:

Page 22: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

22

Hàm y = f(x1, x2 xn) ược gọi là vi phân được (khả vi) khi nó có đạo hàm riêng theo tất cả các

biến xi.

Ví dụ: Cho y = f(u, v) = 2u – 3uv2 +5, ta có:

3

6

Tính chất:

Cho y = f(x1, x2, xn) khả vi, khi đó:

y = f(x1, x2, xn) đạt cực tiểu (cực đại) tại (x10, x20, xn0) nếu và chỉ nếu các đạo hàm riêng

đều bằng 0 và đổi dấu từ âm sang dương (từ dương sang âm) khi đi qua xko với k n.

8.2. Nguyên hàm và Tích phân:

8.2.1. Nguyên hàm:

Định nghĩa: Cho hàm y = F(x) và y = f(x) cùng xác định trên khoảng (a,b), nếu F có đạo hàm và

F’ x f x) thì hàm được gọi là nguyên hàm của hàm f.

Tính chất:

Hàm F và hàm G là đều là nguyên hàm của hàm f khi và chỉ khi tồn tại hằng số C sao cho

G(x) = F(x) + C.

Một nguyên hàm tổng quát (còn gọi là tích phân bất định) của hàm y = f(x) được kí hiệu là

.

Nguyên hàm của một số hàm thông dụng:

ln ln

Page 23: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

23

ln

8.2.2. Tích phân xác định:

Định nghĩa: Cho y=f(x) xác định trên khoảng [a, b] và các số thực thoả điều kiện a = x0 ≤ t1 ≤ x1

≤ < xi 1 ≤ i ≤ xi ≤ ≤ xn 1 ≤tn ≤xn=b. Đặt Sn là tổng sau đây (gọi là tổng tích phân)

×

Nếu Sn có giới hạn hữu hạn bằng L khi d max → và giới hạn này không phụ thuộc

vào cách lựa chọn các điểm xi, ti I n thì L đuợc gọi là tích phân xác định của hàm f

trên khoảng [a, b] và được kí hiệu là:

lim →

lim →

×

Khi đó ta nói f là tích phân đuợc (khả tích) trên [a, b].

Hình 3: Diện tích hình chữ nhật có tô màu bằng số hạng f(tk)×Δk trong Sn

Quy ước:

Ý nghĩa hình học: Khi f(x) 0 với mọi x trên [a, b] thì Sn chính là tổng diện tích các hình chữ

nhật có kích thước là Δk× f(tk) (k=1, 2, ,n). Để ý rằng các hình chữ nhật này có diện tích xấp

xỉ diện tích hình thang cong bên dưới đồ thị giới hạn bởi trục Ox và 2 đường thẳng x =xk 1,

x = xk nên Sn xấp xỉ diện tích thang cong bên dưới đồ thị giới hạn bởi Ox và 2 đường thẳng

x=a, x = b. Vì thế khi d max → thì Sn tiến về diện tích của hình thang

cong vừa nêu, tức là

Page 24: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

24

Tính chất:

Cho f là hàm khả tích trên [a, b], và c là điểm bất kì trên [a, b] thì

.

Cho f, g là hai hàm khả tích trên [a,b] và α β là 2 số thực thì

[ ]

.

Định lí:

Nếu f là hàm số liên tục trên khoảng [a, b] thì f khả tích trên [a, b].

Nhờ định lí trên, khi hàm f liên tục trên [a, b], ta có thể làm việc tính toán tổng tích phân Sn đơn

giản hơn bằng cách chọn xk là các điểm chia [a,b] thành n khoảng bằng nhau và tk là một trong 2

đầu mút hoặc trung điểm của các khoảng nhỏ đó, tức là chọn

.

Định lí cơ bản của toán vi tích phân:

Cho y = F(x) là một nguyên hàm của hàm y = f(x) liên tục trên khoảng [a, b], khi đó

.

8.2.3. Mở rộng tích phân xác định:

− Nếu y = f(x) chỉ xác định và liên tục trên [a,b) ta định nghĩa

lim →

khi

giới hạn này tồn tại và hữu hạn.

Có thể mở rộng một cách tương tự tích phân xác định cho hàm chỉ xác định và liên tục trên

(a, b], (a, b), [a, ∞), (a, ∞), ( ∞ b] hay ( ∞ b đặc biệt cũng có thể mở rộng lên toàn tập số

thực R [tức là trên ( ∞, +∞)]như sau:

Page 25: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

25

− Cho hàm y = f(x) liên tục trên R, ta định nghĩa

lim →

nếu giới hạn

này tồn tại và hữu hạn.

* Lưu ý rằng với các mở rộng trên, nếu hàm y = f(x) xác định và liên tục trên [a, b] thì tích phân

xác định của f trên [a, b], [a, b). (a, b] và (a, b) là như nhau, tức là:

[ ] [ ]

.

Điều này biện minh cho việc dùng cùng một kí hiệu cho tất cả các tích phân trên.

__________________

Page 26: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

26

BÀI TẬP

1. Bộ gen VDR (Vitamin D receptors) có hai alen (gen đẳng vị), gọi là T và t, chúng tạo ra

ba kiểu gen TT, Tt và tt. Chú ý rằng số alen T trong kiểu gen TT, Tt và tt lần lượt là 2, 1

và 0. Trong một nghiên cứu trên 130 phụ nữ ở Mĩ, các phân bố tần số của kiểu gen VDR

như sau:

TT: 53

Tt: 57

tt: 20

Sử dụng phân bố này để tìm các tần số tương đối của alen T. Tần số tương đối của alen

t là bao nhiêu?

2. Theo luật cân bằng Hardy−Weinberg, nếu tần số tương đối của alen T và t tương ứng là

p và q (p + q = 1), thì các tần số của TT, Tt và tt được cho bởi p², 2pq và q², tương ứng.

Sử dụng các kết quả của Câu hỏi 1 (p và q) để tìm phân bố tần số mong đợi của các kiểu

gen VDR cho 130 phụ nữ.

Những dữ liệu quan sát trong Câu hỏi 1 có phù hợp với luật cân bằng Hardy−Weinberg

(không cần phải sử dụng công cụ thống kê)?

3. Theo lý thuyết về di truyền học, giá trị các trung bình kiểu hình theo lí thuyết của TT, Tt

và tt lần lượt là (μ a (μ + d) và (μ a), trong đó μ dùng để chỉ trung bình tổng thể của

dân số, a dùng để chỉ ảnh hưởng di truyền phụ gia và d dùng để chỉ ảnh hưởng gen trội.

Trong một mẫu phụ nữ, trung bình BMD cho ba kiểu gen tương ứng là1,23; 1,15 và 0,98.

Tìm các giá trị của a và d.

4. Xét báo cáo sau đây: "DNA được chiết xuất từ 80 phụ nữ bệnh loãng xương và 85 phụ

nữ cùng tuổi đối chứng. PCR được dùng để khuếch đại chuỗi ADN và enzyme hạn chế

BSM−I được dùng để phát hiện alen VDR. Kết quả cho thấy không có khác biệt đáng kể

giữa nhóm loãng xương và nhóm đối chứng về tần số của alen B (0,44 và 0,39) cũng

như về tần số của kiểu gen BB (0,20 và 0,21). ” (Gallagher JBMR et al 1994).

Giả sử rằng sự phân bố của kiểu gen ở các đối tượng loãng xương và đối chứng theo

luật cân bằng Hardy−Weinberg, hãy ước lượng (tìm lại) số đối tượng trong mỗi kiểu gen

cho từng nhóm.

5. Với mỗi hàm số sau đây tìm những giá trị của x không thuộc miền xác định của nó:

(a)

(b)

4 (c) f(x) = logx

Page 27: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

27

(d) 4 (e) .

6. Tốc độ thay đổi về BMD đôi khi được mô hình hóa dưới dạng một hàm bậc hai sau:

δy a ² b c

trong đó δy là tốc độ thay đổi về BMD, t là thời gian (tính theo năm), a, b và c là hằng số.

Sử dụng kiến thức về bất đẳng thức để tìm ra khi nào (t =?) thì δy dương và khi nào δy

âm.

7. Cho f(x) = ln[(x+1)/x], chứng tỏ rằng f(1) + f(2) + f(3) = ln4.

8. Cho

, tìm (không phải tính) một biểu thức cho:

(i) C(5,3)

(ii) C(n+1,k).

9. Hàm phân bố Bình thường (Gauss) được xác định bởi 2 tham số: trung bình (µ) và độ

lệch chuẩn (ς) và được cho bởi:

Tìm biểu thức cho f(10;15,5).

10. Nếu x = ln2 và y = ln3, biểu diễn các biểu thức sau theo x và y.

(a) ln9 (b) ln (c) ln(3/2) (d) ln3 3 (e) ln0.25

(f) ln(8/9) (g) ln 6 (h) ln12 (i) ln4.5 (j) ln72.

11. Nếu , chứng tỏ rằng x = ln ( 5 ln .

(ii) Nếu

chứng tỏ rằng x = ½ ln3

(iii) Nếu

chứng tỏ rằng ln

12. Chứng tỏ rằng các kết quả sau đây là đúng:

(a) logae= 1 / logea (b) logpq + logqr + logrp = 1 (c) lognax = logax /(1+logan).

13. Con cái của một loài côn trùng nào đó sinh ra 20 con cái còn sống sót thuộc thế hệ sau.

Có 4 thế hệ / năm. Trong một năm sẽ có bao nhiêu con cái thuộc các thế hệ sau?

14. Giả sử rằng chỉ có sẵn đậu lăng khô và đậu nành khô để đáp ứng nhu cầu protein hàng

ngày của một người vào khoảng 75 g. Một gam đậu lăng có chứa 0,26 g protein và 1 g

Page 28: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

28

đậu nành có chứa 0,35 g protein. Gọi mức tiêu thụ của người đó là x g đậu lăng và y g

đậu nành. Hãy biểu thị mối quan hệ giữa x và y dưới dạng của một hàm tuyến tính tức là

y= a + bx.

15. Phương trình liên kết xác suất gãy xương (P) và mật độ khoáng của xương (BMD)

thường có dạng một phương trình logistic như sau:

trong đó b là một hằng số. Ước lượng b trong phương trình này hơi khó một chút, tuy

nhiên, việc ước lượng sẽ dễ dàng hơn nếu chúng ta biểu diễn mối quan hệ này duới

dạng một hàm tuyến tính bằng cách sử dụng logarit. Hãy tìm phương trình tuyến tính

này.

16. Trong một thí nghiệm, trọng lượng W của gạc nai được đo với một số nai ở các độ tuổi

khác nhau. Các kết quả được cho trong bảng sau:

A: 20 22 30 34 42 43 46 54 56 68 70

W: 0,08 0,10 0,15 0,20 0.27 026 0,31 0,36 0,40 0,49 0,49

(W tính theo kg và A tính theo tháng)

Chứng tỏ bằng phương trình và bằng đồ thị rằng các dữ liệu trên phù hợp khít khao quan

hệ tuyến tính:

W = mA + b, trong đó m và b tương ứng là độ dốc và tung độ gốc. Tìm phương trình

này.

17. Ngay sau khi tiêu thụ rượu, độ cồn trong máu của một người tăng lên đến một giá trị đỉnh

là 0,22 mg / ml, và sau đó từ từ giảm. Nếu t là thời gian tính bằng giờ sau khi giá trị tối đa

đạt được và y là mức độ rượu trong máu, bảng sau đây cho các giá trị đo thực nghiệm

cho chủ thể này:

t: 0 0,5 0,75 1,0 1,5 2,0 2,5 3,0

________________________________________________________

y: 0,22 0,18 0,15 0,13 0,10 0,08 0,06 0,05

Các dữ liệu được cho là theo quan hệ trong đó b và a là hằng số. Bằng cách sử

dụng lôgarit và phần mềm thống kê phổ biến, ước tính a và b.

18. Cho:

w1 = 8, w2 = 11, w3 = 3, w4 = 2, w5 = 17, w6 = 9, w7 = 6, w8 = 11

Page 29: ThongKe Y-Sinh Hoc_Bài 1 một số kiến thức toán cơ bản

THỐNG KÊ SINH HỌC

Một số kiến thức toán học cơ bản

29

x1 = 4.7, x2 = 3,9, x3 = 7.2, x4 = 0,5, x5 = 2.8, x6 = 5.1, x7 = 7,9, x8 = 4,6

y1 = 6, y2 = 1, y3 = 5, y4 = 4, y5 = 4, y6 = 8, y7 = 1, y8 = 7.

z1 = 31, z2 = 62, z3 = 7, z4 = 15, z5 = 53, z6 = 16, z7 = 94, z8 = 59.

Hãy tính

(a) (b)

(c)

(d) (e)

Các câu hỏi 19 −24 có cùng giả thiết với câu hỏi 18.

19. Gọi vij = wi yj (ví dụ v23 = w2.y3 = 11 × 5 = 55). Tính:

(i)

(ìi)

.

20. Chứng minh rằng 3 3

.

21. Chứng minh rằng 3 3

.

22. Chứng minh rằng 6 4

.

23. Chứng minh rằng 3 6

5 × 9.

24. Chứng minh rằng

.

25. Chứng minh rằng (i)

(ii)

.

26. Tìm phần trăm sai số trong công thức của Stirling khi n = 10 và n = 20.