mỐi quan hỆ giỮa toÁn hỌc vÀ khoa hỌc...
TRANSCRIPT
MỐI QUAN HỆ GIỮA TOÁN HỌC
VÀ KHOA HỌC MÁY TÍNH
Introduction to Computer Science FIT – HNUE 2020
Giảng viên
◼ TS. Đặng Xuân Thọ
◼ Bộ môn: Khoa học máy tính
◼ Email: [email protected]
◼ Website: http://fit.hnue.edu.vn/~thodx/
Introduction to Computer Science FIT – HNUE 2020
Toán học
◼ Toán học thuần túy (Pure Math)
◼ Nghiên cứu, phát triển nội tại của Toán học
◼ Phát triển theo chiều sâu, giải quyết những
vấn đề mới, khó của Toán học
◼ Toán học ứng dụng (Applied Math)
◼ Toán học cần cho cuộc sống
◼ Nền tảng cho các khoa học khác
◼ Phát triển theo động lực của các khoa học
khác, như CNTT, Lý, Hóa,…
Introduction to Computer Science FIT – HNUE 2020
Các lĩnh vực ứng dụng của Toán học
◼ Toán học trong CNTT
◼ Toán học trong Vật lý
◼ Toán học trong Hóa
◼ Toán học trong Sinh học
◼ ….
Introduction to Computer Science FIT – HNUE 2020
Khoa học máy tính
◼ Các thuật ngữ
◼ Khoa học máy tính (computer science)
◼ Tin học (informatics)
◼ Công nghệ thông tin (information technology)
◼ Bản chất
◼ Là khoa học về xử lý thông tin tự động bằng máy
tính điện tử.
◼ Xử lý thông tin là quá trình biến đổi dữ liệu từ dạng
này sang dạng khác để thu được tri thức
Introduction to Computer Science FIT – HNUE 2020
Khoa học máy tính
Introduction to Computer Science FIT – HNUE 2020
Toán học và KHMT
◼ Toán học là nền tảng của KHMT
◼ Quá trình biến đổi dữ liệu chính là các biến đổi toán học, nên
cốt lõi của KHMT là toán học
◼ Các lý thuyết, mô hình toán học làm cơ sở cho sự phát triển
của KHMT
◼ KHMT sử dụng máy tính để giải quyết một số vấn đề
của toán học
◼ Các bài toán có độ phức tạp hàm mũ
◼ Tìm nghiệm của bài toán đối ưu
◼ ….
Introduction to Computer Science FIT – HNUE 2020
Alan Turing – Cha đẻ của KHMT
◼ Nhà toán học, logic học và mật mã học người Anh
thường được xem là cha đẻ của ngành KHMT.
◼ Phép thử Turing là một trong những cống hiến của
ông trong ngành trí tuệ nhân tạo; đặt ra câu hỏi máy
tính có thể suy nghĩ như con người?
◼ Máy Turing, là một mô hình thiết bị xử lý các kí tự,
có thể thực hiện được tất cả các thuật toán; các hàm
toán học tính được đều có thể thực hiện được.
◼ Giải thưởng Turing, tương đương giải thưởng
Nobel, trao cho những cá nhân có đóng góp nổi bật
trong lĩnh vực KHMT.
Introduction to Computer Science FIT – HNUE 2020
7 bài toán của thế kỷ 21
◼ „ Ngày24 tháng 5 năm 2000, Viện Toán học Clay công bố
và thách thức 7 bài toán của thế kỷ 21
◼ Các bài toán:
◼ P versus NP
◼ The Hodge Conjecture
◼ The Poincaré Conjecture (solved 2006)
◼ The Riemann Hypothesis 4. Yang-Mills Existence and Mass
Gap
◼ Navier-Stokes Existence and Smoothness
◼ The Birch and Swinnerton-Dyer Conjecture.
Introduction to Computer Science FIT – HNUE 2020
Bài toán “P versus NP”
“P versus NP” là một bài toán mở quan trọng trong lý
thuyết khoa học máy tính. Bài toán đặt ra là có phải bất kì
vấn đề nào có lời giải có thể được kiểm chứng "nhanh
chóng" cũng có thể được giải một cách "nhanh chóng”.
Cụm từ "nhanh chóng“ ám chỉ thời gian đa thức. Lớp các
bài toán có lời giải thực thi trong thời gian đa thức được
gọi là P. Lớp các bài toán mà lời giải có thể được kiểm tra
tính đúng sai trong thời gian đa thức là lớp NP.
Introduction to Computer Science FIT – HNUE 2020
Ví dụ: bài toán tìm tập con
◼ Có tập hợp con nào của {−2, −3, 15, 14, 7, −10} có tổng bằng 0?
◼ Lời giải: {−2, −3, −10, 15} có tổng bằng 0 có thể được kiểm
chứng dễ dàng bằng cách cộng các số đó lại.
◼ Tuy nhiên, hiện chưa có thuật toán nào để tìm ra một tập hợp như
thế trong thời gian đa thức (có một thuật toán đơn giản thực thi
trong thời gian hàm mũ là kiểm tra tất cả 2n-1 tập con).
◼ Như vậy, bài toán này nằm trong NP (kiểm chứng nhanh chóng)
nhưng chưa biết có nằm trong P (giải nhanh chóng) hay không.
◼ Có rất nhiều bài toán như vậy. Chưa ai có thể chứng minh được
rằng, với bất kỳ bài toán nào như vậy, thực sự cần rất nhiều thời
gian để giải.
Introduction to Computer Science FIT – HNUE 2020
Ví dụ: bài toán SAT
Introduction to Computer Science FIT – HNUE 2020
Ví dụ: bài toán SAT
Introduction to Computer Science FIT – HNUE 2020
Thời gian đa thức và hàm mũ
Introduction to Computer Science FIT – HNUE 2020
Giải pháp khi dữ liệu lớn
◼ Điều gì xảy ra khi dữ liệu lớn, N>106?
◼ Cần thuật toán heuristic nhanh, gần đúng
◼ Chú trọng đến giá của tính toán
◼ Cần luôn điều khiển được độ chính xác
◼ Đạt kết quả tốt nhất trong thời gian và tài nguyên cho phép
◼ Sử dụng máy tính song song
Introduction to Computer Science FIT – HNUE 2020
Toán học trong một số lĩnh vực
của KHMT
◼ Mật mã và an toàn thông tin
◼ Học máy (machine learning)
◼ Khai phá dữ liệu (data mining)
◼ Xử lý ngôn ngữ tự nhiên
◼ Tin-sinh học (bioinformatics)
◼ ….
Introduction to Computer Science FIT – HNUE 2020
Mật mã và an toàn thông tin
◼ Là nghiên cứu về bí mật của truyền tin (truyền tin trong
điều kiện có kẻ địch).
◼ An toàn mạng và máy tính: quản lý sự truy nhập máy
tính và tin cậy của thông tin, và các ứng dụng như: ATM
cards, computer passwords, e-commerce, ...
◼ Là lĩnh nghiên cứu lâu đời
◼ Có tầm quan trọng
◼ Có ảnh hưởng đến xã hội
Introduction to Computer Science FIT – HNUE 2020
Mật mã và an toàn thông tin
◼ Mã hoá đối xứng
◼ Dùng cùng một chìa khoá để khoá và mở thông tin cần được giữ bí mật
◼ Cả bên gửi và nhận thông tin đều phải có chìa khoá này
◼ Mã hoá bất đối xứng
◼ Dùng hai chìa khoá khác nhau để khoá
và mở khoá thông tin bí mật.
◼ Public key sẽ được công khai và được
gửi đi đến đối tượng cần mã hoá thông
tin, còn private key được giữ bí mật
◼ Dựa trên việc tìm một thuật toán để nhân
tử hóa các số trong thời gian đa thức
(như RSA)
Introduction to Computer Science FIT – HNUE 2020
Học máy (machine learning)
◼ Học máy là một lĩnh vực nghiên cứu và phát triển các thuật toán
có thể học được từ dữ liệu
◼ Có nhiều bài toán đặt ra
◼ Bài toán phân lớp (classification)
◼ Bài toán hồi quy (regression)
◼ Bài toán phân cụm (clustering)
◼ Bản chất của các thuật toán học máy là tìm nghiệm của một bài
toán tối ưu
◼ Được phát biểu dưới dạng một bài toán tối ưu có hoặc không có ràng buộc
◼ Quá trình giải bài toán là tìm giá trị tối ưu của các tham số mô hình dựa
trên dữ liệu đã có
Introduction to Computer Science FIT – HNUE 2020
Học máy (machine learning)
◼ Bài toán học máy
gồm hai pha
◼ Pha huấn luyện mô
hình (training
phase)
◼ Kiểm thử mô hình
(testing phase)
◼ ML có nhiều ứng
dụng trong AI
Introduction to Computer Science FIT – HNUE 2020
Khai phá dữ liệu (data mining)
◼ Là quá trình khám phá tri
thức (knowledge) từ các
nguồn dữ liệu cho trước
◼ Tri thức có thể tồn tại
dưới dạng các luật (rules),
các mẫu (patterns), hoặc
các mô hình (models)
◼ Có ứng dụng trong nhiều
lĩnh vực khác nhau của
đời sống xã hội
Introduction to Computer Science FIT – HNUE 2020
Khai phá dữ liệu (data mining)
◼ Tiến khai phá tri thức từ dữ liệu
◼ Các mô hình toán học được dùng
trong các bước khác nhau
Introduction to Computer Science FIT – HNUE 2020
Khai phá dữ liệu (data mining)
Introduction to Computer Science FIT – HNUE 2020
Xử lý ngôn ngữ tự nhiên
◼ Là quá trình giúp cho
máy tính (computer) có
thể hiểu và nói chuyện
được với con người
thông qua một ngôn ngữ
tự nhiên
◼ Là lĩnh vực nghiên cứu
sôi động và có nhiều
ứng dụng thực tế nhất
hiện nayLàm thế nào để con người có thể nói
chuyện được với máy tính thông qua ngôn
ngữ của con người?
Introduction to Computer Science FIT – HNUE 2020
Xử lý ngôn ngữ tự nhiên
◼ Có nhiều bài toán đã và
đang được giải quyết
◼ Dịch máy; Tóm tắt văn bản;
Phát hiện xu thế người
dùng; Chatbot,…
◼ Sử dụng các mô hình toán
học
◼ Các mô hình thống kê; Các
mô hình mạng nở-ron; Mô
hình học sâu (deep learning)
Đã có những bước tiến đáng kể, tuy
nhiên, gặp nhiều thách thức, vì sao?
Introduction to Computer Science FIT – HNUE 2020
Tin-sinh học (bioinformatics)
◼ Lượng dữ liệu sinh học vô cùng lớn, đa
dạng, phức tạp, và được lưu trữ dưới nhiều
dạng khác nhau
◼ Đồ thị, chuỗi, ma trận số, text,…
◼ Có nhiều bài toán đặt ra
◼ Xây dựng cây phân loài, để hiểu được quan hệ
giữa các loài sinh vật
◼ Gióng hang các hệ gen để phát hiện các điểm đặc
biệt, như đột biến, khiếm khuyết, quan hệ huyết
thống,…
◼ Tìm kiếm các vùng chứa thông tin di truyền (gen)
◼ ….
Introduction to Computer Science FIT – HNUE 2020
Tin-sinh học (bioinformatics)
◼ Cần các mô hình toán học đủ mạnh để mô hình hóa
lượng dữ liệu lớn, đa dạng.
Introduction to Computer Science FIT – HNUE 2020
Kết luận
◼ Toán học và KHMT có mối quan hệ chặt chẽ,
sâu sắc và căn bản
◼ Các bài toán của KHMT đều phải sử dụng các
mô hình toán học để giải
◼ KHMT đem Toán học đến gần hơn với đời sống