mỐi quan hỆ giỮa toÁn hỌc vÀ khoa hỌc mÁy...
Post on 03-Oct-2020
1 Views
Preview:
TRANSCRIPT
MỐI QUAN HỆ GIỮA TOÁN HỌC
VÀ KHOA HỌC MÁY TÍNH
Introduction to Computer Science FIT – HNUE 2020
Toán học
Toán học thuần túy (Pure Math)
Nghiên cứu, phát triển nội tại của Toán học
Phát triển theo chiều sâu, giải quyết những
vấn đề mới, khó của Toán học
Toán học ứng dụng (Applied Math)
Toán học cần cho cuộc sống
Nền tảng cho các khoa học khác
Phát triển theo động lực của các khoa học
khác, như CNTT, Lý, Hóa,…
2
Introduction to Computer Science FIT – HNUE 2020
Các lĩnh vực ứng dụng của Toán học
Toán học
trong
CNTT
Vật lý
Hóa
Sinh học
….
3
Introduction to Computer Science FIT – HNUE 2020
Khoa học máy tính
Các thuật ngữ
Khoa học máy tính (computer science)
Tin học (informatics)
Công nghệ thông tin (information technology)
Bản chất
Là khoa học về xử lý thông tin tự động bằng máy
tính điện tử.
Xử lý thông tin là quá trình biến đổi dữ liệu từ dạng
này sang dạng khác để thu được tri thức
4
Introduction to Computer Science FIT – HNUE 2020
Khoa học máy tính
5
Introduction to Computer Science FIT – HNUE 2020
Toán học và KHMT
Toán học là nền tảng của KHMT
Quá trình biến đổi dữ liệu chính là các biến đổi toán học, nên
cốt lõi của KHMT là toán học
Các lý thuyết, mô hình toán học làm cơ sở cho sự phát triển
của KHMT
KHMT sử dụng máy tính để giải quyết một số vấn đề
của toán học
Các bài toán có độ phức tạp hàm mũ
Tìm nghiệm của bài toán tối ưu
….
6
Introduction to Computer Science FIT – HNUE 2020
Alan Turing – Cha đẻ của KHMT
Nhà toán học, logic học và mật mã học người
Anh thường được xem là cha đẻ của ngành
KHMT.
Phép thử Turing là một trong những cống hiến
của ông trong ngành trí tuệ nhân tạo; đặt ra câu
hỏi máy tính có thể suy nghĩ như con người?
Máy Turing, là một mô hình thiết bị xử lý các kí
tự, có thể thực hiện được tất cả các thuật toán; các
hàm toán học tính được đều có thể thực hiện
được.
Giải thưởng Turing, tương đương giải thưởng
Nobel, trao cho những cá nhân có đóng góp nổi
bật trong lĩnh vực KHMT.
7
Introduction to Computer Science FIT – HNUE 2020
7 bài toán của thế kỷ 21
Ngày 24 tháng 5 năm 2000, Viện Toán học Clay công
bố và thách thức 7 bài toán của thế kỷ 21
Các bài toán:
P versus NP
The Hodge Conjecture
The Poincaré Conjecture (solved 2006)
The Riemann Hypothesis 4. Yang-Mills Existence and Mass
Gap
Navier-Stokes Existence and Smoothness
The Birch and Swinnerton-Dyer Conjecture
8
Introduction to Computer Science FIT – HNUE 2020
Bài toán “P versus NP”
“P versus NP” là một bài toán mở quan trọng trong lý
thuyết khoa học máy tính. Bài toán đặt ra là có phải bất kì
vấn đề nào có lời giải có thể được kiểm chứng "nhanh
chóng" cũng có thể được giải một cách "nhanh chóng”.
Cụm từ "nhanh chóng“ ám chỉ thời gian đa thức. Lớp các
bài toán có lời giải thực thi trong thời gian đa thức được
gọi là P. Lớp các bài toán mà lời giải có thể được kiểm tra
tính đúng sai trong thời gian đa thức là lớp NP.
9
Introduction to Computer Science FIT – HNUE 2020
Ví dụ: bài toán tìm tập con
Có tập hợp con nào của {−2, −3, 15, 14, 7, −10} có tổng bằng 0?
Lời giải: {−2, −3, −10, 15} có tổng bằng 0 có thể được kiểm
chứng dễ dàng bằng cách cộng các số đó lại.
Tuy nhiên, hiện chưa có thuật toán nào để tìm ra một tập hợp như
thế trong thời gian đa thức (có một thuật toán đơn giản thực thi
trong thời gian hàm mũ là kiểm tra tất cả 2n-1 tập con).
Như vậy, bài toán này nằm trong NP (kiểm chứng nhanh chóng)
nhưng chưa biết có nằm trong P (giải nhanh chóng) hay không.
Có rất nhiều bài toán như vậy. Chưa ai có thể chứng minh được
rằng, với bất kỳ bài toán nào như vậy, thực sự cần rất nhiều thời
gian để giải.
10
Introduction to Computer Science FIT – HNUE 2020
Ví dụ: bài toán SAT
11
Introduction to Computer Science FIT – HNUE 2020
Ví dụ: bài toán SAT
12
Introduction to Computer Science FIT – HNUE 2020
Thời gian đa thức và hàm mũ
13
Introduction to Computer Science FIT – HNUE 2020
Giải pháp khi dữ liệu lớn
Điều gì xảy ra khi dữ liệu lớn, N>106?
Cần thuật toán heuristic nhanh, gần đúng
Chú trọng đến giá của tính toán
Cần luôn điều khiển được độ chính xác
Đạt kết quả tốt nhất trong thời gian và tài nguyên cho phép
Sử dụng máy tính song song
14
Introduction to Computer Science FIT – HNUE 2020
Toán học trong một số lĩnh vực của
KHMT
Mật mã và an toàn thông tin (cryptography &
security)
Học máy (machine learning)
Khai phá dữ liệu (data mining)
Xử lý ngôn ngữ tự nhiên
Tin-sinh học (bioinformatics)
….
15
Introduction to Computer Science FIT – HNUE 2020
Mật mã và an toàn thông tin
Là nghiên cứu về bí mật của truyền tin (truyền tin trong
điều kiện có kẻ địch).
An toàn mạng và máy tính: quản lý sự truy nhập máy
tính và tin cậy của thông tin, và các ứng dụng như: ATM
cards, computer passwords, e-commerce, ...
Là lĩnh nghiên cứu lâu đời
Có tầm quan trọng
Có ảnh hưởng đến xã hội
16
Introduction to Computer Science FIT – HNUE 2020
Mật mã và an toàn thông tin
Mã hoá đối xứng
Dùng cùng một chìa khoá để khoá và mở thông tin cần được giữ bí mật
Cả bên gửi và nhận thông tin đều phải có chìa khoá này
Mã hoá bất đối xứng
Dùng hai chìa khoá khác nhau để
khoá và mở khoá thông tin bí mật.
Public key sẽ được công khai và
được gửi đi đến đối tượng cần mã
hoá thông tin, còn private key được
giữ bí mật
Dựa trên việc tìm một thuật toán để
nhân tử hóa các số trong thời gian đa
thức (như RSA)
17
Introduction to Computer Science FIT – HNUE 2020
Học máy (machine learning)
Học máy là một lĩnh vực nghiên cứu và phát triển các thuật toán
có thể học được từ dữ liệu
Có nhiều bài toán đặt ra
Bài toán phân lớp (classification)
Bài toán hồi quy (regression)
Bài toán phân cụm (clustering)
Bản chất của các thuật toán học máy là tìm nghiệm của một bài
toán tối ưu
Được phát biểu dưới dạng một bài toán tối ưu có hoặc không có
ràng buộc
Quá trình giải bài toán là tìm giá trị tối ưu của các tham số mô hình
dựa trên dữ liệu đã có
18
Introduction to Computer Science FIT – HNUE 2020
Học máy (machine learning)
Bài toán học máy
gồm hai pha
Pha huấn luyện mô
hình (training
phase)
Kiểm thử mô hình
(testing phase)
ML có nhiều ứng
dụng trong AI
19
Introduction to Computer Science FIT – HNUE 2020
Khai phá dữ liệu (data mining)
Là quá trình khám phá tri
thức (knowledge) từ các
nguồn dữ liệu cho trước
Tri thức có thể tồn tại
dưới dạng các luật (rules),
các mẫu (patterns), hoặc
các mô hình (models)
Có ứng dụng trong nhiều
lĩnh vực khác nhau của
đời sống xã hội
20
Introduction to Computer Science FIT – HNUE 2020
Khai phá dữ liệu (data mining)
Tiến trình khai phá tri thức từ dữ
liệu
Các mô hình toán học được dùng
trong các bước khác nhau
21
Introduction to Computer Science FIT – HNUE 2020
Khai phá dữ liệu (data mining)
22
Introduction to Computer Science FIT – HNUE 2020
Xử lý ngôn ngữ tự nhiên
Là quá trình giúp cho
máy tính (computer) có
thể hiểu và nói chuyện
được với con người
thông qua một ngôn ngữ
tự nhiên
Là lĩnh vực nghiên cứu
sôi động và có nhiều
ứng dụng thực tế nhất
hiện nay
Làm thế nào để con người có thể nói
chuyện được với máy tính thông qua
ngôn ngữ của con người?
23
Introduction to Computer Science FIT – HNUE 2020
Xử lý ngôn ngữ tự nhiên
Có nhiều bài toán đã và
đang được giải quyết
Dịch máy; Tóm tắt văn bản;
Phát hiện xu thế người
dùng; Chatbot,…
Sử dụng các mô hình toán
học
Các mô hình thống kê; Các
mô hình mạng nở-ron; Mô
hình học sâu (deep learning)
Đã có những bước tiến đáng
kể, tuy nhiên, gặp nhiều thách
thức, vì sao?
24
Introduction to Computer Science FIT – HNUE 2020
Tin-sinh học (bioinformatics)
Lượng dữ liệu sinh học vô cùng lớn, đa
dạng, phức tạp, và được lưu trữ dưới nhiều
dạng khác nhau
Đồ thị, chuỗi, ma trận số, text,…
Có nhiều bài toán đặt ra
Xây dựng cây phân loài, để hiểu được quan
hệ giữa các loài sinh vật
Gióng hang các hệ gen để phát hiện các
điểm đặc biệt, như đột biến, khiếm khuyết,
quan hệ huyết thống,…
Tìm kiếm các vùng chứa thông tin di
truyền (gen)
….
25
Introduction to Computer Science FIT – HNUE 2020
Tin-sinh học (bioinformatics)
Cần các mô hình toán học đủ mạnh để mô hình hóa
lượng dữ liệu lớn, đa dạng.
26
Introduction to Computer Science FIT – HNUE 2020
Kết luận
Toán học và KHMT có mối quan hệ chặt chẽ,
sâu sắc và căn bản
Các bài toán của KHMT đều phải sử dụng các
mô hình toán học để giải
KHMT đem Toán học đến gần hơn với đời sống
27
top related