mỐi quan hỆ giỮa toÁn hỌc vÀ khoa hỌc...

28
MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNH

Upload: others

Post on 06-Jun-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

MỐI QUAN HỆ GIỮA TOÁN HỌC

VÀ KHOA HỌC MÁY TÍNH

Page 2: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Giảng viên

◼ TS. Đặng Xuân Thọ

◼ Bộ môn: Khoa học máy tính

◼ Email: [email protected]

◼ Website: http://fit.hnue.edu.vn/~thodx/

Page 3: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Toán học

◼ Toán học thuần túy (Pure Math)

◼ Nghiên cứu, phát triển nội tại của Toán học

◼ Phát triển theo chiều sâu, giải quyết những

vấn đề mới, khó của Toán học

◼ Toán học ứng dụng (Applied Math)

◼ Toán học cần cho cuộc sống

◼ Nền tảng cho các khoa học khác

◼ Phát triển theo động lực của các khoa học

khác, như CNTT, Lý, Hóa,…

Page 4: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Các lĩnh vực ứng dụng của Toán học

◼ Toán học trong CNTT

◼ Toán học trong Vật lý

◼ Toán học trong Hóa

◼ Toán học trong Sinh học

◼ ….

Page 5: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Khoa học máy tính

◼ Các thuật ngữ

◼ Khoa học máy tính (computer science)

◼ Tin học (informatics)

◼ Công nghệ thông tin (information technology)

◼ Bản chất

◼ Là khoa học về xử lý thông tin tự động bằng máy

tính điện tử.

◼ Xử lý thông tin là quá trình biến đổi dữ liệu từ dạng

này sang dạng khác để thu được tri thức

Page 6: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Khoa học máy tính

Page 7: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Toán học và KHMT

◼ Toán học là nền tảng của KHMT

◼ Quá trình biến đổi dữ liệu chính là các biến đổi toán học, nên

cốt lõi của KHMT là toán học

◼ Các lý thuyết, mô hình toán học làm cơ sở cho sự phát triển

của KHMT

◼ KHMT sử dụng máy tính để giải quyết một số vấn đề

của toán học

◼ Các bài toán có độ phức tạp hàm mũ

◼ Tìm nghiệm của bài toán đối ưu

◼ ….

Page 8: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Alan Turing – Cha đẻ của KHMT

◼ Nhà toán học, logic học và mật mã học người Anh

thường được xem là cha đẻ của ngành KHMT.

◼ Phép thử Turing là một trong những cống hiến của

ông trong ngành trí tuệ nhân tạo; đặt ra câu hỏi máy

tính có thể suy nghĩ như con người?

◼ Máy Turing, là một mô hình thiết bị xử lý các kí tự,

có thể thực hiện được tất cả các thuật toán; các hàm

toán học tính được đều có thể thực hiện được.

◼ Giải thưởng Turing, tương đương giải thưởng

Nobel, trao cho những cá nhân có đóng góp nổi bật

trong lĩnh vực KHMT.

Page 9: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

7 bài toán của thế kỷ 21

◼ „ Ngày24 tháng 5 năm 2000, Viện Toán học Clay công bố

và thách thức 7 bài toán của thế kỷ 21

◼ Các bài toán:

◼ P versus NP

◼ The Hodge Conjecture

◼ The Poincaré Conjecture (solved 2006)

◼ The Riemann Hypothesis 4. Yang-Mills Existence and Mass

Gap

◼ Navier-Stokes Existence and Smoothness

◼ The Birch and Swinnerton-Dyer Conjecture.

Page 10: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Bài toán “P versus NP”

“P versus NP” là một bài toán mở quan trọng trong lý

thuyết khoa học máy tính. Bài toán đặt ra là có phải bất kì

vấn đề nào có lời giải có thể được kiểm chứng "nhanh

chóng" cũng có thể được giải một cách "nhanh chóng”.

Cụm từ "nhanh chóng“ ám chỉ thời gian đa thức. Lớp các

bài toán có lời giải thực thi trong thời gian đa thức được

gọi là P. Lớp các bài toán mà lời giải có thể được kiểm tra

tính đúng sai trong thời gian đa thức là lớp NP.

Page 11: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Ví dụ: bài toán tìm tập con

◼ Có tập hợp con nào của {−2, −3, 15, 14, 7, −10} có tổng bằng 0?

◼ Lời giải: {−2, −3, −10, 15} có tổng bằng 0 có thể được kiểm

chứng dễ dàng bằng cách cộng các số đó lại.

◼ Tuy nhiên, hiện chưa có thuật toán nào để tìm ra một tập hợp như

thế trong thời gian đa thức (có một thuật toán đơn giản thực thi

trong thời gian hàm mũ là kiểm tra tất cả 2n-1 tập con).

◼ Như vậy, bài toán này nằm trong NP (kiểm chứng nhanh chóng)

nhưng chưa biết có nằm trong P (giải nhanh chóng) hay không.

◼ Có rất nhiều bài toán như vậy. Chưa ai có thể chứng minh được

rằng, với bất kỳ bài toán nào như vậy, thực sự cần rất nhiều thời

gian để giải.

Page 12: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Ví dụ: bài toán SAT

Page 13: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Ví dụ: bài toán SAT

Page 14: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Thời gian đa thức và hàm mũ

Page 15: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Giải pháp khi dữ liệu lớn

◼ Điều gì xảy ra khi dữ liệu lớn, N>106?

◼ Cần thuật toán heuristic nhanh, gần đúng

◼ Chú trọng đến giá của tính toán

◼ Cần luôn điều khiển được độ chính xác

◼ Đạt kết quả tốt nhất trong thời gian và tài nguyên cho phép

◼ Sử dụng máy tính song song

Page 16: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Toán học trong một số lĩnh vực

của KHMT

◼ Mật mã và an toàn thông tin

◼ Học máy (machine learning)

◼ Khai phá dữ liệu (data mining)

◼ Xử lý ngôn ngữ tự nhiên

◼ Tin-sinh học (bioinformatics)

◼ ….

Page 17: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Mật mã và an toàn thông tin

◼ Là nghiên cứu về bí mật của truyền tin (truyền tin trong

điều kiện có kẻ địch).

◼ An toàn mạng và máy tính: quản lý sự truy nhập máy

tính và tin cậy của thông tin, và các ứng dụng như: ATM

cards, computer passwords, e-commerce, ...

◼ Là lĩnh nghiên cứu lâu đời

◼ Có tầm quan trọng

◼ Có ảnh hưởng đến xã hội

Page 18: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Mật mã và an toàn thông tin

◼ Mã hoá đối xứng

◼ Dùng cùng một chìa khoá để khoá và mở thông tin cần được giữ bí mật

◼ Cả bên gửi và nhận thông tin đều phải có chìa khoá này

◼ Mã hoá bất đối xứng

◼ Dùng hai chìa khoá khác nhau để khoá

và mở khoá thông tin bí mật.

◼ Public key sẽ được công khai và được

gửi đi đến đối tượng cần mã hoá thông

tin, còn private key được giữ bí mật

◼ Dựa trên việc tìm một thuật toán để nhân

tử hóa các số trong thời gian đa thức

(như RSA)

Page 19: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Học máy (machine learning)

◼ Học máy là một lĩnh vực nghiên cứu và phát triển các thuật toán

có thể học được từ dữ liệu

◼ Có nhiều bài toán đặt ra

◼ Bài toán phân lớp (classification)

◼ Bài toán hồi quy (regression)

◼ Bài toán phân cụm (clustering)

◼ Bản chất của các thuật toán học máy là tìm nghiệm của một bài

toán tối ưu

◼ Được phát biểu dưới dạng một bài toán tối ưu có hoặc không có ràng buộc

◼ Quá trình giải bài toán là tìm giá trị tối ưu của các tham số mô hình dựa

trên dữ liệu đã có

Page 20: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Học máy (machine learning)

◼ Bài toán học máy

gồm hai pha

◼ Pha huấn luyện mô

hình (training

phase)

◼ Kiểm thử mô hình

(testing phase)

◼ ML có nhiều ứng

dụng trong AI

Page 21: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Khai phá dữ liệu (data mining)

◼ Là quá trình khám phá tri

thức (knowledge) từ các

nguồn dữ liệu cho trước

◼ Tri thức có thể tồn tại

dưới dạng các luật (rules),

các mẫu (patterns), hoặc

các mô hình (models)

◼ Có ứng dụng trong nhiều

lĩnh vực khác nhau của

đời sống xã hội

Page 22: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Khai phá dữ liệu (data mining)

◼ Tiến khai phá tri thức từ dữ liệu

◼ Các mô hình toán học được dùng

trong các bước khác nhau

Page 23: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Khai phá dữ liệu (data mining)

Page 24: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Xử lý ngôn ngữ tự nhiên

◼ Là quá trình giúp cho

máy tính (computer) có

thể hiểu và nói chuyện

được với con người

thông qua một ngôn ngữ

tự nhiên

◼ Là lĩnh vực nghiên cứu

sôi động và có nhiều

ứng dụng thực tế nhất

hiện nayLàm thế nào để con người có thể nói

chuyện được với máy tính thông qua ngôn

ngữ của con người?

Page 25: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Xử lý ngôn ngữ tự nhiên

◼ Có nhiều bài toán đã và

đang được giải quyết

◼ Dịch máy; Tóm tắt văn bản;

Phát hiện xu thế người

dùng; Chatbot,…

◼ Sử dụng các mô hình toán

học

◼ Các mô hình thống kê; Các

mô hình mạng nở-ron; Mô

hình học sâu (deep learning)

Đã có những bước tiến đáng kể, tuy

nhiên, gặp nhiều thách thức, vì sao?

Page 26: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Tin-sinh học (bioinformatics)

◼ Lượng dữ liệu sinh học vô cùng lớn, đa

dạng, phức tạp, và được lưu trữ dưới nhiều

dạng khác nhau

◼ Đồ thị, chuỗi, ma trận số, text,…

◼ Có nhiều bài toán đặt ra

◼ Xây dựng cây phân loài, để hiểu được quan hệ

giữa các loài sinh vật

◼ Gióng hang các hệ gen để phát hiện các điểm đặc

biệt, như đột biến, khiếm khuyết, quan hệ huyết

thống,…

◼ Tìm kiếm các vùng chứa thông tin di truyền (gen)

◼ ….

Page 27: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Tin-sinh học (bioinformatics)

◼ Cần các mô hình toán học đủ mạnh để mô hình hóa

lượng dữ liệu lớn, đa dạng.

Page 28: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC …fit.hnue.edu.vn/~thodx/data/khmt/Chap02_Math_CS.pdfBài toán phân lớp (classification) Bài toán hồi quy (regression) Bài

Introduction to Computer Science FIT – HNUE 2020

Kết luận

◼ Toán học và KHMT có mối quan hệ chặt chẽ,

sâu sắc và căn bản

◼ Các bài toán của KHMT đều phải sử dụng các

mô hình toán học để giải

◼ KHMT đem Toán học đến gần hơn với đời sống