main project
TRANSCRIPT
. . . . . . . :
. :
1
1-1 )0591( 02 . ) (IT . . . . . . ... ... ... ... . .
2
1 . 2 . .
2-1 08 .11
. Data mining . 1 32
)3891( . ... . 09 . . . 1991 1 . 5991 2 . . . . 9891 4991 . ACM- SIGKDD . 6991 3 4 5 . . 1
1.Piatetsky-Shapiro
22.Data warehouse 31. Imielnski4
- Mannila - Inductive databases 4
5
7991 . . 1 . 8991 2 : . 3 4 . . 0002 . . 2002 . .
3-1 . . 1
- Benninga, Czaczkes, Higgins - Hand - Kleinberg - Paodimitriou , Raghavan 5
2
3
4
. . 1 ) ( KDD . . . . . 08 . . KDD . .
. ) (1
- Knowledge Discovery of Database
6
)- 8991(
1
)http://w
) ( . (ww.spss.com
. . KDD . KDD . : 1. 2. 3. ) ( 4. 1
7
5.
4-1 . . . . . . . . . . . .
5-1
8
: : . . . . . . . . - . . . . 9
1-5-1 . . . . . . . . 1
2-5-1
. : ) ( . . . . 11- Collect the data 01
. . . . .
3-5-1 . : 1: . . . : ( . ( . : . [ 1 0 ] [ 0001 001- ] -11- Outlier detection 11
. . . . .
4-5-1 1 . .
5-5-1 . . . . . . .11- Estimate 21
. . 1-1 . .
6-1 . . . 1-1
1( 2(
31
3( . . . . . . 1 . . . . . . .
1 . business41
. 2CRISP-DM . . . . 2: . 3: . 4: . 5: : .
. The Cross-Industry Standard Process for Data Mining . Classification
2
2
3. Regression . Clustering . Summarization514
5
1: . 2: . . . . . . . . . . . . .
7-1 3
.
. . Dependency ModelingChange and Deviation Detection 31-categorical 611
.
2
1
. )
( . - ) = (. . )0 1 ( N N . 2 . . )( . . . . . . .
12-symbolic 23-quantitative 71
. . . .
1
1-7-1
. . . . . . . : 1.
) (. 11-Raw Data 81
2.
.
2-7-1 . .
1-2-7-1 -n . ]1 1-[ ]1 0[ . . . : . 1 1 . - : . V 051 052 .
91
0/51 0/52 . ]1 0[ - )1-1( : (((v(i) = (v(i)-min(v(i))) / (max(v(i))-min(v(i )1-1(
1 : . v (mean (V (Sd(v . i )1-2( . (v(i) = (v(i)-mean(v)/sd(v2
)2-1(
2-2-7-1
. . . . . 11-Standard deviation normalization 22-Missing Data 02
. . . . . . : . 1 .
.
3-7-1 . . . 1- .11-feature mean 12
52 . . . . . . . . . 1
8-1
. . .
1-8-1 11-Data Reduction 22
. . . . . . : ) ( )( . : ) (. . . . . . . ) ( 32
. : : . . . 1 /: . . . : . . . . .
2-8-1 1-accuracy 42
) ( . . . . :
.
.
.
.
3-8-1 . . . 52
. . . .
4-8-1 . . : . . . . - . . .
9-1 62
. . . . . . :
. . ) 1-2 ( .
72
1-2 :
. . . 1 . . . . . . . 2
1-9-1
11- Transductive 21- Learning Machine 82
. , , . - -n . .
1-3 .
- . - . 1 -3 . .x y x
.
92
)
, x ( y ) x ( y . . . . .
2-9-1 :1
2
- . . . . ) (.
11- supervised learning 22- unsupervised learning 03
1 -4)( . / . . . .
(
1-4 (
. . . . . . .
13
/ . . . . . . 1-4)( . . W . . . . .
23
3-9-1 . . -n n )( . 1-5 . john . n . . . .
33
1-5 - -n
. . 1-6 )( . . 1-6 )( .
(
(
43
1-6
) ( . . n . . )( . 1-7 )( . 1-7 )( . . .
( 1-7
(
53
. . 1-8 )( )( 1-8 -n . . . . . 1-9)( .
( 1-8
(
63
(
(
1-9
. . 1-9 . . .
(
( 1-01
. .
73
. 1-11 . 1-11)( . 1-11)( .
(
(
1-11
. . . . :
83
- . . : : :
ANOVA . :
. :
. CLS 3 ID 5.4 C . 1:
www . :
. :
.
11- Association Rules 93
:
. . 1 n:
. : . . . . . .
01-1 . ) ( )(
11- Visualization 04
. .
1-01-1 . . . . . ) ( X . . -n )(
.
14
) ( . )( . .
2-01-1 ) ( X,S X S . . . . X . . . . . .
24
3-01-1 . . . . . . . )( .
4-01-1 . 0691 . . . .
34
.
. . .
. . .
. . . . . 1- 2-
. . . 2 .3-
44
. . . . : . . .
11-1 . . . ) - ( . . ) ( . .
54
: . . . . N N . - - . . OR 1-21 . AND. . .
1-21
. - . 64
. . . . . .
1-11-1 . . . / . . -
74
. . . x y 1-31 . 1> x y=B . 1