自然語言處理與應用 期中報告
DESCRIPTION
自然語言處理與應用 期中報告. 授課老師 : 顏國郎 教授 學生: 陳雅琪 MA0G0219 鄭冠瑀 MA0G0225. Entropy 的公式. ㄧ般計算公式 :. 子音 + 母音的計算公式 :. 簡介. 計算注音的 Entropy 。 假設注音是子音接母音的型式。 子音接母音的型式為 408 種。. 計算注音符號. 注音符號 : 總共有 37 個 ◎子音 : ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒ ㄓㄔㄕㄖㄗㄘㄙ ( 有 21 個 ) ◎母音 : ㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄥㄦ一ㄨ - PowerPoint PPT PresentationTRANSCRIPT
自然語言處理與應用期中報告
授課老師 : 顏國郎 教授學生:陳雅琪 MA0G0219
鄭冠瑀 MA0G0225
Entropy的公式
ㄧ般計算公式 :
子音 + 母音的計算公式 :
簡介
計算注音的 Entropy。 假設注音是子音接母音的型式。 子音接母音的型式為 408種。
計算注音符號 注音符號 : 總共有 37個 ◎子音: ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒ ㄓㄔㄕㄖㄗㄘㄙ ( 有 21個 ) ◎母音 : ㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄥㄦ一ㄨ ㄩ ( 有 16個 ) ◎雙母音 : 一ㄢ、一ㄥ、ㄨㄚ、ㄨㄛ、ㄨㄥ ㄚㄛㄜ…… ( 有 38個 )
計算注音符號 Entropy(1/2)
計算機率 1.個別出現次數 / 總出現次數 = 個別機率 2.機率 P=1/37
Entropy計算結果
計算注音符號 Entropy(2/2)
計算已知注音是子音接母音型式的Entropy(1/4)
二個音的所構成的注音符號Entropy1.假設每個音出現機率為古典機率2.不考慮雙母音(子音+母音)3.使用 ㄦㄢㄞㄚㄗㄓㄧㄣㄛㄘㄔㄨㄤ ㄠㄜㄙㄕㄩㄡ 共19個為母音
4.2479bits
計算已知注音是子音接母音型式的Entropy(2/4)
計算已知注音是子音接母音型式的Entropy(3/4)
二個音的所構成的注音符號 Entropy1.假設每個音出現機率為古典機率2.考慮雙母音
= = 7.4963
計算已知注音是子音接母音型式的Entropy(4/4)
計算注音是子音接母音型式只有 408種的 Entropy(1/3)
子音接母音的組合數有 x=408個 和 Phone.txt比對的機率 =P(x)
7.694bits
計算注音是子音接母音型式只有 408種的 Entropy(2/3)
母音 ㄅ ㄆ ㄇ ….. ㄙ
ㄚ 1/408 1/408 1/408 …… 1/408
ㄛ 1/408 1/408 1/408 …… 1/408
ㄜ 0 0 1/408 …… 1/408
….. ….. ….. ….. …… …..
ㄩㄥ 0 0 0 …… 0
子音
計算注音是子音接母音型式只有 408種的 Entropy(3/3)