情報処理 Ⅱ

情報処理Ⅱ

第９回2004年 12月 7日（火）

2

暗号化問題

仕様入力文にあるすべての 'A'を α，すべての 'B'を β，…に置き換えて出力する．（単一換字暗号という．）

文字は， char型の任意の値とする．ただし '\0'を除く（ '\0'は必ず '\0'に置き換える，と考えてもよい）．

どの文字をどの文字に置き換えるかは，プログラムの中で指定する．

簡単な操作で，復号できるようにする．•

　Wagahai Ha Nekodearu

•

　Zdjdkdl Kd Qhnrghdux

暗号化復号

3

暗号化問題

方針暗号化のための変換テーブルを，配列で保持する．

• char encrypt_table[256];char encrypt_table[256];

'D'encrypt_

table'E'…

+0

'F' 'G' …

+1+'A'

+'B'+'C'

+'D' +255

encrypt_table['A']の値

4

暗号化問題

方針（続き）暗号化は，写像を用いる．

• a = 'A';a = 'A'; のとき， b = encrypt_table[a];b = encrypt_table[a]; でbの値が 'D'となるようにするには，あらかじめencrypt_table['A']の値を 'D'としておけばよい．

復号のためのテーブルは，逆写像を用いて求める．• char decrypt_table[256];char decrypt_table[256];• decrypt_table[encrypt_table['A']] = 'A';decrypt_table[encrypt_table['A']] = 'A';

gが fの逆写像であるとは，g(f(x))=x

5

暗号化問題

方針（続き）定義する関数

•文字列形式の変換テーブルを，配列に変換する．•復号のためのテーブルの値を設定する．•変換テーブルを恒等写像にする（変換のリセット）．•変換テーブルを用いて，文字列を暗号化もしくは復号する．

暗号化と復号はどう区別する？• ./encrypt Wakagai Ha Nekodearu./encrypt Wakagai Ha Nekodearu• ./encrypt -d Zdjdkdl Kd Qhnrghdux./encrypt -d Zdjdkdl Kd Qhnrghdux

fが恒等写像であるとは，f(x)=x

「コマンドラインオプション」と呼ばれる

6

定義する関数（１）

void reset_table(char *table)void reset_table(char *table) 変換テーブルを恒等写像にする（変換のリセット）．

? ?encrypt_

table?…? ? … ?

table

1 'A' 'B'…0 'C' … 255

+0+1

+'A'+'B'

+'C'+255関数内の

ローカル変数（関数が終了すると，破棄される）

7

定義する関数（２）

void set_encrypt_table(char *table, const void set_encrypt_table(char *table, const char *from, const char *to)char *from, const char *to) 文字列形式の変換テーブルを，配列に変換する．encrypt_

table… …'D'

+'A'

'E'

+'B'

'F'

+'C'table

'A' 'B' 'C' 'D' 'E' 'F'

from to

… '\0' '\0'…

8

定義する関数（３）

void set_decrypt_table(char *table, const void set_decrypt_table(char *table, const char *encrypt_table)char *encrypt_table) 復号のためのテーブルを設定する（逆写像を作る）．

decrypt_table

…

+0

'A' …

+1+'A'

+'B'+'C'

+'D' +255

'D'encrypt_

table…

+0

…

+1+'A'

+'B'+'C'

+'D' +255

table

encrypt_table

9

定義する関数（４）

char *encrypt(const char *text, const char char *encrypt(const char *text, const char *table)*table) 変換テーブルを用いて，文字列を変換する．「暗号化」と「復号」の処理を共通化している！戻り値は，変換された文字列で， static変数 result（のポインタ値）となる．

'a' 'g' 'a''W' 'h' 'a' 'i' '\0'

'D' 'E'… 'F' 'G' …

text

'd' 'j' 'd''Z' 'k' 'd' 'l' '\0'result

戻り値static領域（関数が終了しても，破棄されない）

table

10

暗号化プログラムの補足

関数 set_encrypt_tableの仮引数 from, toはconst char *const char *型型である．このとき ○○ from++; to++; ×× (*from)++;

• fromの参照先 (const char型の値 )を変更しようとしている．

暗号化のように，関数開始時点で長さがわからない文字列を入力にとり，それと同じ長さの暗号文を返すときは，生成する暗号文が配列領域をはみ出さないように配慮する． encrypt.cでは， 100文字 (ナル文字を加えて 101バイト )を越える入力は，そこから無視している．

11

まとめ

関数を自分で定義することができる．関数を呼び出すとき，引数は値渡しで授受される．

変数には，型とは別の属性として，記憶域クラスと型修飾子を指定できる． static変数と auto変数とでは，大きく挙動が異なる．

「変数の定義」と「オブジェクトの生成」は別．オブジェクトの生成・破棄のタイミングに注意する．

12

次に学ぶこと

再帰 (recursion) 用途

再帰的（帰納的，循環的）な定義バックトラック (backtrack) 分割統治法 (divide-and-conquer)

注意点無限ループにならないようにする．再帰を使わないほうがよいこともある．

13

再帰呼び出しとは

関数の内部で自分自身を呼び出すことを，再帰呼び出し(recursive call)という．

例：カウントダウンするプログラム自作関数 countdownの定義の中で， countdownを呼び出している．

14

なぜ再帰呼び出しが可能なのか？

num = 2

main

x = 2

countdown

x = 0

main関数処理時に生成されるオブジェクト

countdownの呼び出し（関数処理）を終えたときの戻り先

countdown関数処理時に生成されるオブジェクト

countdown

x = 1

countdownの再帰呼び出しを終えたときの戻り先

同一の変数名 xに対して複数のオブジェクトが生成される．

このようなデータ構造を，「スタック」

という．

15

再帰呼び出しの注意点

出力の位置を変えると，カウントアップになる．カウントアップ，カウントダウンともに，再帰呼び出しなしのプログラムのほうが，効率はよい．なぜ再帰呼び出しは効率が悪いか？…関数呼び出しのコスト（オーバーヘッド）があるから．

16

再帰的な定義の例

階乗 0! = 1, 1! = 1 n! = n×(n-1)!　 (n≧2)

フィボナッチ数列 a1 = 1, a2 = 1 an= an-1 + an-2 　 (n≧3)

再帰呼び出しを用いれば，シンプルに書ける．しかしこれらも， whileループのほうが効率がよい．

17

分割統治法

対象領域を細分化して求め（分割），全体として正しい解になる（統治）ようにする．

例 : クイックソート

４２５１６８３７

１７８６５４３２

１８７６５４３２

２８５７６１３４

「４より小」と「４より大」に分ける．

18

ソート (sort)

データを，何らかの基準基準で順番に並べること．「整列」ともいう．例

試験の点数順試験の点数順に学生番号を出力する時系列で出力される情報を，キーワードごとキーワードごとに並べる

学生番号： 0003氏名：さしすせそ情処Ⅰの点数： 90情処Ⅱの点数： 0修得単位数： 24

学生番号： 0002氏名：かきくけこ情処Ⅰの点数： 60情処Ⅱの点数： 99修得単位数： 48

学生番号： 0001氏名：あいうえお情処Ⅰの点数： 80情処Ⅱの点数： 75修得単位数： 52

学生番号： 0002氏名：かきくけこ情処Ⅰの点数： 60情処Ⅱの点数： 99修得単位数： 48

学生番号： 0001氏名：あいうえお情処Ⅰの点数： 80情処Ⅱの点数： 75修得単位数： 52

学生番号： 0003氏名：さしすせそ情処Ⅰの点数： 90情処Ⅱの点数： 0修得単位数： 24

学生番号で昇順ソート情処Ⅰの点数で降順ソート

（ソートの）「キー」という

ソートの対象となる個々の情報を「レコード」という

19

ソートをする際の問題点

計算の手間処理時間（比較回数）が，レコード数の 2乗に比例する方法は，遅い．

レコード数 nに対して， n log n に比例するだけの比較回数でソートできる方法が最善である．

重複キーキーが同じでもレコードが異なっていれば，別物として扱わなければならない．

安定性

20

文字列並べ替え問題

仕様コマンドライン引数の各語を，昇順にソートして出力する．

• Mukashi Mukashi Aru Tokoroni Ojiisanto Mukashi Mukashi Aru Tokoroni Ojiisanto Obaasanga Sunde ImashitaObaasanga Sunde Imashita

• Aru Imashita Mukashi Mukashi Obaasanga Aru Imashita Mukashi Mukashi Obaasanga Ojiisanto Sunde TokoroniOjiisanto Sunde Tokoroni

キーは，語の先頭文字とする．• "Mukashi" > "Aru"• "Aru" < "Tokoroni"• "Ojiisanto" == "Obaasanga"

クイックソートを用いる．一般には（辞書順），"Ojiisanto" > "Obaasanga"

21

クイックソートの考え方

４２５１６８３７４≦７なので，何もせず青矢印を進める．

４２５１６８３７ 4 ＞ 3なので，赤矢印を進めてから交換し，青矢印を進める．

４２５１６８７３

４２５１６８３７

４２５７６８１３

4 ＞ 1なので，交換が発生する．

緑矢印から橙矢印までをソートしたい．

22


４２５７６８１３

p =基準値＜ p≦

基準値未満＜ p ＜　　基準値以上

＜ p≦未調査p =

走査の位置

pは，配列中の要素を指す整数値またはポインタ値

23


４８５７６２１３配列の走査は終了．緑矢印と赤矢印の値を交換しておく．

４２５７６８１３ 4 ＞ 2なので，交換が発生する．

２８５７６４１３

２８５７６４１３赤矢印の左と右で別々にソートする．ここで再帰呼び出しを使用する．

１７８６５４３２

24

まとめ

再帰呼び出しを用いて関数を定義すると，プログラムがすっきり書けることがある．再帰的に定義された問題に適用すると，効果的．

一般に，再帰を用いないほうが効率的である．関数内の auto変数は，関数呼び出しごとに生成される点に注意．

情報処理 Ⅱ

Documents