robert roosalu rnn for generating estonian text exploring

23
Exploring hyperparameters RNN for generating Estonian text Robert Roosalu

Upload: others

Post on 15-Jan-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Robert Roosalu RNN for generating Estonian text Exploring

Exploring hyperparameters

RNN for generating Estonian text

Robert Roosalu

Page 2: Robert Roosalu RNN for generating Estonian text Exploring

Introduction

Replicate examples in Andrej Karpathy’s blog post for Estonian

Keras example works great…

Explore hyperparameters!

Page 3: Robert Roosalu RNN for generating Estonian text Exploring

Dataset

160 books from Estonian literature (1990-...) → 35 MB

Time constraint

Results in 12 hours → 1 MB

Rein Põder “Hiliskevad” + 0.24 Ene Mihkleson “Ahasveeruse Uni”

Page 4: Robert Roosalu RNN for generating Estonian text Exploring

Model

2-layer RNN(LSTM)

Softmax activation

Categorical Crossentropy loss

Mini-batch Gradient Descent

Dropout

RMSProp

Page 5: Robert Roosalu RNN for generating Estonian text Exploring

Hyperparameters

dataset: corpus, window_size

net: dropout, neuron_count

optimisation: epoch_number, batch_size

Page 6: Robert Roosalu RNN for generating Estonian text Exploring

Cost functions

Page 7: Robert Roosalu RNN for generating Estonian text Exploring

Batch size

Page 8: Robert Roosalu RNN for generating Estonian text Exploring

Dropout

Page 9: Robert Roosalu RNN for generating Estonian text Exploring

Window size

Page 10: Robert Roosalu RNN for generating Estonian text Exploring

Epoch

Page 11: Robert Roosalu RNN for generating Estonian text Exploring

Epoch == iteration

Page 12: Robert Roosalu RNN for generating Estonian text Exploring

Corpus size

Page 13: Robert Roosalu RNN for generating Estonian text Exploring

Neurons

Page 14: Robert Roosalu RNN for generating Estonian text Exploring

Measuring accuracy

Page 15: Robert Roosalu RNN for generating Estonian text Exploring

Measuring accuracy

Page 16: Robert Roosalu RNN for generating Estonian text Exploring

Measuring accuracy ikka seda üksijäri ma oli mu ei ta ning telle vale oli neid kui ta minu

Page 17: Robert Roosalu RNN for generating Estonian text Exploring

Measuring accuracy

Page 18: Robert Roosalu RNN for generating Estonian text Exploring

Neurons

Page 19: Robert Roosalu RNN for generating Estonian text Exploring

Neurons: 512 vs 1024

Page 20: Robert Roosalu RNN for generating Estonian text Exploring

Neurons: 512 vs 1024512Low temp:mees oli ta vastanud, et ta oli ka enam mingit neist temasse viinalt parjada sellele peale mõneda kohale ja arusaatust taastasse saati.ja see kasvab veel tema pea sees.[…]nii et ma teadsin, et mulle tundus mulle ka enam midagi ja ette vastama.ma ei ole kui tema keegi meele.

High temp:kinni üle metsavendi tema silmis peaaegu palamamaatlus.ainult ette vaaduks tõgima!, viga minu omida... esimesel tegul.meil oli ruttanud, päris kilduv paesa vananud ja just naguti olemuspoolt ühne sedasama vajaks.

1024High temp: ma olin karini armendama näonud paidagi elanud.selgus, et veel siis naiselik.tegelikult oli hetke teeline piri, oli ma auendaid kordi alla peen, seda tuli ta rihumad loodus.

Page 21: Robert Roosalu RNN for generating Estonian text Exploring

Examples

kuid minul on lõpuks ta võimalust kuidagi õhtuvalt sisse ja siis ta kõiges mõistab.

ning seda oli teinud, ta oli see pool elanud küll.

me esimesel metsas oli ta kõrval avastuse kui kallusliku hõbemil mälestuses tema poole pikaks juhtunud vaid pidevult sinna piirada ja selle nime.

ka ta silmade ja kui kaarel peitus ja enne kui ma üleselnud kui kellega teisel pool tulevad lahti.

Page 22: Robert Roosalu RNN for generating Estonian text Exploring

Conclusions

Good initial hyperparameters for 1 MB dataset.

Lackluster text, needs more data.

Original post vs this work - Estonian more complex than English?

Page 23: Robert Roosalu RNN for generating Estonian text Exploring

Thank you!