Language model trained on PennTreebank dataset
experiments-1.csv -- описание начальных экспериментов с двумя нейронами, используются оптимизаторы SGD и Adam experiments-2.csv -- описание экспериментов с двумя нейронами с добавлением оптимизации NT-ASGD experiments-3.csv -- описание окончательных экспериментов с тремя нейронами с добавлением Dropout, L2-регуляризации, gradient clipping