卒業研究
[テーマ]:Kolmogorov記述量に基づく類似度を用いた方言の自動分類
[概要]:Kolmogorov記述量に基づいたデータ間の類似度に関する距離が定義され,DNAの類似度や言語の類似度,音楽の類似度判定に有用だという実験結果が得られている.本研究ではKolmogorov記述量が方言の類似度分析に対して有用かどうか実験を行う。
[script]
・フォルダ内の「.txt」「.wav」ファイルを
bzip2、compress、gzip、zip、lzhで圧縮
・「.bz2」「.Z」「.gz」「.zip」「.lzh」拡張子がついたファイルサイズをテキストファイルに書きだす fsize.sh
・「.txt」「.wav」をそれぞれふたつにくっつける ketugou.sh
[プログラム]
・類似度に関する距離を求める dist.cpp
・距離表を求める dist.c
・NJ法 nj.c