卒 業 研 究

圧縮による類似度を用いた方言の自動分類




概    要

	Kolmogorov記述量に基づいたデータ間の類似度に関する距離が定義され、DNAの類似度や言語の類似度、音楽の類似度判定に
	有用だという実験結果が得られている。
	昨年、堀中、高野、関根氏がKolmogorv記述量を用いた方言の類似度分析に対して、文字コードや前処理等の違いの比較実験を行ったが、
	本研究では実験データの自動読込化や木の評価方法や、圧縮方法の違いによる追加研究を行う。



関 連 資 料

資料
ももたろう(UPGMA法)odp
ももたろう(quartet-method法)odp
RGB表ods
コマンドライン使用法odp
中間発表資料(071207)odp
卒研発表資料(080214)odp
レジュメ(卒研用)pdf  tex

ファイル
LEDA用コンパイルシェルスクリプトsh
GraphWindow作成プログラムcpp
UPGMA法cpp
quartet-method法(評価方法1)cpp
quartet-method法(評価方法2)cpp
quartet-method法(コマンドライン使用)cpp
色の塗り分け:行政color(スクリプト)pl
色の塗り分け:方言color(スクリプト)pl
距離表(bzip2)fileout
距離表(gzip)fileout
都道府県の名前ファイルfilename

quartet(評価1・方言color)png
quartet(評価1・行政color)png
quartet(評価1・方言color・Doragon)png
quartet(評価1・行政color・Doragon)png
quartet(評価1・gzip・方言color・Doragon)png
quartet(評価1・gzip・行政color・Doragon)png
quartet(評価2・方言color)png
quartet(評価2・行政color)png
quartet(評価2・方言color・Doragon)png
quartet(評価2・行政color・Doragon)png
quartet(評価2・gzip・方言color・Doragon)png
quartet(評価2・gzip・行政color・Doragon)png