類似度と非類似度/パターン認識学
クラスタリングは類似度と非類似度に従ってクラスタを作ることである
セグメンテーションやベクトル量子化などがある
情報科学における量子化(英: quantization)は低精度離散値への数値変換である[1]。
マクロな自然界に存在する値の多くはアナログ(連続値)である一方、デジタルな表現(離散値)が求められる場合が存在する。例えば現代のコンピュータ(デジタルコンピュータ)はそもそもアナログ値を扱えない。また離散値を更に低精度の、粗い数値へ変換したい場合も存在する。例えば音響信号処理ではデータ量を減らす為に64bit浮動小数点数を16bit整数にしばしば変換する。これらのような、低精度離散値への数値変換が量子化である。
データやクラスタ間の類似度を測る基本的な尺度が距離である
距離の公理
①非負性:d(x、y)>0
②反射律:d(x、y)=0のときX=yである
③対称性:dd(x、y)=d(y、x)
④三角不等式:三角形の頂点の距離とおなじ公理
距離尺度にはユークリッド距離のほかにミンコフスキー距離がある
2025年2月27日 | カテゴリー:基礎知識/物理学、統計学、有機化学、数学、英語 |