クラスタリングとは、「似ている・近いもの同士の集まりを見つける」こと。まとまったデータを与えたとき、データの自動分類することができる。
クラスタリング (clustering)、クラスタ解析(クラスタかいせき)、クラスター分析(クラスターぶんせき)は、データ解析手法(特に多変量解析手法)の一種。教師なしデータ分類手法であり、与えられたデータを外的基準なしに自動的に分類する手法やアルゴリズム。
さまざまな手法が提案されているが、大きく分けるとデータの分類が階層的になされる階層型手法と、特定のクラスタ数に分類する非階層的手法とがある。それぞれの代表的な手法としてウォード法、K平均法などがある。