HERCULESは、階層的なk-meansクラスタリングによってさまざまなモダリティ(テキスト、画像、数値データ)の複雑なデータセットを効果的にグループ化し、LLM(Large Language Model)を活用して生成された意味論的に豊富なクラスタ記述を提供する新しいアルゴリズムとPythonパッケージです。データポイントから始まり、再帰的にk-meansクラスタリングを適用して階層クラスタ構造を作成します。2つの表現方法をサポートします。ユーザーはtopic_seedを提供して、LLM生成の要約を特定のトピックに導き、対話型の視覚化ツールを使用してクラスタリングの結果を分析できます。