यह शोधपत्र बहुविध वैज्ञानिक डेटा प्रबंधन में सबसे सामान्य कार्यों में से एक पर चर्चा करता है: किसी डेटाबेस से K सबसे समान आइटम (या k-निकटतम पड़ोसी, KNN) प्राप्त करना, जब कोई नया आइटम दिया जाता है। बहुविध मशीन लर्निंग मॉडल में हालिया प्रगति मूल बहुविध डेटा से मैप किए गए "एम्बेडिंग वेक्टर" नामक सिमेंटिक इंडेक्स प्रदान करती है। हालाँकि, परिणामी एम्बेडिंग वेक्टर में आमतौर पर सैकड़ों या हज़ारों आयाम होते हैं, जो उन्हें समय-संवेदनशील वैज्ञानिक अनुप्रयोगों के लिए अव्यावहारिक रूप से उच्च बनाते हैं। यह शोधपत्र ऑर्डर-प्रिजर्विंग डायमेंशनलिटी रिडक्शन (OPDR) के माध्यम से आउटपुट एम्बेडिंग वेक्टर की डायमेंशनलिटी को कम करने की एक विधि प्रस्तावित करता है, जहाँ डायमेंशनलिटी रिडक्शन के बाद निम्न-आयामी अंतरिक्ष में शीर्ष k निकटतम पड़ोसियों का समूह अपरिवर्तित रहता है। इसे प्राप्त करने के लिए, हम केंद्रीय परिकल्पना स्थापित करते हैं कि डायमेंशनलिटी रिडक्शन के दौरान प्रमुख मापदंडों के बीच आंतरिक संबंधों का विश्लेषण करके, हम एक मात्रात्मक फ़ंक्शन का निर्माण कर सकते हैं जो लक्ष्य (निम्न-आयामी) आयाम और अन्य चरों के बीच सहसंबंध को प्रकट करता है। इस परिकल्पना को सिद्ध करने के लिए, यह शोधपत्र पहले एक औपचारिक मीट्रिक फ़ंक्शन को परिभाषित करता है जो किसी दिए गए वेक्टर के लिए KNN समानता को परिमाणित करता है। इसके बाद यह इस मीट्रिक को वैश्विक मीट्रिक स्पेस में समग्र सटीकता तक विस्तारित करता है, और फिर लक्ष्य (निम्न-आयामी) विमीयता और अन्य चरों के बीच एक बंद-रूप फ़ंक्शन प्राप्त करता है। अंततः, यह इस बंद-रूप फ़ंक्शन को लोकप्रिय विमीयता न्यूनीकरण विधियों, विभिन्न दूरी मीट्रिक्स और एम्बेडिंग मॉडलों में एकीकृत करता है।