本稿では、ハードウェアおよびソフトウェア開発の分野で技術文書のセマンティック検索を最適化するための新しいフレームワークであるTechnical-Embeddingsを紹介します。大規模言語モデル(LLM)を活用して、複雑な技術コンテンツの理解と検索の課題を解決することに焦点を当てます。ユーザーのクエリを拡張して、ユーザーの意図をよりよく捉え、データセットの多様性を向上させ、埋め込みモデルの微調整プロセスを豊かにします。また、要約抽出技術を適用して技術文書の中核情報をエンコードし、表現を改善する。ソフトプロンプトを使用してデュアルエンコーダBERTモデルを微調整し、クエリとドキュメントのコンテキストで別々の学習パラメータを使用して、細かい意味の違いをキャプチャします。 RAG-EDAとRust-Docs-QAの2つのパブリックデータセットで評価した結果、Technical-Embeddingsは基準モデルよりも精度と再現率の両方でかなり優れた性能を示しました。これは、技術分野における情報のアクセスと理解を改善するために、クエリの拡張とコンテキストの要約を統合する効果を示しています。この研究は、Retrieval-Augmented Generation(RAG)システムの進歩をもたらし、エンジニアリングおよび製品開発ワークフローで効率的で正確な技術文書を検索するための新しい方法を提供します。