現時点で、以下の問題を把握しています。
問題と対応方針を以下に列挙しておきます。
順次対応していきますので、しばらくお待ちください。
たとえば「て」「に」「を」「は」など、ほとんどの文書に大量に含まれている単語があるとパフォーマンスが悪化する現象があります。これらの単語は検索にとっても意味がないものであり、特別な対応が必要となります。
現在、次のような方針で修正することを検討中です。
方針
対象となっている文書の 90% 以上に含まれている単語は、検索キーワードから除外する。
なお、本対応を実行するためには、定期的に文書データを集計する必要があります。処理自体は Crowling が終わったタイミングで集計処理を流す形になると思います。