膨大な法律データをXMLベースのデータ加工技術により、高速検素が可能な次世代エンジンを構築
次世代法律検索エンジン LegalSearchが備えるXMLベースの高速検素技術の最大の特徴は、データをXML形式で持っている点にあります。RDBにデータを持った増合よりも高速に検束ができるよう工夫しており、複数のキーワードで検索した場合のヒット精度も向上しています。
XMLを採用したことで、既存のシステムと比べてコストは数十分の一から数百分の一程度で済み、検索スピードも1000回テストの平均応答時問で約20倍という高速処理が可能です。さらに、法令・判例データが増えてデータ量が10倍になったとしても、XMLでデータを持っていれば、検索時間が単純に10倍になるということはなく、それよりも早い時間で検索が可能になります。一方、RDBでは逆に10倍以上の時間がかかってしまう可能性もあるだけに、XMLでデータを持つことはとても重要なポイントだと考えています。
LegalSearchと同様の仕相みをRDBで作ってみたらどうなるでしょうか。実は、RDBでこの仕組みを実装しようとするとハードウエア画で非常に高いパフォーマンスが必要となり、必然的にコストも跳ね上がるという弊害が起きてしまいます。LegalSearchは、独自のXML変換技術を使うことで、従来では考えられなかったハイクオリティの検索プラットフォームを常識破りのローコストで構築することができるようにしました。