【Quick Searchその5】 検索式の作り方 その2
・論理演算記号
・近傍検索
前回は、
H01L*.ipc. AND skyrmion.ti. AND @ay>=2010<=2022
と
G11C11*.cpc. AND (spintronics AND skyrmion).spec.
の作り方を調べてみました。
今回は、論理演算記号とワイルドカード、近傍検索を
調べてみましょう。
1 論理演算記号
論理演算記号は、ANDの他は、論理和のOR、
論理否定のNOT、排他的論理和のXORも使うことに
致しましょう。(XORは、どちらかが入っていれば
ヒットし、両方とも入っている場合には、ヒット
しません。)
2 ワイルドカード
ワイルドカードは、1文字ずつなら m?croのように
? を、指定文字分のワイルドカードの場合には、
micro$3などと $ を使いましょう。(この場合、micro
だけの単語もヒットします。)
文字数無制限のワイルドカードの場合には、先ほどの
$ で、micro$としてもよいし、micro*とでも致しましょう。
「ワイルドだろう~~~。」てなスギちゃんとは違う
訳でして。
3 近傍検索
次は、
(1) 明細書の中の一つの文(センテンスですね)の中に
「dc」と「microgrid」が入っていて、
(2)「dc」と「microgrid」の語順は順不同でよく、
(3)「dcと「microgrid」の間には単語が5文字
まで入っていてもOK
という検索式を作ってみましょう。
そうすると、順不同の近傍検索演算子は、NEARと
いうのがありますので、
(dc NEAR5 microgrid).spec.
と致しましょう。
(検索は、大文字も小文字もヒットします。)
単語数は450単語まで指定できますが、そこまで
指定する人はいないと思います、です、はい。
中に単語が入らず、dc microgridかmicrogrid dcを
検索したい場合には、dc NEAR microgridと致しましょう。
尚、aとかthatとかisとかのストップワードは一つの
単語とはカウントされませんので、お見知りおき??を。
近傍検索演算子には、その他に、単語順通りの
ADJ、複数センテンスの中で両方出現すればOK
というWITH、段落の中で両方出現すればOKと
いうSAMEがありますよ。
すなわち
detect WITH5 light
とすれば5つの文の中で両方出てくればOKで、
detect WITH light
では一つの文の中で出て来る必要があり、
detect SAME5 light
ならば、5段落のうちで出てくればOKで、
detect SAME light
の場合には、一つの段落で出て来る必要が
あるんです。
次回に続く。