검색어 인식의 구조적 한계 어떻게 극복해야 할까요.
본문
안녕하세요.
이건 그누보드뿐만 아니라
대부분의 모든 웹프로그램 배포판에
해당하는 문제일 텐데요.
예를들어 검색어를
'p'라고
검색하면
<p>태그가 포함된 모든 컨텐츠가 검색 결과에 포함되어 버리고
마찬가지 b라고 검색하면
<br>태그가 포함된 모든 컨텐츠가 검색 결과에 포함되어 버리는
이런 결과...
어떻게 배제할수 있을까요. 고민이 됩니다.
답변 1
안녕하세요.
대부분의 모든 웹 프로그램 배포판이라고 하기보다는, 아무래도 위지윅게시판을 쓰는 보드들은 태그를 포함시켜서 한번에 DB에 저장하다보니 그런 사단이 나지 않나 싶습니다.
이럴경우에 흔히 알려진 방법으로는 sql단에서 like 대신 regexp 를 사용하여 태그를 정규식에서 뺀 나머지를 불러오는 방법이 있구요(속도주의). 또는 php단에서 화면에 뿌릴때 태그를 제거해서 보여주는 경우가 있구요.
근데 후자의 경우는 검색결과의 오탐처럼 보여질 수 있으니 전자를 가지고 설계하면 됩니다.
편법으로는 두글자 이상을 검색하게 해서 간단 태그들을 우회시키곤 합니다.
답변을 작성하시기 전에 로그인 해주세요.