검색어 인식의 구조적 한계 어떻게 극복해야 할까요.

검색어 인식의 구조적 한계 어떻게 극복해야 할까요.

QA

검색어 인식의 구조적 한계 어떻게 극복해야 할까요.

본문

안녕하세요.

 

이건 그누보드뿐만 아니라

대부분의 모든 웹프로그램 배포판에

해당하는 문제일 텐데요.

 

예를들어 검색어를

'p'라고

검색하면

<p>태그가 포함된 모든 컨텐츠가 검색 결과에 포함되어 버리고

 

마찬가지 b라고 검색하면

<br>태그가 포함된 모든 컨텐츠가 검색 결과에 포함되어 버리는

 

이런 결과...

 

어떻게 배제할수 있을까요. 고민이 됩니다. 

이 질문에 댓글 쓰기 :

답변 1

안녕하세요.

대부분의 모든 웹 프로그램 배포판이라고 하기보다는, 아무래도 위지윅게시판을 쓰는 보드들은 태그를 포함시켜서 한번에 DB에 저장하다보니 그런 사단이 나지 않나 싶습니다.

 

이럴경우에 흔히 알려진 방법으로는 sql단에서 like 대신 regexp 를 사용하여 태그를 정규식에서 뺀 나머지를 불러오는 방법이 있구요(속도주의). 또는 php단에서 화면에 뿌릴때 태그를 제거해서 보여주는 경우가 있구요.

근데 후자의 경우는 검색결과의 오탐처럼 보여질 수 있으니 전자를 가지고 설계하면 됩니다.

 

편법으로는 두글자 이상을 검색하게 해서 간단 태그들을 우회시키곤 합니다. 

답변 감사합니다.
아무래도 역시나 sql단에서 제외 시키는 방법밖에 없겠네요.
휴... 근데 좀 걱정입니다.

일단 서비스 규모가 좀 큰지라 말이지요.
아마 제 의도대로 진행되면 G5를 이용한 사이트 중에서는
꼽을 정도로 커질 것으로 생각되기에 검색퍼포먼스가 참 고민입니다.

위지윅도 일단 내장된 네이버스마트에디터도 아니고
G5 자체를 거의 마개조로 가는 형국인지라
고민이 너무 많습니다.

허나, 힌트를 주셨습니다. 감사합니다!

답변을 작성하시기 전에 로그인 해주세요.
전체 123,673 | RSS
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT