키워드 필터링

키워드를 분리해내며 검사해내는 과정 입니다. ㅎㅎㅎㅎㅎㅎㅎ

왼쪽은 분리해내는 과정.
가운데의 A는 분리한 키워드, B는 필터된 키워드
오른쪽은 가운데와 마찬가지로 다른 키워드로 검사한 것






|

댓글 4개

저만 어렵나요? 짱돌 굴려봐도 모르겠습니다!
키워드를 분리해내는 쪽을 잘 모르겠어요. 전 그냥 DAUM API 사용하는 것으로 ㅎㅎ;
앞에서부터 분리하고, 뒤에서부터 분리하고
두글짜부터 분리하고, 세글짜부터 분리하고, 네글짜부터 분리하고
두글자씩 첫번째부터 분리하고, 두글자씩 두번째부터 분리하고, 두글자씩 세번째부터 분리하고
세글자씩 첫번째부터 분리하고, 세글자씩 두번째부터 분리하고...

총 바이트를 구해서 계속 분리하면서 필터에 있는 단어와 검사를 하는거죠!
이런건 형태소 분석기로 하는게 정신건강에 좋습니다.
"대학생선교회"
잘못 추출하면, 대학 + 생선 + 교회 가 나옵니다.
http://nlp.kookmin.ac.kr/HAM/kor/ham-intr.html 전 주로 이분껄 사용합니다만, 상업용으로 공개하신게 아니라서..
http://cs.sungshin.ac.kr/~shim/demo/mach.html 이건 공개용 버전인듯
댓글을 작성하시려면 로그인이 필요합니다. 로그인

개발자톡

+
제목 글쓴이 날짜 조회
15년 전 조회 1,102
15년 전 조회 811
15년 전 조회 780
15년 전 조회 1,655
15년 전 조회 1,001
15년 전 조회 935
15년 전 조회 1,046
15년 전 조회 1,098
15년 전 조회 1,106
15년 전 조회 982
15년 전 조회 913
15년 전 조회 924
15년 전 조회 940
15년 전 조회 826
15년 전 조회 905
15년 전 조회 931
15년 전 조회 870
15년 전 조회 748
15년 전 조회 662
15년 전 조회 810
15년 전 조회 793
15년 전 조회 825
15년 전 조회 732
15년 전 조회 723
15년 전 조회 882
🐛 버그신고