리자

스팸글 방지에 대한 고찰

요즘들어 스팸글이 난무하고 있다.
내가 보기에 스팸은 경기에 민감하다.
경기가 좋으면 스팸은 자취를 감추고, 경기가 나쁘면 스팸은 기승을 부린다.
스팸이 난무하고 있다. 그렇다면 지금의 경기는?

암튼 경기가 좋건 나쁘건 우리들은 열심히 코드를 생산해 내야하는게 임무(?) 아니겠는가?
나는 오늘도 열심히(?) 삽질을 한다.

스팸을 완전히 차단하기 위해 나는 MYSQL 의 FULLTEXT 를 사용해 보기로 했다.
http://dev.mysql.com/doc/refman/5.0/en/fulltext-natural-language.html

mysql> SELECT id, body, MATCH (title,body) AGAINST
    -> ('Security implications of running MySQL as root') AS score
    -> FROM articles WHERE MATCH (title,body) AGAINST
    -> ('Security implications of running MySQL as root');
+----+-------------------------------------+-----------------+
| id | body                                | score           |
+----+-------------------------------------+-----------------+
|  4 | 1. Never run mysqld as root. 2. ... | 1.5219271183014 |
|  6 | When configured properly, MySQL ... | 1.3114095926285 |
+----+-------------------------------------+-----------------+
2 rows in set (0.00 sec)

내용에 들어있는 자료를 검색하여 산포도를 따져 점수가 높은 것은 아예 글 등록이 되지 않도록 하는 것이다.

1. 게시글이 등록된다. 스팸글인지는 모른다.
2. 회원들이 스팸글로 신고를 한다.
3. 신고시 스팸 테이블에 해당 내용을 저장한다.
4. 다시 유사한 게시물이 등록된다.
5. 스팸 테이블에서 산포도를 검사하여 점수가 높다면 글 등록을 거부한다.

대충 이런 방법으로 구현하고자 했는데 산포도가 내가 생각하는 것처럼 나타나지 않아 포기한다. ㅜㅜ

필터링 이외에는 방법이 없는것인가?

|

댓글 3개

1. 메일 스팸을 처리하는것과 같이 공통 모듈을 실시간으로 업데이트 하는 방법
2. 블랙 IP 공유, 실시간 업데이트
3. 실시간으로 삭제.. 게시판 운영자 지정(신고글에 대해서 게시판 운영자 삭제권한 제공)
4. 스팸공동센터 운영, 센터 차원에서 스패머에 대한 법적 조치
captcha 로 막지 못하는 근본적 이유.
==> 사람이 직접 입력하면 됨.
인건비가 싼 아프리카 지역에 아르바이트 사이트를 개설하여, 캡차 인식 1건당 0.1원으로 인건비를 지급해도 할사람 많음.(하루 천원으로 1만개 등록 가능, 높게 잡아서 1원으로 해도 만원이면 1만개 등록)
(알바는 게시물 등록이 아니라, 캡차 이미지에 해당하는 문자만 입력하면 됨.)

알바 <---> 캡차이미지 사이트 <---> 등록기 로봇 <---> 캡차가 적용된 웹사이트
1. 등록기 로봇이 이미지만 추출하여 캡차이미지 사이트에 등록
2. 알바는 캡자 이미지 사이트 리스트에 등록된 이미지를 보고 문자값을 입력
(아마 한번에 10-100개 동시입력하겠죠)
3. 로봇은 캡차이미지사이트에 입력값을 확인하여, 캡차 적용된 사이트에 값을 입력하여 무력화 시킴

외국엔 이렇게 운영하는 사이트를 본적이 있음.(국내는 잘 모르겠음)

해결책.
- 사람이 벌인일은 사람이 해결하도록 해야함.. 1,2,3,4번 방법들은 모두 사람이 개입해야만 합니다.
제가 생각한 것은 스팸 DB를 만들어 비슷한 내용의 스팸글이 올라오면 사람이 올리는 경우라도 등록을 거부하는 것이었습니다.
MYSQL 의 FULLTEXT 산포도는 영문에서는 지원이 되는것 같은데 한글에서는 영 성능이 좋지 않네요.
저희 사이트에서 비회원의 글쓰기를 열어 놓았는데 전부 사람이 캡챠를 입력하고 글을 썼더라구요.
현재로서는 회원가입 이외에 뾰족한 방법이 없습니다.
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

태그 필터 (최대 3개) 전체 개발자 소스 기타 mysql 팁자료실 javascript php linux flash 정규표현식 jquery node.js mobile 웹서버 os 프로그램 강좌 썸네일 이미지관련 도로명주소 그누보드5 기획자 견적서 계약서 기획서 마케팅 제안서 seo 통계 서식 통계자료 퍼블리셔 html css 반응형 웹접근성 퍼블리싱 표준화 반응형웹 홈페이지기초 부트스트랩 angularjs 포럼 스크린리더 센스리더 개발자톡 개발자팁 퍼블리셔톡 퍼블리셔팁 기획자톡 기획자팁 프로그램강좌 퍼블리싱강좌
+
제목 글쓴이 날짜 조회
14년 전 조회 1,414
14년 전 조회 1,327
14년 전 조회 1,424
14년 전 조회 858
14년 전 조회 1,566
14년 전 조회 1,173
14년 전 조회 1,467
14년 전 조회 1,670
14년 전 조회 1,448
14년 전 조회 1,598
14년 전 조회 1,277
14년 전 조회 2,121
14년 전 조회 1,210
14년 전 조회 1,585
14년 전 조회 1,663
14년 전 조회 1,858
14년 전 조회 1,040
15년 전 조회 1,747
15년 전 조회 1,618
15년 전 조회 1,306
15년 전 조회 2,345
15년 전 조회 1,453
15년 전 조회 1,391
15년 전 조회 1,601
15년 전 조회 1,371
15년 전 조회 1,578
15년 전 조회 1,544
15년 전 조회 1,177
15년 전 조회 1,895
15년 전 조회 1,900
15년 전 조회 858
15년 전 조회 878
15년 전 조회 3,330
15년 전 조회 2,260
15년 전 조회 1,362
15년 전 조회 884
15년 전 조회 887
15년 전 조회 1,354
15년 전 조회 1,652
15년 전 조회 1,524
15년 전 조회 1,320
15년 전 조회 1,562
15년 전 조회 1,297
15년 전 조회 1,823
15년 전 조회 871
15년 전 조회 1,233
15년 전 조회 855
15년 전 조회 1,338
15년 전 조회 925
15년 전 조회 1,205
15년 전 조회 913
15년 전 조회 1,171
15년 전 조회 1,436
15년 전 조회 2,951
15년 전 조회 1,274
15년 전 조회 4,665
15년 전 조회 2,149
15년 전 조회 1,456
15년 전 조회 1,684
15년 전 조회 1,563
15년 전 조회 1,940
15년 전 조회 1,847
15년 전 조회 1,165
15년 전 조회 1,693
15년 전 조회 1,057
15년 전 조회 1,164
15년 전 조회 7,177
15년 전 조회 2,525
15년 전 조회 2,174
15년 전 조회 1,193
15년 전 조회 1,481
15년 전 조회 1,331
15년 전 조회 1,986
15년 전 조회 1,735
15년 전 조회 1,298
15년 전 조회 1,116
15년 전 조회 4,579
15년 전 조회 2,948
15년 전 조회 1,283
15년 전 조회 940
15년 전 조회 1,580
15년 전 조회 1,857
15년 전 조회 1,638
15년 전 조회 1,063
15년 전 조회 2,041
15년 전 조회 3,369
15년 전 조회 1,519
15년 전 조회 1,444
15년 전 조회 1,264
15년 전 조회 1,081
15년 전 조회 942
15년 전 조회 1,031
15년 전 조회 2,208
15년 전 조회 1,254
15년 전 조회 1,626
15년 전 조회 3,834
15년 전 조회 1,546
15년 전 조회 1,696
15년 전 조회 1,404
15년 전 조회 1,386