🛡️콘텐츠 필터링
욕설, 혐오표현, 비방 등 부적절한 콘텐츠를 자동으로 탐지하고 필터링합니다.
📊 검사 결과
🛡️
텍스트를 입력하고 검사 버튼을 클릭하세요.
💡 작동 방식
1️⃣
키워드 기반 필터링
DB에 등록된 금칙어 목록과 대조하여 빠르게 검사
2️⃣
문맥 분석 (엄격 모드)
LLM을 활용하여 문맥상 부적절한 표현 감지
3️⃣
카테고리 분류
욕설, 혐오표현, 비방 등 위반 유형별 분류
4️⃣
자동 마스킹
부적절한 단어를 ***로 대체하여 반환
🏷️ 감지 카테고리
욕설
profanity
혐오표현
hate
비방
slander
문맥상 부적절
context_violation
API: POST /api/ai/filter-content