Expand description
§미등록어 처리 모듈 (Unknown Word Handler)
사전에 없는 단어를 처리하는 모듈입니다.
§개요
MeCab의 미등록어 처리는 두 가지 정의 파일을 기반으로 합니다:
char.def: 문자 카테고리 정의unk.def: 미등록어 품사/비용 정의
§문자 카테고리 속성
| 속성 | 값 | 의미 |
|---|---|---|
| INVOKE | 0 | 사전에 있으면 미등록어 처리 생략 |
| INVOKE | 1 | 항상 미등록어 후보도 생성 |
| GROUP | 0 | 그룹핑 비활성화 |
| GROUP | 1 | 동일 카테고리 문자 그룹핑 |
| LENGTH | n | 1~n 길이의 미등록어 후보 생성 |
§예제
use mecab_ko_core::unknown::UnknownHandler;
let handler = UnknownHandler::korean_default();Structs§
- Char
Category Def - 문자 카테고리 정의
- Char
Category Map - 문자 카테고리 매퍼
- Unknown
Candidate - 미등록어 후보
- Unknown
Def - 미등록어 정의
- Unknown
Dictionary - 미등록어 사전
- Unknown
Handler - 미등록어 처리기
Enums§
- Word
Pattern - 단어 패턴 종류
Constants§
- ALPHA_
CATEGORY - 알파벳 카테고리 ID
- DEFAULT_
CATEGORY - 기본 카테고리 ID
- HANGUL_
CATEGORY - 한글 카테고리 ID
- HANJA_
CATEGORY - 한자 카테고리 ID
- NUMERIC_
CATEGORY - 숫자 카테고리 ID
- SPACE_
CATEGORY - 공백 카테고리 ID
- SYMBOL_
CATEGORY - 기호 카테고리 ID
Type Aliases§
- Category
Id - 문자 카테고리 ID