Expand description
Kiwi 형태소 분석기 호환 레이어
이 모듈은 Kiwi 형태소 분석기와의 상호 운용성을 제공합니다. MeCab-Ko와 Kiwi 간 품사 태그 변환 및 출력 형식 호환 기능을 포함합니다.
§Kiwi 소개
Kiwi(Korean Intelligent Word Identifier)는 C++로 작성된 고성능 한국어 형태소 분석기입니다. 세종 품사 태그 체계를 기반으로 하며, 일부 확장 태그를 포함합니다.
§품사 태그 매핑
MeCab-Ko와 Kiwi는 대부분의 품사 태그를 공유하지만, 일부 차이점이 있습니다:
- MeCab-Ko의
NNBC(단위 의존 명사)는 Kiwi에서NNB로 통합 - MeCab-Ko의
SSO/SSC(여는/닫는 괄호)는 Kiwi에서SS로 통합 - MeCab-Ko의
SC(구분자)는 Kiwi에서SP로 매핑 - MeCab-Ko의
SY(기타 기호)는 Kiwi에서SO로 매핑 - Kiwi의 웹 관련 태그 (
W_URL,W_EMAIL등)는 MeCab-Ko의SL로 매핑
§Example
use mecab_ko_core::kiwi_compat::{KiwiPosTag, to_kiwi_tag, from_kiwi_tag};
use mecab_ko_core::pos_tag::PosTag;
// MeCab -> Kiwi 변환
let kiwi_tag = to_kiwi_tag(PosTag::NNG);
assert_eq!(kiwi_tag, KiwiPosTag::NNG);
// Kiwi -> MeCab 변환
let mecab_tag = from_kiwi_tag(KiwiPosTag::NNG);
assert_eq!(mecab_tag, PosTag::NNG);
// 문자열 파싱
let tag = KiwiPosTag::from_str("NNG").unwrap();
assert_eq!(tag.as_str(), "NNG");Structs§
- Kiwi
Token - Kiwi 호환 토큰 구조체
Enums§
- Kiwi
PosTag - Kiwi 품사 태그
Functions§
- from_
kiwi_ tag - Kiwi 품사 태그를 MeCab-Ko 품사 태그로 변환
- to_
kiwi_ tag - MeCab-Ko 품사 태그를 Kiwi 품사 태그로 변환