Skip to main content

Module kiwi_compat

Module kiwi_compat 

Source
Expand description

Kiwi 형태소 분석기 호환 레이어

이 모듈은 Kiwi 형태소 분석기와의 상호 운용성을 제공합니다. MeCab-Ko와 Kiwi 간 품사 태그 변환 및 출력 형식 호환 기능을 포함합니다.

§Kiwi 소개

Kiwi(Korean Intelligent Word Identifier)는 C++로 작성된 고성능 한국어 형태소 분석기입니다. 세종 품사 태그 체계를 기반으로 하며, 일부 확장 태그를 포함합니다.

§품사 태그 매핑

MeCab-Ko와 Kiwi는 대부분의 품사 태그를 공유하지만, 일부 차이점이 있습니다:

  • MeCab-Ko의 NNBC (단위 의존 명사)는 Kiwi에서 NNB로 통합
  • MeCab-Ko의 SSO/SSC (여는/닫는 괄호)는 Kiwi에서 SS로 통합
  • MeCab-Ko의 SC (구분자)는 Kiwi에서 SP로 매핑
  • MeCab-Ko의 SY (기타 기호)는 Kiwi에서 SO로 매핑
  • Kiwi의 웹 관련 태그 (W_URL, W_EMAIL 등)는 MeCab-Ko의 SL로 매핑

§Example

use mecab_ko_core::kiwi_compat::{KiwiPosTag, to_kiwi_tag, from_kiwi_tag};
use mecab_ko_core::pos_tag::PosTag;

// MeCab -> Kiwi 변환
let kiwi_tag = to_kiwi_tag(PosTag::NNG);
assert_eq!(kiwi_tag, KiwiPosTag::NNG);

// Kiwi -> MeCab 변환
let mecab_tag = from_kiwi_tag(KiwiPosTag::NNG);
assert_eq!(mecab_tag, PosTag::NNG);

// 문자열 파싱
let tag = KiwiPosTag::from_str("NNG").unwrap();
assert_eq!(tag.as_str(), "NNG");

Structs§

KiwiToken
Kiwi 호환 토큰 구조체

Enums§

KiwiPosTag
Kiwi 품사 태그

Functions§

from_kiwi_tag
Kiwi 품사 태그를 MeCab-Ko 품사 태그로 변환
to_kiwi_tag
MeCab-Ko 품사 태그를 Kiwi 품사 태그로 변환