Skip to main content

Module normalizer

Module normalizer 

Source
Expand description

§Foreign Word Normalization Module

외래어 표기 정규화 모듈 - 국립국어원 외래어 표기법 기반

§Features

  • 외래어 변이형 정규화 (커피/코피, 쿠버네티스/쿠베르네테스)
  • 장단음 정규화
  • 자음/모음 변이 처리
  • 받침 변이 처리
  • 발음 유사성 기반 fuzzy matching

§Example

use mecab_ko_core::normalizer::{Normalizer, NormalizationConfig};

let normalizer = Normalizer::new(NormalizationConfig::default()).unwrap();

// 표준형으로 정규화
let normalized = normalizer.normalize("코피");
assert_eq!(normalized, "커피");

// 변이형 목록 조회
let variants = normalizer.get_variants("커피");
assert!(variants.contains(&"코피".to_string()));

// 변이형 여부 확인
assert!(normalizer.is_variant("커피", "코피"));

Structs§

NormalizationConfig
정규화 설정
NormalizationRule
정규화 규칙
Normalizer
외래어 정규화기

Enums§

RuleType
정규화 규칙 타입