Expand description
Lucene Nori 호환 레이어
Apache Lucene의 한국어 분석기 Nori와 호환되는 인터페이스를 제공합니다.
§주요 기능
NoriTokenizer: Nori 스타일 토크나이저NoriAnalyzer: 분석기 래퍼 (사용자 사전, stoptags 지원)- POS 태그 매핑:
MeCab↔ Nori 변환
§예제
use mecab_ko_core::nori_compat::{NoriTokenizer, DecompoundMode};
let mut tokenizer = NoriTokenizer::new(DecompoundMode::Mixed, true).unwrap();
let tokens = tokenizer.tokenize("형태소분석기").unwrap();
for token in tokens {
println!("{}: {}", token.surface, token.pos_tag);
}Structs§
- Nori
Analyzer - Nori 분석기
- Nori
Token - Nori 토큰
- Nori
Tokenizer - Nori 토크나이저
Enums§
- Decompound
Mode - Nori 복합명사 분해 모드
- Word
Type - 단어 타입
Functions§
- mecab_
to_ nori_ tag MeCab태그를 Nori 태그로 변환- nori_
to_ mecab_ tag - Nori 태그를
MeCab태그로 변환 (부분 변환)