Expand description
사용자 정의 분석 모드
다양한 분석 요구사항을 지원하는 분석 모드를 제공합니다.
§개요
기본 토크나이저는 모든 형태소를 반환하지만, 많은 NLP 작업에서는 특정 품사만 필요하거나, 원형 복원이 필요한 경우가 있습니다.
이 모듈은 다음 기능을 제공합니다:
- 품사 필터링 (명사, 동사, 형용사 등)
- 원형 복원 (동사/형용사 → 기본형)
- 커스텀 분석 모드 조합
§Example
use mecab_ko_core::analysis_mode::{AnalysisMode, PosFilter, AnalyzerConfig};
use mecab_ko_core::tokenizer::Tokenizer;
let mut tokenizer = Tokenizer::new().unwrap();
// 명사만 추출
let config = AnalyzerConfig::new(AnalysisMode::NounsOnly);
let nouns = config.analyze(&mut tokenizer, "한국어 형태소 분석기");
// 커스텀 품사 필터
let filter = PosFilter::new()
.include_nouns()
.include_verbs();
let config = AnalyzerConfig::with_filter(filter);
let tokens = config.analyze(&mut tokenizer, "아버지가 방에 들어가신다");Structs§
- Analyzed
Token - 분석된 토큰
- Analyzer
Config - 분석기 설정
- PosFilter
- 품사 필터
Enums§
- Analysis
Mode - 분석 모드
- Lemmatization
Mode - 원형 복원 설정
Functions§
- extract_
adjectives - 편의 함수: 형용사만 추출
- extract_
content_ words - 편의 함수: 내용어만 추출
- extract_
lemmas - 편의 함수: 원형 복원된 형태소 추출
- extract_
nouns - 편의 함수: 명사만 추출
- extract_
verbs - 편의 함수: 동사만 추출