Skip to main content

Module analysis_mode

Module analysis_mode 

Source
Expand description

사용자 정의 분석 모드

다양한 분석 요구사항을 지원하는 분석 모드를 제공합니다.

§개요

기본 토크나이저는 모든 형태소를 반환하지만, 많은 NLP 작업에서는 특정 품사만 필요하거나, 원형 복원이 필요한 경우가 있습니다.

이 모듈은 다음 기능을 제공합니다:

  • 품사 필터링 (명사, 동사, 형용사 등)
  • 원형 복원 (동사/형용사 → 기본형)
  • 커스텀 분석 모드 조합

§Example

use mecab_ko_core::analysis_mode::{AnalysisMode, PosFilter, AnalyzerConfig};
use mecab_ko_core::tokenizer::Tokenizer;

let mut tokenizer = Tokenizer::new().unwrap();

// 명사만 추출
let config = AnalyzerConfig::new(AnalysisMode::NounsOnly);
let nouns = config.analyze(&mut tokenizer, "한국어 형태소 분석기");

// 커스텀 품사 필터
let filter = PosFilter::new()
    .include_nouns()
    .include_verbs();
let config = AnalyzerConfig::with_filter(filter);
let tokens = config.analyze(&mut tokenizer, "아버지가 방에 들어가신다");

Structs§

AnalyzedToken
분석된 토큰
AnalyzerConfig
분석기 설정
PosFilter
품사 필터

Enums§

AnalysisMode
분석 모드
LemmatizationMode
원형 복원 설정

Functions§

extract_adjectives
편의 함수: 형용사만 추출
extract_content_words
편의 함수: 내용어만 추출
extract_lemmas
편의 함수: 원형 복원된 형태소 추출
extract_nouns
편의 함수: 명사만 추출
extract_verbs
편의 함수: 동사만 추출