품사 태그

MeCab-Ko는 세종 품사 태그 체계를 기반으로 하며, mecab-ko-dic의 확장 태그를 포함합니다.

품사 태그 개요

대분류

대분류설명태그 예시
체언명사류NNG, NNP, NNB, NR, NP
용언동사, 형용사류VV, VA, VX, VCP, VCN
관형사관형사MM
부사부사류MAG, MAJ
감탄사감탄사IC
조사조사류JKS, JKC, JKG, JKO, JKB, JKV, JKQ, JX, JC
어미어미류EP, EF, EC, ETN, ETM
접사접두사, 접미사XPN, XSN, XSV, XSA
어근어근XR
부호문장부호, 외국어 등SF, SP, SS, SE, SO, SW, SL, SH, SN

체언 (명사류)

NNG - 일반 명사

일반적인 사물이나 개념을 나타내는 명사

사과, 컴퓨터, 사랑, 행복, 분석

예시:

오늘 날씨가 좋습니다
     ↓
오늘/NNG  날씨/NNG  가/JKS  좋/VA  습니다/EF

NNP - 고유 명사

특정 사물이나 사람의 이름

서울, 한국, 김철수, 삼성, 앤트로픽

예시:

서울에서 회의가 있습니다
  ↓
서울/NNP  에서/JKB  회의/NNG  가/JKS  있/VA  습니다/EF

NNB - 의존 명사

단독으로 쓰이지 못하고 관형어 뒤에 오는 명사

것, 수, 줄, 바, 뿐, 만큼, 데

예시:

할 수 있다
  ↓
하/VV  ㄹ/ETM  수/NNB  있/VA  다/EF

NR - 수사

숫자를 나타내는 말

하나, 둘, 셋, 첫째, 열

NP - 대명사

명사를 대신하는 말

나, 너, 우리, 이것, 저것, 그것

용언 (동사/형용사류)

VV - 동사

동작이나 작용을 나타내는 말

가다, 먹다, 하다, 분석하다

예시:

밥을 먹는다
  ↓
밥/NNG  을/JKO  먹/VV  는다/EF

VA - 형용사

상태나 성질을 나타내는 말

크다, 작다, 아름답다, 빠르다

VX - 보조 용언

본용언 뒤에서 의미를 보충

-아/어 보다, -아/어 주다, -아/어 가다

VCP - 긍정 지정사

이다

VCN - 부정 지정사

아니다

수식언

MM - 관형사

체언을 꾸미는 말

새, 헌, 옛, 이, 그, 저, 모든

MAG - 일반 부사

용언이나 문장을 꾸미는 말

매우, 아주, 잘, 빨리, 천천히

MAJ - 접속 부사

문장이나 단어를 연결하는 부사

그러나, 그리고, 하지만, 그래서

독립언

IC - 감탄사

감정이나 의지를 나타내는 말

아, 어머, 네, 아니요

조사

JKS - 주격 조사

이, 가

JKC - 보격 조사

이, 가 (서술격 조사 '이다' 앞)

JKG - 관형격 조사

JKO - 목적격 조사

을, 를

JKB - 부사격 조사

에, 에서, 로, 으로, 와, 과

JKV - 호격 조사

아, 야, 여, 이여

JKQ - 인용격 조사

라고, 고

JX - 보조사

은, 는, 도, 만, 까지, 조차, 부터

JC - 접속 조사

와, 과, 하고, 이랑

어미

EP - 선어말 어미

-시-, -었-, -겠-

EF - 종결 어미

-다, -습니다, -ㅂ니다, -어요

EC - 연결 어미

-고, -면, -어서, -지만

ETN - 명사형 전성 어미

-ㅁ, -기

ETM - 관형형 전성 어미

-ㄴ, -는, -ㄹ

접사

XPN - 체언 접두사

풋-, 늦-, 햇-

XSN - 명사 파생 접미사

-님, -적, -화

XSV - 동사 파생 접미사

-하-, -되-, -시키-

XSA - 형용사 파생 접미사

-롭-, -스럽-

XR - 어근

단독으로 쓰이지 못하는 형태소

부호

SF - 마침표, 물음표, 느낌표

. ? !

SP - 쉼표, 가운뎃점, 콜론, 빗금

, · : /

SS - 따옴표, 괄호, 줄표

" ' ( ) [ ] -

SE - 줄임표

...

SO - 붙임표 (물결, 숨김 등)

~

SW - 기타 기호

SL - 외국어

API, GPU, AI

SH - 한자

韓國, 人工

SN - 숫자

123, 456

복합 태그

분석 결과에서 +로 연결된 복합 태그가 나타날 수 있습니다:

세요 -> EP+EF (선어말어미 + 종결어미)

태그 필터링

명사 필터

#![allow(unused)]
fn main() {
let nouns: Vec<_> = tokens.iter()
    .filter(|t| t.pos.starts_with("NN"))
    .collect();
}

동사/형용사 필터

#![allow(unused)]
fn main() {
let verbs: Vec<_> = tokens.iter()
    .filter(|t| t.pos.starts_with("VV") || t.pos.starts_with("VA"))
    .collect();
}

내용어(실질 형태소) 필터

#![allow(unused)]
fn main() {
let content_words: Vec<_> = tokens.iter()
    .filter(|t| {
        t.pos.starts_with("NN") ||  // 명사
        t.pos.starts_with("VV") ||  // 동사
        t.pos.starts_with("VA") ||  // 형용사
        t.pos.starts_with("MA")     // 부사
    })
    .collect();
}

다른 시스템과의 매핑

MeCab-KoKiwi설명
NNGNNG일반 명사
NNPNNP고유 명사
VVVV동사
VAVA형용사
JKSJKS주격 조사

참고 자료