• 제목/요약/키워드: 하위 범주

검색결과 416건 처리시간 0.026초

자연어 처리를 위한 의존 명사 하위 범주 분류 (Subcategorization of Dependent Nouns for NLP)

  • 유재원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.136-142
    • /
    • 1997
  • 의존 명사와 이를 꾸미는 관형어는 통사적으로 긴밀한 언어학적 단위를 이루므로 의존 명사에 대한 하위 범주 분류는 한국어 자연어 처리에 있어서 중요하다. 그러나 기존 국어 문법에서는 이 문제가 일관성 있게 다루어지지 않았다. 이 논문에서는 국어 사전(조재수 1997)에 올라 있는 의존 명사 600여 개를 허웅(1996)의 분류 기준을 보완하여 일관성 있게 하위 범주 분류를 시도하였다. 또 수량 단위 명사는 앞에 오는 수사의 종류에 따라 더 세분하였다.

  • PDF

한국어 격틀 사전과 용언의 하위 범주 정보를 사용한 한국어 의미역 결정 (Korean Semantic Role Labeling using Case Frame and Subcategory of Predicate)

  • 김완수;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.198-201
    • /
    • 2015
  • 의미역 결정은 문장의 서술어와 그 서술어에 속하는 논항들 사이의 의미관계를 결정하는 문제이다. 본 논문에서는 UPropBank 격틀 사전과 UWordMap의 용언의 하위 범주 정보를 이용하여 의미역을 부착하였다. 실험 결과 80.125%의 정확률로 의미역을 부착하는 성능을 보였다.

  • PDF

개념지식의 유형에 따른 표상 차이: 대상범주와 행위각본의 전형성 비교 (The Difference of Knowledge Representation: Comparison of Typicality Effects between Categories and Scripts)

  • 이재호;이정모;이건효;김성일
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.252-257
    • /
    • 2000
  • 개념지식인 범주지식과 각본지식의 표상 차이를 검증하기 위해서 두 개의 실험을 실시하였다. 실험 1 에서는 상위 개념을 점화단어로 제시하고 하위 개념을 목표단어로한 명명과제를 실시하였다. 전형조건이 비형성조건에 비해서 명명시간이 빨랐다. 범주지식에서는 전형성의 효과가 관찰되었지만 각본지식에서는 전형성 효과가 관찰되지 않았다. 실험 2에서는 하위 개념을 점화단어로 제시하고 상위 개념을 목표단어로한 명명과제를 실시하였다. 범주지식이 각본지식에 비해서 명명시간이 빨랐으며, 범주지식에서는 전형성의 효과가 관찰되었지만 각본지식에서는 그 효과가 관찰되지 않았다. 이는 개념지식의 유형에 따라서 상위-하위 개념의 표상체계가 다르게 구성됨을 시사한다.

  • PDF

한국어 분석의 중의성 해소를 위한 하위범주화 사전 구축 (Development of Subcategorization Dictionary for the Disambiguation Korean Language Analysis)

  • 이수선;박현재;우요섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.257-264
    • /
    • 1999
  • 자연언어 처리에 있어 문장의 성분 구조를 파악하는 통사적 해석에서는 애매성 있는 결과가 많이 생성된다. 한국어의 경우 어순 등의 통사적 특성뿐 아니라 상황과 의미, 문맥이 문장의 분석에 더 중요한 역할을 하기 때문에 문맥 자유 문법에 의한 접근 방법만으로는 중의적 구조의 해결이 어렵다. 이는 또한 의미 분석시 애매성을 증가시키는 원인이 된다. 이러한 통사적, 의미적 중의성 해결을 위해 용언 중심의 하위범주화 사전을 구축하였다. 본 논문에서는 용언에 따라 제한될 수 있는 하위범주 패턴을 정의하고 패턴에 따라 하위범주 사전을 구축하였다. 하위범주화 사전에는 명사의 시소러스와 정합하여 보어를 선택 제한(Selectional Restriction)할 수 있도록 용언과 명사와의 의미적 연어 관계에 따라 의미마커를 부여했다. 말뭉치를 통해 수집된 용언 12,000여개를 대상으로 25,000여개의 하위범주 패턴을 구축하였고 이렇게 구축한 하위범주화 사전이 120,000여 명사에 대한 의미를 갖고 있는 계층 시소러스 의미 사전과 연동하도록 하였다. 또한 논문에서 구현된 하위범주화 사전이 구문과 어휘의 중의성을 어느 정도 해소하는지 확인하기 위해 반자동적으로 의미 태깅(Sense Tagging)된 2만여 문장의 말뭉치를 통해 검증 작업을 수행하고, 의존관계와 어휘의 의미를 포함하고 있는 말뭉치에 하위범주 패턴이 어느정도 정합되는지를 분석하여, 하위범주 패턴과 말뭉치의 의존관계만 일치하는 경우와 어휘의 의미까지 일치하는 경우에 대해 평가한다. 이 과정에서 하위범주 패턴에 대한 빈도 정보나, 연어 정보를 수집하여 데이터베이스에 포함시키고, 각 의미역과 용언의 통계적 공기 정보 등을 추출하는 방법도 제시하고자 한다.을 입증하였다.적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

신문기사정보 패싯 택소노미 구축 방안 - 예술 분야를중심으로 - (Plan of Constructing Facet Taxanomies of Information on News Articles - Focused on the area of Arts -)

  • 장인호
    • 한국도서관정보학회지
    • /
    • 제50권4호
    • /
    • pp.381-403
    • /
    • 2019
  • 신문기사를 주제 분야별로 나누고, 분야 내에서 각각의 범주들은 기본 패싯과 결합하는 패싯 택소노미 모형을 개발하였으며 구축 방안을 제시하고 패싯 택소노미를 구축하는 연구를 수행하였다. 패싯 택소노미는 신문기사를 주제 분야(정치, 경제 분야 등)로 나누고 범주(정치 분야의 경우, 정치일반, 행정, 사법 등) 및 하위 범주를 기본 패싯과 각각 결합한다. 하위 범주는 더욱 하위 구분할 수 있다. 택소노미는 범주 간의 계층 관계를 가질 수 있으며, 범주-패싯은 예를 들어, "예술"에 대해 '사람', '행위', '행사', '시간', '장소' 등과 결합한다. 그리고 예술의 하위 범주인 '미술', '음악', '무용' 등은 '예술'과 계층 관계를 이루어 추론과 브라우징에 활용할 수 있도록 구성하였다. 또한, 범주-패싯 결합은 기본 패싯순으로 계층 구조를 갖는다. 한편, 시험용 어휘 구축은 '예술 분야'를 대상으로 용어 145어를 본 연구에서 다루는 모든 구성요소를 포함하는 패싯 택소노미를 구축하고, 디스플레이를 예시하였다.

질의응답 시스템을 위한 술어정보 기반 질의분석 (Predicate-based Question Analysis for Korean Question-Answering System)

  • 김원남;신승은;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.296-300
    • /
    • 2004
  • 질의 응답 시스템이 정확한 정답을 제시하기 위해서는 사용자가 요구하는 정답의 유형을 결정할 필요가 있다. 질의분석의 일반적인 접근법으로는 의문사 정보, 규칙 그리고 통계 정보에 기반한 방법들이 있다. 본 논문에서는 술어정보를 이용한 질의분석을 제안한다. 먼저 의문사 정보를 이용하여 상위정답유형을 결정하고 질의문의 술어 정보와 구문 구조 정보를 이용하여 초점단어(focus word)를 추출한다. 초점단어란 정답유형을 결정하는데 단서가 되는 단어로써, 추출된 초점단어에 의해 75개의 하위정답유형 중 하나가 결정된다. 실험에 앞서 정답 유형별로 6개의 상위범주와 75개의 하위범주를 정의하였으며, 실험에는 학습 데이터의 일부와 일반 Web에서 수집한 테스트 데이터가 사용되었다. 실험결과 상위범주는 97.6%, 하위범주는 77.8%의 정확도를 보였으며 초점단어는 92.5%의 정확도를 보였다.

  • PDF

하위범주화 사전의 구축 및 자동 확장 (Development and Automatic Extraction of Subcategorization Dictionary)

  • 이수선;박현재;우요섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.179-181
    • /
    • 2000
  • 한국어의 통사적, 의미적 중의성 해결을 위해 하위범주화 사전을 구축하였다. 용언에 따라 제한될 수 있는 문형 패턴과 의미역(semantic roles) 정보의 표준을 정하여 이를 부가하였고 구축한 하위범주화 사전이 명사에 대한 의미를 갖고 있는 계층 시소러스 의미사전과 연동하도록 용언과 명사와의 의미적 연어 관계에 따라 의미마커를 부여했다. 논문에서 구현된 하위범주화 사전이 구문과 어휘의 중의성을 어느 정도 해소하는지 확인하기 위해 반자동적으로 의미 태깅(Sense Tagging)된 말뭉치와 구문분석된 말뭉치를 통해 검증 작업을 수행했다. 이 과정에서 자동으로 하위범주 패턴에 대한 빈도 정보나, 연어정보, 각 의미역과 용언의 통계적 공기 정보 등을 추출하여 하위범주화사전에 추가시켰다. 또한 여기서 얻은 정보를 기준으로 하위범주화 사전을 자동으로 확장하는 알고리즘을 적용하여 확장시켰다.

  • PDF

난청노인의 한국어판 음악지각과 참여와 관련된 삶의 질 설문지의 타당도와 신뢰도 (Validity and reliability of Korean version of quality of life questionnaire related with music perception and engagement of the elderly)

  • 이도혜;최철희
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.87-98
    • /
    • 2022
  • 음악은 일상생활의 어려움과 스트레스를 축소함으로 노인의 삶의 질에 긍정적인 영향을 미친다. 본 연구는 한국 노인들을 대상으로 음악지각과 참여와 관련된 한국어판 삶의 질 설문지를 개발하고자 한다. 한국어판 음악관련 삶의 질 설문지(Korean version of Music-Related Quality of Life, K-MRQoL)은 음악능력, 태도, 활동빈도(Part 1)과 음악능력, 태도, 활동중요성(Part 2)으로 구성되었고 각 하위범주는 11문항으로 구성된 음악지각과 7항목으로 구성된 음악참여로 구성되었다. 복지센터와 양로원의 난청 노인30명과 정상청력 노인 30명을 대상으로 피어슨, 크론바크 알파 상관계수와 독립 t 검사를 측정하었다. K-MRQoL의 전체점수와 하위범주(Part 1)간의 상관계수는 .701에서 .948이었고 하위범주(Part 2)간의 상관계수는 .598에서 .926이었다. K-MRQoL의 전체점수와 하위범주(Part 1) 간의 내적일관성은 .846에서 .931이었고 하위범주(Part 2) 간의 내적일관성은 .838에서 .918이었다. K-MRQoL의 전체 점수와 하위범주(Part 1과 2)의 검사-재검사의 상관계수는 각각 .979, .970, .979이었다. K-MRQoL과 의사소통 삶의 질척도(Quality of Communication Life Scale, QCL)와의 상관관계는 .449이었다. K-MRQoL 전체점수와 하위범주(Part 1과 2)는 건청과 난청 노인 간 통계적으로 의미있는 차이를 보였다. 따라서 한국어판 음악관련 삶의 질 설문지는 건청과 난청노인의 음악관련 삶의 질을 심층적으로 살펴볼 수 있는 유용한 임상적 도구임을 나타낸다.

다의어 분별 정확률 개선을 위한 보조사의 통사격 결정 (Determining a Syntactic Case of Auxiliary Postposition for Improving Accuracy of Polysemy Word-Sense-Disambiguation)

  • 신준철;옥철영
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.102-104
    • /
    • 2016
  • 하위범주화는 술어와 보어간의 의존 관계를 정의하는 언어정보로서 다의어 태깅이나 이 외에 자연어처리의 다양한 곳에 이용될 수 있다. 그러나 하위범주화에서 다루는 필수논항은 격조사로 표현되어 실제로 한국어에서 자주 나타나는 보조사는 여기에 포함되지 않는다. 이런 문제 때문에 하위범주화네 나타난 격조사만을 그대로 이용하려고 하면 재현율에 큰 문제가 발생하게 된다. 본 논문에서는 문장에서 격조사 대신 보조사가 사용되었을 때 하위범주화의 필수논항으로 인정할 수 있는 방법을 제시하고, 특히 보조사에 적용할 경우에 생기는 이점을 실험으로 증명한다.

  • PDF

다의어 분별 정확률 개선을 위한 보조사의 통사격 결정 (Determining a Syntactic Case of Auxiliary Postposition for Improving Accuracy of Polysemy Word-Sense-Disambiguation)

  • 신준철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-104
    • /
    • 2016
  • 하위범주화는 술어와 보어간의 의존 관계를 정의하는 언어정보로서 다의어 태깅이나 이 외에 자연어처리의 다양한 곳에 이용될 수 있다. 그러나 하위범주화에서 다루는 필수논항은 격조사로 표현되어 실제로 한국어에서 자주 나타나는 보조사는 여기에 포함되지 않는다. 이런 문제 때문에 하위범주화네 나타난 격조사만을 그대로 이용하려고 하면 재현율에 큰 문제가 발생하게 된다. 본 논문에서는 문장에서 격조사 대신 보조사가 사용되었을 때 하위범주화의 필수논항으로 인정할 수 있는 방법을 제시하고, 특히 보조사에 적용할 경우에 생기는 이점을 실험으로 증명한다.

  • PDF