• 제목/요약/키워드: 정보의 모호성

검색결과 492건 처리시간 0.025초

위키피디아 링크 데이터를 이용한 Neural Network Model 기반 한국어 개체명 연결 (Neural Network Model for Named Entitiy Linking using Wikipedia Link Data)

  • 이영훈;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.163-166
    • /
    • 2018
  • 개체명 연결이란 주어진 문장에 출현한 단어를 위키피디아와 같은 지식 기반 상의 하나의 개체와 연결하여 특정 개체가 무엇인지 식별하여 모호성을 해결하는 작업이다. 본 연구에서는 위키피디아의 링크를 이용하여 개체 표현(Entity mention)과 학습 데이터, 지식 기반을 구축한다. 또한, Mention/Context 쌍의 표현과 Entity 표현의 코사인 유사도를 이용하여 Score를 구하고, 이를 통해 개체명 연결 문제를 랭킹 문제로 변환한다. 개체의 이름과 분류뿐만 아니라 개체의 설명, 개체 임베딩 등의 자질을 이용하여 모델을 확장하고 결과를 비교한다. 확장된 모델의 개체 링킹 성능은 89.63%의 정확도를 보였다.

  • PDF

형태소 분석 주도의 한국어 복합동사 처리 (Morphological Analysis Driven Processing of Compound Verbal in Korean)

  • 이기오;김기철;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.119-127
    • /
    • 1994
  • 복합동사의 처리는 기계변역이나 자연어 이해 시스템의 질에 상당한 영향을 주기 때문에 복합동사의 정확한 분석과 처리는 중요하다. 기종의 형태소 분석에서는 복합동사에 대한 처리를 복합 동사를 구성하는 각 용언들에 대한 분석결과를 생성하여 주고 구문분석단계에서 문법규칙을 이용하여 처리함으로써 문법이 커지고 파싱테이블과 심볼테이블이 커져 메모리 효율이 저하되고 형태소 분석에서의 품사 모호성이 구문분석단계에 영향을 주어 구문구조 모호성을 야기하며 복합동사의 정확한 의미를 나타내기 어려운 문제를 가진다. 본 논문은 한국어의 복합동사를 형태소 분석단계에서 처리해 주고 여기에서 처리하기 힘든 복합동사는 사전과 구문분석단계 등의 모듈에서 처리하는 총괄적인 복합동사 처리방법을 제안한다.

  • PDF

연관 관계와 TF*IDF를 이용한 검색 결과 Re-Ranking (Re-ranking for Search result using association relationship and TF*IDF)

  • 이정훈;전서현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.349-352
    • /
    • 2010
  • 질의를 이용한 정보 검색 기술에서 단어 의미의 모호성에 의해 사용자가 검색 하고자 하는 주제 이외의 문서 까지 검색되고 있다. 이러한 문제는 모바일기기의 검색 환경에서 두드러진다. 모바일에서의 검색은 문서의 로딩속도가 느리며 작은 화면에 의해 스크롤이 잦다. 그러므로 원하는 검색 결과가 검색 첫 페이지 이외에 위치하거나, 또는 페이지 하단에 위치할 경우 검색 결과를 확인하는 대에 많은 시간과 노력이 필요하다. 이러한 문제를 해결하기위해선 단어 의미의 모호성을 해결하고 사용자가 검색하고자하는 주제의 검색결과를 검색 상위에 위치시킬 수 있는 방법을 필요로 한다. 이 연구에서는 연관 단어 추출과 TF*IDF를 이용하여, 검색결과를 re-ranking하는 방법을 제시한다.

  • PDF

의미 부착이 없는 데이터로부터의 학습을 통한 의미 중의성 해소 (Word Sense Disambiguation From Unlabelled Data)

  • 박성배;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.330-332
    • /
    • 2000
  • 의미 모호성 해소는 문맥상의 한 단어의 올바른 의미를 밝히는 것으로, 대부분의 자연언어처리 응용에서 가장 중요한 문제 중 하나이다. 말뭉치로부터 얻어진 예제로부터 의미 모호성 해소 방법을 학습하기 위해서는 답이 알려져 있는 대량의 학습 예제가 필요하지만, 답이 알려져 있는 예제를 구하는 일은 사람의 간섭을 필요로 하므로 매우 비싼 작업이다. 본 논문에서는 답이 알려져 있는 학습 예제로 어느 정도 학습한 수, 답이 알려져 있지 않은 예제로 학습을 보충하는 방법을 통해 사람의 간섭을 최소화하였다. 결정트리 학습을 통한 한국어 명사에 대한 의미 결정 실험 결과, 본 논문에서 제안한 방법은 가장 많은 분포를 보이는 의미를 선택하는 경우보다 평균적으로 33.6%의 성능 향상을 보이며, 이는 전체 학습 예제의 답이 모두 알려져 있는 경우와 거의 비슷한 결과이다. 따라서, 한국어와 같이 신뢰할 만한 의미 부착 말뭉치가 없는 경우에 본 논문에서 제시된 방법은 매우 효율적이다.

  • PDF

원자력 발전소 내장형 Digital Plant Protection System의 정형적 설계 (Formal Design for Nuclear Power Plant Embedded Digital Plant Protection System)

  • 김진현;김일곤;성창훈;이나영;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.88-90
    • /
    • 2001
  • 원자력 발전소 내장형 시스템은 안정성과 신뢰성이 절대적으로 요구되는 Safety-critical 시스템이다. 이러한 시스템의 설계는 모호성이 없는 정형명세 언어로 설계함으로 설계자와 구현자 사이의 모호성 없는 의사전달을 달성할 수 있다. 이러한 특히 원자력 발전소 내장형 시스템의 설계에 있어서 설계자는 그가 설계한 설계를 시험(Validation)하고 검증(Verification)하는 기법을 필요로 하게 된다. 특히 시스템이 복잡해질수록 설계도 내의 오류를 발견하지 못할 가능성이 커진다. 본 논문에서는 시스템이 가질 수 있는 모든 상태를 만들어내어 검사하는 형태의 검증 기법인 정형기법을 통하여 Safety-critical 한 내장형 시스템의 설계를 검증함으로 보다 완벽한 시스템을 설계하는 기법을 제안한다.

LSTM 을 활용한 가치주와 성장주 분류 모형 개발에 대한 연구 (A study on the development of a classification model for value stocks and growth stocks using LSTM)

  • 왕재형 ;김광수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.440-441
    • /
    • 2023
  • 가치주와 성장주의 정의는 모호하다. 그렇기에 사회에 다양한 혼란이 빚어지고 있다. 본 연구에서는 그 모호성으로 인해 생기는 혼란을 줄이고자 새로운 주식 종목 분류 모형을 제안한다. 유명 성장 지수와 가치 지수 내 종목을 통해 지도 학습이 가능한 환경에서, 종목들의 주가 등에서 새로운 지표를 만들어낸 후, 그 지표를 LSTM 모델을 통한 기계학습으로 학습하는데 활용한다. 보이지 않는 패턴을 학습한 모델을 검증기에 부착해 모호한 주식을 분류하는데 응용할 수 있다.

XML 문서에서의 펜 기반 교정 인터페이스 (A Pen-based Proofreading Interface in XML Documents)

  • 손원성;김재경;최윤철;임순범;김우성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권2호
    • /
    • pp.231-242
    • /
    • 2006
  • 펜 기반 교정 환경에서 정확한 마킹영역을 판별하기 위해서는 사용자가 드로잉한 교정마킹과 문서영역간의 관계를 판별하는 과정에서 발생하는 모호성(ambiguity)을 해결하여야 한다. 또한 웹 및 XML과 같은 구조문서 환경에서는 변경된 문서구조가 반드시 정의된 DTD에 따라야 한다. 본 논문에서는 자유형 마킹에 의한 교정부호 입력이 가능하며, 교정 마킹과 원본문서의 영역을 판별하는 과정에서 발생하는 모호성 문제를 최소화하기 위한 컨텍스트 기반의 영역인식 및 보정 인터페이스(Context-based Proofreading Interface)를 제안한다. 제안 인터페이스에서는 교정부호의 입력에 따른 문서내용 및 구조의 변화가 발생할 경우 올바르게 문서 구조를 유지하기 위한 구조변경 방법을 제공한다. 그 결과 본 논문에서 생성된 교정 마킹 정보는 기존 교정시스템에 비하여 보다 정확한 영역정보를 포함할 수 있으며, 교정부호 입력에 따른 구조문서 변경시에도 원본문서의 DTD에 따르는 문서구조를 유지할 수 있다.

기계번역에서 동사 모호성 해결에 관한 하이브리드 기법 (A Hybrid Method of Verb disambiguation in Machine Translation)

  • 문유진;마르타파머
    • 한국정보처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.681-687
    • /
    • 1998
  • 본 논문에서는 기계번역에서 동사 번역의 모호성 해결을 위한 하이브리드 기법을 제안한다. 제안된 기법은 동사 번역을 위해 개념기반의 기법과 통계기반의 기법을 수행하는 알고리즘이다. 이를 위해 연어사전, WordNet과 말뭉치에서 추출한 통계 정보를 이용한다. 동사 번역의 모호성을 해결하기 위하여 이 알고리즘은 기계번역의 트랜스퍼 단게에서 번역할 동사의 번역어를 찾는다. 그러나 만일 적절한 번역어를 찾지 못하게 되면, Wordnet을 참조하여 번역 문장에서 동사의 논리적 제약어와 연어사전의 논리적 제약어들 사이의 단어간 유사도를 측정하여 번역어를 찾는다. 그리고 이와 동시에 이 알고리즘은 말뭉치에서 추출한 통계 정보를 참조하여 공기 유사도를 측정하여 번역어를 찾는다. 실험 결과, 이 알고리즘은 번역 정확성에서 기존의 다른 알고리즘보다 우수하며, 특히 연어기반의 기법과 비교할 때 약 24.8% 정도의 번역 정확성이 향상된 것으로 나타나고 있다.

  • PDF

백과사전 질의응답을 위한 격틀 기반 의존관계 분석 (Dependency Relation Analysis using Case Frame for Encyclopedia Question-Answering System)

  • 임수종;정의석;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.167-172
    • /
    • 2004
  • 백과사전에서 정답을 찾기 위한 정보 중의 하나로 구조분석 정보를 이용하기 위하여 의존 관계 분석을 통해 정확한 구조분석에 대한 연구를 하였다. 정답을 찾기 위한 대상이 되는 용언과 논항의 관계를 파악하기 위해 먼저 의존관계 분석의 모호성 정도를 줄이기 위해 문장을 구묶음으로 나누었고 나눠진 구묶음에서 중심어와 중심어에 해당하는 의미코드를 추출하였다. 이렇게 구분된 구묶음 간의 의존관계를 파악하기 위하여 주로 격틀과 의미코드에 의존하는 의미자질, 거리 자질, 격관계 자질, 절형태 자질을 이용하여 의존관계 모호성을 해소하였다. 백과사전의 특성상 생략되는 성분과 연속 동사 처리를 하여 보다 정확하게 백과사전 QA시스템에서 정답을 찾을 수 있는 정보를 제공하도록 하였다. 실험결과 동사구와 명사구의 의존관계는 89.43의 성능을 보였고 의존관계에 격을 부여한 경우는 78.40%의 정확율, 백과사전 후처리에 해당하는 복원은 68.23의 성능을 보인다.

  • PDF

XML DTD 모호성 제거와 DOM 활용을 위한 디자인 패턴 연구 (A Study of XML Design Patterns for Removing Ambiguity in DTD and Using DOM in XML Application)

  • 김태현;고승규;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.412-414
    • /
    • 2000
  • XML(eXensible Markup Language)은 차세대 인터넷 기술의 대표적인 기술 요소로서 현재 놀라운 속도로 발전하고 있으며 다양한 인터넷 응용분야에서 적용하고 있다. 이런 추세는 XML 어플리케이션을 복잡화, 대형화시키고 있으며 이로 인하여 XML 어프리케이션 개발과 유지 보수가 점점 어려워지고 있다. 이러한 문제점을 해결키 위해 객체지향 개발 방법론애 적용되어온 디자인 패턴(Design Patterns) 개념을 XML 개발 관련 분야에 적용시키는 연구가 이루어지고 있다. 본 논문에서는 XML 디자인 패턴 중 DTD(Document Type Definition) 모델링 시 발생하는 모호성(Ambiguity) 문제를 해결키 위한 패턴과 DOM을 효율적으로 처리하기 위한 문서 구조 트리 운행 및 접근 패턴을 제안한다. 이 패턴들을 활용한다면 DTD 설계 및 DOM(Document Object Model)을 처리하는 단계에서 재사용이 가능해져 개발된 기술들을 공유 가능하며 시스템 디자인 시에 발생 가능한 문제점들을 사전에 해결할 수 있다.

  • PDF