• 제목/요약/키워드: 어휘정보

검색결과 1,062건 처리시간 0.031초

국어 어휘의 역사 검색 프로그램 개발 (A Development of Retrieval Program for Korean Vocabulary History)

  • 두길수;황호천;김법균;안동언;정성종;이신원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.504-506
    • /
    • 2003
  • “국어 어휘의 역사 검색 프로그램 개발”은 국민들에게 국어 어휘에 대한 역사 정보를 제공하여 국어에 대한 지식과 이해의 폭을 넓힘으로써 국어 생활을 더욱 윤택하게 하고, 국어의 정확한 사용을 통하여 국민들의 의사소통의 정확성과 신속성을 제고함을 그 목적으로 한다. 아울러 이러한 국어 어휘 역사에 대한 정보를 컴퓨터 프로그램을 통하여 국민들에게 제공함으로써, 국민들의 국어 정보화에 기여함은 물론, 잊혀져만 가는 국어에 대한 역사적 사실을 밝혀 줌으로써, 국어의 보존에도 크게 기여하게 될 것이다. 따라서 이 연구는 거시적으로는 한민족 언어의 정보화를 확충시켜 나아가고, 미시적으로는 국민들의 국어에 대한 자긍심을 갖게 함으로써, 국어 발전의 기틀을 마련하는 데에 그 목적이 있다. 본 논문에서는 국어 어휘의 역사 검색 프로그램에 대한 개발 개요와 어휘의 시대별 분류 방식에 대해서 논한다.

  • PDF

어휘지도(UWordMap)를 이용한 용언의 다의어 중의성 해소 (Word Sense Disambiguation of Polysemy Predicates using UWordMap)

  • 배영준;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-170
    • /
    • 2013
  • 한국어 어휘의 의미를 파악하기 위하여 어휘의 의미 중의성을 해결하는 것은 중요한 일이다. 본 논문에서는 한국어 다의어 기반의 어휘 의미망과 용언의 논항정보 등의 관계가 포함된 어휘지도(UWordMap)를 사용하여 용언의 의미 중의성 해소에 대한 연구를 진행한다. 기존의 의미 중의성 해소 연구와 같은 동형이의어 단위가 아닌 다의어 단위의 용언 의미 중의성 해소 시스템을 개발하였다. 실험결과 실험말뭉치로 품사 태그 부착 말뭉치를 사용했을 때 동형이의어 단위 정확률은 96.44%였고, 다의어 단위 정확률은 67.65%였다. 실험말뭉치로 동형이의어 태그 부착 말뭉치를 사용했을 때 다의어 단위 정확률은 77.22%로 전자의 실험보다 약 10%의 높은 정확률을 보였다.

  • PDF

어휘지도(UWordMap)를 활용한 명사와 용언의 다의어 중의성 해소 (Noun and Verb Polysemy Word Sense Disambiguation Using UWordMap)

  • 신준철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.216-219
    • /
    • 2015
  • 컴퓨터를 이용하여 명사와 용언의 의미를 자동으로 분별하는 것은 기계번역이나 검색 등의 기술에서 아주 중요한 기반 기술이다. 최근에 동형이의어 분별에 대한 연구 결과로 약 96%의 정확률을 보이는 시스템이 개발되었으나, 다의어 분별에 대한 연구는 아직 초기 단계로 일부 어휘만을 한정하여 연구되고 있다. 본 논문에서는 어휘지도를 이용하여 다의어를 분별하는 방법을 연구하였고, 어휘지도에 등록된 모든 일반 명사와 용언을 대상으로 실험하였다. 제안된 알고리즘은 문장에서 나타나는 명사와 용언의 관계를 어휘지도에서 찾고, 그 정보를 기반으로 다의어를 분별하였다. 아직은 그 정확률이 실용적인 수준이라고 볼 수는 없지만, 전체 다의어를 대상으로 실험하였고, 그 실험 결과를 분석함으로써 앞으로의 다의어 분별 연구 방향에 도움될 것으로 판단된다.

  • PDF

감성 어휘 기반 인재검색을 위한 이미지 스케일과 감성 어휘 분류 체계 (Image Scaling and Emotional Vocabulary Classification System for Talent Retrieval Based on Emotional Vocabulary)

  • 김용우;박석천;홍석우;김태엽
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1030-1033
    • /
    • 2013
  • 면접자나 면접관이나 인재들이 해당 조직에서 일을 해보지 않고서는 조직문화와 직무에 적합한지에 대해 확신 할 수 없고 만약 적합하지 않다면 면접자나 조직이나 서로 피해를 입는 상황이 발생한다. 이러한 상황들을 개선하기 위해 감성 어휘를 기반으로 한 이미지 스케일과 감성어휘 분류 시스템을 분석한다. 또한 면접자들의 이력서와 자기소개서에 있는 단어들을 분석하여 조직문화와 해당 직무에 적합한 인재 선발에 참고 자료를 제공할 수 있는 감성 어휘를 기반으로 한 인재 검색 시스템에 기초가 되는 이미지 스케일과 감성 어휘 분류체계에 대해 연구한다.

VCOR를 이용한 효율적인 어휘 최적화 관리 (Efficient Vocabulary Optimization Management using VCOR)

  • 오상엽
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1436-1443
    • /
    • 2010
  • 어휘 인식 시스템에서는 처리되는 어휘가 나타나지 않는 미 출현 트라이 폰이 존재하는 단점이 있으며 이에 따른 신뢰도의 분포를 가지고 있지 않기 때문에 정규화를 수행할 수 없다. 따라서 이를 개선하기 위하여 미등록어 거절 알고리즘에서 사용되는 어휘 관리를 최적화하고 음소 단위로 데이터 탐색을 지원하는 VCOR 시스템을 제안한다. 또한 VCOR에서는 어휘 정보를 효율적으로 제공하기 위해 확장 facet 분류를 이용하여 사용자에게 어휘 단위의 정보를 제공하고, 어휘에 대한 향상된 추적 관리 가능을 제공하여 어휘에 대한 인식의 정확성을 제공한다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 97.56%, 어휘 독립 인식률은 96.23%의 인식률을 나타내었다.

술어를 활용한 명사 논항간의 유사도 계산 (Similarity Estimation of Argument Between Noun using Predicate)

  • 조병철;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-241
    • /
    • 2014
  • 본 논문에서는 명사간의 유사도 추정을 위하여 명사 어휘와 술어-논항 관계에 있는 동사들의 유사도를 측정하여 이를 활용하는 연구를 제안한다. 어휘 유사도 추정은 정보 통합과 정보 검색 분야에서 중요한 역할을 한다. 본 연구에서는 유사한 명사 어휘들은 유사한 문맥을 가지고 있으며 동시에 명사 어휘의 문맥에 있어 가장 중요한 문맥 정보는 명사 어휘와 직접적인 구문 관계를 가지고 있는 술어 정보임을 가정하였다. 실험을 위하여 본 연구에서 제시된 유사도와 명사 계층 클래스간의 유사도간의 상관관계를 계산하였다.

  • PDF

세종 의미 부류와 KorLex 명사 어휘 의미망 자동 맵핑 (Automatic Mapping of Korean Wordnet "KorLex" to Semantic Classes of Sejong Dictionary)

  • 소길자;윤애선;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.92-96
    • /
    • 2009
  • 인간이 가진 개념을 지식베이스화하려는 시도 중 하나로 의미망이 구축되고 있다. 한국어를 대상으로 한 어휘 의미망 중 프린스턴 대학의 WordNet을 대역한 KorLex는 1,2단계에서 한국어 어휘의미의 특성을 반영하여 개념 및 의미구조를 재구조화하고 있다. 그러나 현재 KorLex의 동의어 집합을 구성하는 어휘 의미에는 논항정보를 따로 구성할 수 없었다. 본 연구는 세종 전자 사전 격틀정보내의 선택제약조건(selectional restriction)으로 사용되고 있는 의미 부류와 KorLex의 명사 어휘 의미망을 자동 맵핑하는 방안을 제안함으로써 KorLex에서 세종 전자 사전 격틀정보를 활용할 수 있는 가능성을 제공한다.

  • PDF

실시간 영/한 번역을 위한 트랜스퍼 어휘 사전 (A Design of Transfer Lexicon Dictionary For English to Korean Translation)

  • 이대진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.11-27
    • /
    • 1991
  • 본 연구는 자연어의 실시간 기체 번역의 설계에 관한 것으로 반도체 메모리에 트랜스퍼 방식의 어휘 사전을 구성하고 어휘 정보 문법을 기본으로한다.

  • PDF

형태소 어휘 문맥에 기반한 태깅 오류 정정 (Tagging Error Correction Using Lexical Morpheme Context)

  • 김영길;양성일;홍문표;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.63-68
    • /
    • 2003
  • 본 논문에서는 형태소 분석 대상 어절의 좌우 어절내의 대표 형태소 어휘 문맥 정보에 기반한 형태소 오류 정정 방안을 제안한다. 현재까지 주변의 품사열 문맥 정보에만 의존하는 기존의 품사 태깅 모델과 달리 주변 어휘를 반영할 수 있는 좌우 어절 문맥을 이용해 형태소 태거의 성능을 향상시킬 수 있는 방법들이 제시되었다. 그러나 이러한 어절 문맥에 의한 지속적인 성능 향상을 위해서는 대량의 품사 태킹 문맥 정보를 필요로 한다. 따라서 본 논문에서는 이러한 자료 부족 문제를 해결하기 위하여 기존의 분석 대상 어절 좌우의 어절 단위의 어휘 문맥 정보가 아닌 좌우 어절내의 대표 형태소 단위의 형태소 어휘 문맥을 이용한 품사 태깅 오류 정정 방안을 제안한다. 실험을 통해, 형태소 어휘 단위의 문맥 정보의 적용성(Coverage)의 높고 기존의 품사 문맥 정보 기반의 형태소 분석기의 태깅 오류를 정정하여 그 정확성을 크게 향상시킬 수 있음을 보인다.

  • PDF

의견어중심의 의존트리패턴자질을 이용한 기계학습기반 한국어 블로그 문서 의견분류시스템 (Machine Learning Based Blog Text Opinion Classification System Using Opinion Word Centered-Dependency Tree Pattern Features)

  • 곽동민;이승욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.337-338
    • /
    • 2009
  • 블로그문서의 의견극성분류 연구는 주로 기계학습기법에 기반한 방법이었고, 이때 주로 활용된 자질은 명사, 동사 등의 품사정보와 의견어 어휘정보였다. 하지만 하나의 의견어 어휘만을 고려한다면 그 극성을 판별하는데 필요한 정보가 충분하지 않아 부정확한 결과를 도출하는 경우가 발생할 수 있다. 본 논문에서는 여러 어휘를 동시에 고려하였을 때 보다 정확한 의견분류를 수행할 수 있을 것이라는 가정을 세웠다. 본 논문에서는 효과적인 의견어휘자질의 추출을 위하여 의견이 내포될 가능성이 높은 의견어휘를 기반으로 의존구문분석을 통해 의존트리패턴을 추출하였고, 제안하는 PF-IDF가중치를 적용하여 지지벡터기계(SVM)와 다항시행접근 단순베이지안(MNNB)알고리즘으로 비교 실험을 수행하였다. 기준시스템인 TF-IDF가중치 기법에 비해 정확도(accuracy)가 지지벡터기계에서 5%, 다항시행접근 단순베이지안에서 8.9% 향상된 성능을 보였다.