• 제목/요약/키워드: 지명사전

검색결과 48건 처리시간 0.023초

미등록어 처리가 강화된 복합명사 분해 (Compound Noun Analysis Strengthened Unknown Noun Processing)

  • 김응균;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-46
    • /
    • 2003
  • 본 논문에서는 분해 패턴을 이용한 재사용 분해 알고리즘과 외래어 인식, 이름 명사 인식, 지명 인식에 의한 미등록어 추정을 이용한 복합명사 분해 방법을 제안한다. 재사용 분해 알고리즘은 현재 분해되는 음절보다 짧은 길이의 음절에서 사용된 분해 방법을 재사용하여 분해가 이루어짐을 의미한다. 외래어 인식에서는 한국어 음절에서 비교적 사용 빈도가 낮은 음절들로 외래어가 구성이 됨을 이용한다. 이름 명사는 한국인의 이름 특성에서 한자 독음을 차용하여 작명이 이루어지기 때문에 일정한 수의 음절이 반복적으로 사용되는 점을 이용하여 인식한다. 지명 인식 방법은 지명이 출현하는 패턴을 분석하여 지명 사전의 검색으로 인식한다. 이와 같이 지명 사전에 의한 지명 인식과 알고리즘에 의한 외래어 및 이름 명사 인식 방법을 사용함으로써 미등록어 추정에 정확성을 높이고 분해 정확율 향상에 기여한다. 실험 결과 미등록어가 포함된 약 1,500어절에 대해 약 98%의 정확율이 나타났고, 미등록어가 사전에 모두 등재된 후의 실험에서는 약 99%의 정확율을 보였다.

  • PDF

규칙을 적용하여 세분화한 사전기반의 한국어 지명인식 시스템 연구 (A Study on Recognition of Korean Place Names System on the Internet by Using the Rules of Dictionary Use)

  • 장혜숙;정규철;이진관;박기홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.1097-1100
    • /
    • 2005
  • 개체명 인식에 있어서 반드시 선행되어야 할 작업이 문서의 내용을 대표하는 용어의 추출이다. 높은 신뢰도의 개체명 인식은 정보추출 시스템구축을 한 차원 높일 수 있을 것이다. 지금까지 일반적인 개체명 인식이나 인명의 개체명 인식에 대한 많은 연구가 활발하게 진행되어 왔지만 세분화된 지명 인식의 연구는 다루어지지 않았다. 본 논문에서는 수작업으로 작성된 규칙을 적용하여 세분화한 사전기반의 한국어 지명인식 시스템 개발 방법을 제안한다.

  • PDF

해외에서의 한국지명 표기 실태 분석 (Analysis on Romanization of Korean Geographical Names in Foreign Countries)

  • 김선희;박경;이해미
    • 대한지리학회지
    • /
    • 제44권6호
    • /
    • pp.706-722
    • /
    • 2009
  • 본 연구는 해외에서의 한국지명 표기실태를 분석하여 오류시정 및 관리방안을 모색하는데 목적을 두고 있다. 해외지명사전, 지명데이터베이스, 온라인 지도서비스 사이트 등에 수록된 한국지명을 분석한 결과 상당수 표기상의 문제점을 발견할 수 있었다. 주요 표기상의 문제점으로는 이명표기, 종속병기, 중복표기, 철자문제, 행정단위오류, 위치오류 등을 들 수 있으며, 오류형태와 방식은 보다 다양하게 나타나고 있었다. 이에 오류시정을 위한 대응방안으로 오류지명에 대한 적극적인 시정노력과 지속적인 모니터링, 민 관의 합의에 의한 한국지명의 영문표기 표준화 구축, 지명정보의 신속한 업데이트와 홍보, 미등재 또는 미표기 지명목록 작성 및 우선적 등재노력, 지명관리 주체의 단일화와 독립성 등이 요구된다.

KONG-DB: 웹 상의 어휘 사전을 활용한 한국 소설 지명 DB, 검색 및 시각화 시스템 (KONG-DB: Korean Novel Geo-name DB & Search and Visualization System Using Dictionary from the Web)

  • 박성희
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.321-343
    • /
    • 2016
  • 본 연구의 목적은 1) 소설 속 지명 데이터베이스(DB)를 구축하고, 2) 확장 가능한 지명 DB를 위해 자동으로 지명을 추출하여 데이터베이스를 갱신하며, 3) 데이터베이스 내의 소설지명과 용례를 검색하고 시각화하는 파일럿시스템을 구현하는 데 있다. 특히, 학습자료(training)에 해당하는 말뭉치(corpus)를 확보하기 어려운, 소설지명과 같이 현재 잘 쓰이지 않는 개체명을 자동으로 추출하는 것은 매우 어려운 문제이다. 효과적인 지명 정보 추출용 학습자료 말뭉치 확보 문제를 해결하기 위해 본 논문에서는 이미 수작업으로 구축된 웹 지식(어휘사전)을 활용하여 학습에 필요한 충분한 양의 학습말뭉치를 확보하는 방안을 적용하였다. 이렇게 확보된 학습용 코퍼스와 학습된 자동추출 모듈을 가지고, 새로운 지명 용례를 찾아 추가하는 지명 데이터베이스 확장 도구를 만들었으며, 소설지명을 지도 위에 시각화하는 시스템을 설계하였다. 또한, 시범시스템을 구현함으로써 실험적으로 그 타당성을 입증하였다. 끝으로, 현재 시스템의 보완점을 제시하였다.

한국어 지명 인식 처리를 위한 사전기반의 규칙 적용을 위한 세분화된 시스템 연구 (A Study on Recognition of Korean Place Names System on the Internet by Using the Rules of Dictionary Use)

  • 장혜숙;정규철;이진관;박기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.301-304
    • /
    • 2005
  • 문서의 내용을 대표하는 용어를 추출하는데 있어서 반드시 선행되어야 할 작업이 개체명 인식이다. 개체명의 범주로는 인명, 지명, 단체명, 시간, 날짜등이 있다. 높은 신뢰도의 개체명 인식은 정보추출 시스템구축을 한 차원 높일 수 있을 것이다. 일반적인 개체명 인식이나 인명의 개체명 인식에 대한 연구는 활발하게 진행되어 왔다.. 그러나 세분화된 지명 인식의 연구는 다루어지지 않았다. 본 논문에서는 한국어 지명 인식 처리를 위한 사전기반의 세분화된 규칙 적용 시스템 연구방법을 제안하고자 한다.

  • PDF

북한의 지명관리 정책과 연구 동향 분석 (Progress of Management Policy and Research of Place Names in North Korea)

  • 김기혁
    • 한국지역지리학회지
    • /
    • 제19권1호
    • /
    • pp.14-30
    • /
    • 2013
  • 1945년 분단 이후 북한은 지명을 사회주의 혁명의 도구로서 이용하였고, 언어 정책의 일환으로 이를 관리하였다. 1952년 행정구역 개편과정에서 시 군 리 지명을 언어 관리 차원에서 바꾸었고, 1966년 지명조사 사업의 완료 이후 주체사상을 반영하면서 지명을 관리하였다. 지명의 전부 요소에 고유어와 인명을 이용한 지명이 적지 않게 등장하였고, 후부 요소도 남한과는 다른 용어를 사용하기 시작하였다. 지명 관리의 일환으로 사전을 적극적으로 편찬하였다. 지명 연구는 사회성과 역사성을 반영한 논문들이 발표되고 있다. 연구 주제는 1990년대 이전에는 사회주의 지명을 찬양하는 글들이 많아 발표되나 2000년대 이후에는 지역 내에서 지명 특성을 소개하는 글들의 비중이 높아졌다. 이 시기에는 지명으로 학위를 취득한 학자들이 증가하면서 이전의 연구 내용과 차이를 보이고 있다.

  • PDF

신라시대 비단과 양잠에 대한 연구 (The Investigation silk fabrics and sericulture on Silla periods)

  • 이광우;이준희;석희숙
    • 한국염색가공학회:학술대회논문집
    • /
    • 한국염색가공학회 2011년도 제45차 학술발표회
    • /
    • pp.23-23
    • /
    • 2011
  • 신라는 유잠국을 거쳐 새로운 비단이라는 신라(新羅)로 국호를 변경한다. 신라 뽕나무와 비단의 행방을 �O는다면 실크로드의 출발점이 한반도의 신라의 땅이라는 추정에 의거하여 1995년부터 조사를 하였다. 특히 삼국사기의 내용을 기초로 하여 한반도의 지명을 방문하여 조사하는 과정에서 삼국사기의 내용이 전혀 한반도에는 정확하게 일치하지 않는다는 사실을 확인하였다. 1. 신라는 한반도에 없었다. 최근 한학자이신 이중재님이 발표한 논문과 책자를 기초로 조사 검정을 하는 중에 고구려, 신라 백제가 한반도에 없었다는 사실을 확인 하였다. 2. 중국고금지명대사전(1931)을 중국 청도에서 섬유공장장으로 근무하는 정윤화친구의 도움으로 구입하여 이중재의 책의 내용을 검정하였다. 그러므로 신라의 비단과 양잠을 한반도에서 확인하는 것은 잘못된 사실이라는 것을 확인하였다. 3. 삼국사기의 내용을 중국고금지명사전을 이용하여 확인한 결과 그동안 의문으로 되어 있는 임라설, 가야설, 고구려 신라 백제의 강역, 문익점 선생의 최초의 목화에 대한 사실 등 모든 사실을 잘못된 내용이라는 것을 확인 검정하였고, 현재의 한반도의 역사는 식민주의 역사학자들이 한반도의 역사를 왜곡한 사실을 확인하였다. 4. 한반도에서는 고려시대 이전에는 나라 형태의 국가는 없었고, 조선시대부터 국가의 형태가 성립되었다.

  • PDF