• 제목/요약/키워드: 어휘정보

검색결과 1,065건 처리시간 0.029초

도서관 링크데이터(Library Linked Data) 현황분석과 통합 LLD 설계 및 확산방향에 대한 고찰 (Analyzing Current State of Library Linked Data, Designing an Integrated LLD, and Thoughts on Ways to Expand LLD)

  • 오삼균;김성훈;장원홍
    • 한국도서관정보학회지
    • /
    • 제42권4호
    • /
    • pp.331-351
    • /
    • 2011
  • 본 연구의 목적은 근래 W3C의 특별 작업반 형태로 운영되어 온 도서관 링크데이터(LLD : Library Link Data) 관련 국제 활동상황을 분석하고, LLD가 도서관 서비스에 미칠 혜택을 사례연구를 통해 우선 숙고한 후, 보다 의미 있는 LLD를 위한 글로벌 식별체계, 이용 가능한 어휘와 데이터셋의 연결 문제 및 RDF, SKOS, Microformats, RDFa 등의 LLD 적용 방안을 논하는 것이다. 아울러 LLD 수용 및 LLD 기반 신 정보서비스 구축의 장애 요인들을 분석하고, 그 분석의 바탕 위에 LLD 기반 신 디지털정보시스템 설계 및 LLD 확산을 위한 권고사항을 제시한다.

Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템 (Question and Answering System through Search Result Summarization of Q&A Documents)

  • 유동현;이현아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권4호
    • /
    • pp.149-154
    • /
    • 2014
  • 지식iN과 같은 사용자 참여 질의응답 커뮤니티에서 원하는 질문에 대한 답을 찾기 위해서는 검색 결과로 제공되는 다양한 문서를 일일이 확인하여 판단하는 과정이 필요하다. 만일 사용자가 원하는 답변을 자동으로 정제하여 제시할 수 있다면, 질의응답의 사용성이 크게 향상될 수 있다. 본 논문에서는 질의응답 데이터 분석을 통해 사용자의 질문의 유형을 단어, 목록, 도표, 글의 4가지 유형으로 분류하고, 문서 내 통계적 특성을 활용하여 각 분류별 답변을 자동으로 제시하기 위한 방식을 제안한다. 단어, 목록, 글 유형은 질의어에 대해 검색된 질문을 군집화하고, 군집 내 빈도와 질의어에 대한 근접도, 답변 신뢰도 등으로 계산된 답변 내 어휘의 적합도를 활용하여 요약한 답변을 사용자에게 제시한다. 도표형은 답변들에서 사용자의 의견 정보를 추출하여 의견 통계를 도표로 제시한다.

OWL을 이용한 온톨로지 기반의 목록시스템 설계 연구 (A Study of Ontology-based Cataloguing System Using OWL)

  • 이현실;한성국
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.249-267
    • /
    • 2004
  • MARC는 목록 데이터를 상세하게 정의할 수 있는 장점이 있지만, 개념요소가 구조화 되어 있지 않고 표현체계가 복잡하기 때문에 단순 계층구조의 의미 어휘 체계를 지원하는 XML DTD나 RDF/S로는 그 구조를 모델화하기가 어렵다. 본 연구에서는 MARC의 데이터 요소를 추상화하여 목록 데이터의 개념 구조를 표현하는 서지 온톨로지를 구축하였으며, 개념간의 논리 관계와 프로퍼터의 카디널리티 및 프로퍼티 값에 대한 논리적 제한을 부가할 수 있는 OWL을 이용하여 MRAC 필드의 복합 구조를 모델링하여 구축한 목록 온톨로지를 구현하였다. 온톨로지 언어를 이용한 MARC 데이터를 기술 방법은 목록 데이터에 대한 메타데이터 구성과 목록의 호환성 문제를 해결할 수 있는 기초적 방안이 되며, 시맨틱 웹 서비스를 기반으로 하는 차세대 문헌 정보서비스 시스템 구현의 토대가 될 것이다.

"표준국어대사전"을 이용한 시소러스 구축 (Construction of Thesaurus Using "The Korean Standard Dictionary")

  • 한상길
    • 한국도서관정보학회지
    • /
    • 제44권4호
    • /
    • pp.233-254
    • /
    • 2013
  • 시소러스 작성에 있어서 가장 현실적인 어려움은 용어의 수집에 있다. 용어사전 뿐만 아니라 어휘사전도 시소러스의 중요한 용어 수집원으로 사용될 수 있다. "표준국어대사전"은 어문 규정을 충실히 반영한 우리나라의 대표사전이다. 또한 "표준국어대사전"은 단순히 표제어에 대한 용어 정의뿐만 아니라 해당 용어에 대한 다양한 정보를 체계적으로 담고 있기 때문에, 이를 시소러스 사전 구축에 활용할 수 있을 것이다. 본 연구는 "표준국어대사전"이 갖고 있는 다양한 용어관계 정보를 시소러스 용어관계로 정의하는 방안을 모색하였다. 또한 용어의 분리, 동등관계와 계층관계의 설정, 한정어의 사용, 북한어 관계 등 시소러스 구축에서의 문제점과 해결 방안을 제시한다.

이동동사의 인지 도식에 관한 비교 연구 (Comparative Study on Cognitive Scheme of Movement Verbs)

  • 오현금;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.59-64
    • /
    • 2002
  • 인지심리학 및 인지언어학 분야에서 시도한 어휘 표상, 특히 움직임과 관련된 동사의 인지도식에 관한 연구들을 비교해보고자 한다. 인간의 언어학적인 지식을 도식적으로 표상 하고자 하는 노력은 언어의 통사적인 외형에만 치중하는 연구에서는 언어의 의미구조를 파악하기 힘들다고 판단하고 의미적인 범주화를 중요시하게 되었다. 본 연구에서는 시각적 이미지 도식을 중점적으로 살펴보기로 한다. 이미지 도식은 공간적 위치 관계, 이동, 형상 등에 관한 지각과 결부되어 있다. 이미지로 나타낸 표상은 근본적으로 세상의 인식과 세상에 대한 행동방법을 사용하게 하는 유추적이고 은유적인 원칙에 기초하고 있다. 이러한 점에 있어서, 언술을 발화한 화자는 어느 정도 주관적인 행동의 능력과 그가 인식한 개념화에서부터 문자화시킨 표상을 구성한다. 인지 원칙에 입각한 의미 표상에 중점을 둔 도식으로는, Langacker, Lakoff, Talmy의 도식이 있다. 프랑스에서 톰 R. Thom과 같은 수학자들은 질적인 현상에 관심을 가져 형역학(morphodynamique)이론을 확립하였는데, 이 이론은 요즘의 인지 연구에 수학적 기초를 제공하였다. R. Thom, J. Petitot-Cocorda의 도식 및 구조 의미론의 창시자라고 불리는 B.Pottier의 도식이 여기에 속한다 J.-P. Descles가 제시한 인지연산문법(Grammaire Applicative et Cognitive)은 다른 인지문법과는 달리 정보 자동처리과정에서 사용할 수 있는 연산자와 피연산자의 관계에 기초한 수학적 연산작용을 발전시켰다. 동사의 의미는 의미-인지 도식으로 설명되는데, 이것은 서로 다른 연산자와 피연산자로 구성된 형식화된 표현이다. 인간의 인지 기능은 언어로 표현되며, 언어는 인간의 의사소통, 사고 행위 및 인지학습의 핵심적 기능을 담당한다. 인간의 언어정보처리 메카니즘은 매우 복잡한 과정이기 때문에 언어정보처리와 관련된 언어심리학, 인지언어학, 형식언어학, 신경해부학 및 인공지능학 등의 관련된 분야의 학제적 연구가 필요하다.

  • PDF

의미속성에 기반한 한국어 명사 의미 TAG에 관한 연구 (A Study on A Korean Noun Semantic TAG based on Semantic Features)

  • 이수광;조평옥;안미정;옥철영;박재득;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.412-418
    • /
    • 1998
  • 의미 TAG는 한국어 기초어휘에 대한 개념지식을 구축하는 데 기본이 될 뿐만 아니라, 문장 분석시의 구조적 모호성과 단어 의미 모호성을 해소하는 중요한 단서를 제공할 수 있다. 이러한 의미 TAG가 실용적으로 여러 응용 시스템에서 사용되기 위해서는 광범위하고 타당한 자료를 바탕으로 하여 객관적인 방법으로 설정 되어야 한다. 국어사전의 뜻풀이말에서의 상위개념을 표제어의 상위어로 선정하는 bottom-up 방식으로 구축하였던 한국어 명사의미체계는 근본적으로 사전편찬자의 비일관적인 뜻풀이말의 기술에 따른 여러 문제점이 있었다. 본 연구에서는 이러한 문제점들을 해결하기 위해서 사전 뜻풀이말에서 상위개념을 수식하는 어절과 용언의 의미호응관계에서 상위개념의 의미속성을 추출하고, 이들 의미속성에 의한 명사 의미체계를 구축하여 이를 바탕으로 명사의미 TAG를 설정할 수 있도록 하였다.

  • PDF

한글 문서에서 형태적 중의 오류의 교정 (A method for morphological correction of ambiguous error)

  • 김민주;정준호;이현주;최재혁;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF

유로워드넷 방식에 기반한 한국어와 영어의 명사 상하위어 정렬 (Alignment of Hypernym-Hyponym Noun Pairs between Korean and English, Based on the EuroWordNet Approach)

  • 김동성
    • 한국언어정보학회지:언어와정보
    • /
    • 제12권1호
    • /
    • pp.27-65
    • /
    • 2008
  • This paper presents a set of methodologies for aligning hypernym-hyponym noun pairs between Korean and English, based on the EuroWordNet approach. Following the methods conducted in EuroWordNet, our approach makes extensive use of WordNet in four steps of the building process: 1) Monolingual dictionaries have been used to extract proper hypernym-hyponym noun pairs, 2) bilingual dictionary has converted the extracted pairs, 3) Word Net has been used as a backbone of alignment criteria, and 4) WordNet has been used to select the most similar pair among the candidates. The importance of this study lies not only on enriching semantic links between two languages, but also on integrating lexical resources based on a language specific and dependent structure. Our approaches are aimed at building an accurate and detailed lexical resource with proper measures rather than at fast development of generic one using NLP technique.

  • PDF

구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계 (Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool)

  • 이현아;박재득;장명길;박수준;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.489-496
    • /
    • 1996
  • 자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

  • PDF

핵심어 추출 기반 음성 다이얼링 시스템 개발 (Development of Voice Dialing System based on Keyword Spotting Technique)

  • 박전규;서상원;한문성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.153-157
    • /
    • 1996
  • 본 논문은 연속 분포 HMM을 사용한 핵심어 추출기법(Keyword Spotting)과 화자 인식에 기반한 음성 다이얼링 및 부서 안내에 관한 것이다. 개발된 시스템은 상대방의 이름, 직책, 존칭 등에 감탄사나 명령어 등이 혼합된 형태의 자연스런 음성 문장으로부터 다이얼링과 안내에 필요한 핵심어를 자동 추출하고 있다. 핵심 단어의 사용에는 자연성을 고려하여 문법적 제약을 최소한으로 두었으며, 각 단어 모델에 대해서는 음소의 갯수 더하기 $3{\sim}4$개의 상태 수와 3개 정도의 mixture component로써 좌우향 모델을, 묵음모델에 대해서는 2개 상태의 ergodic형 모델을 구성하였다. 인식에 있어서는 프레임 동기 One-Pass 비터비 알고리즘과 beam pruning을 채택하였으며, 인식에 사용된 어휘는 36개의 성명, 8개의 직위 및 존칭, 5개 정도의 호출어, 부탁을 나타내는 동사 및 그 활용이 10개 정도이다. 약 $3{\sim}6$개 정도의 단어로 구성된 문장을 실시간($1{\sim}3$초이내)에 인식하고, 약 98% 정도의 핵심어 인식 성능을 나타내고 있다.

  • PDF