• Title/Summary/Keyword: 규칙언어

Search Result 685, Processing Time 0.02 seconds

Multi-level Morphology and Morphological Analysis Model for Korean (다층 형태론과 한국어 형태소 분석 모델)

  • Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.140-145
    • /
    • 1994
  • 형태소 분석은 단위 형태소를 분리한 후에 변형이 일어난 형태소의 원형을 복원하고, 분리된 단위 형태소들로부터 단어 형성 규칙에 맞는 연속된 형태소들을 구하는 과정이다. 이러한 일련의 분석 과정은 독립적인 특성이 강하면서 각 모듈이 서로 밀접하게 연관되어 있으므로 Two-level 모델에서는 형태론적 변형뿐만 아니라 형태소 분리 문제를 통합 규칙으로 처리하고 있다. 그러나 한국어에 Two-level 모델을 적응해 보면 형태소 분리와 형태론적 변형이 복합되어 있어서 교착어의 특성과 관계되는 단어 유형을 분석할 때 비효율적인 요소가 발견된다. 따라서 본 논문에서는 교착어인 한국어의 형태소 분석시에 발생하는 문제점들을 해결하는데 적합한 방법론으로 다층 형태론(multi-level morphology)과 다단계 모델(multi-level model)을 제안한다.

  • PDF

Implementation of the Hangul-Roman Conversion System (한글-로마자 표기 변환 시스템 구현)

  • Kim, Kyoung-Jing;Park, Sung-Hyun;Choi, Young-Kyoo;Lee, Jun-Hwan;Rhee, Sang-Burm
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.193-198
    • /
    • 2001
  • 본 논문에서는 개정된 국어의 로마자 표기법에 근거한 로마자 표기 변환기를 생성하기 위하여 한글-로마자 표기 변환시스템을 설계하였다. 한글-로마자 표기의 규칙변환을 위하여 로마자 표기법중 표기의 변환에 관련된 항과 그렇지 않은 항으로 분리하여 규칙 변환을 위한 로마자 표기법을 정리하였으며, 로마자 표기법의 근간이 되는 표준 발음법을 페트리넷으로 모델링 후 분석하여 표기-음가 변환표를 생성하고, 표기-음가 변환표에서 로마자 표기법에 해당하지 않는 부분을 제거하여 한글 - 로마자 표기 변환표를 생성하고 이를 바탕으로 한글-로마자 변환 시스템을 구현하였다.

  • PDF

Breaking Compound Nouns for Better Indexing (효율적인 색인을 위한 복합 명사의 분해)

  • Park, Soo-Jun;Lee, Hyun-A;Jang, Myung-Gil;Park, Jae-Deuk;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.42-48
    • /
    • 1996
  • 정보검색에서의 효율적인 복합명사의 분석은 정확도와 재현율의 향상을 통해 색인의 질을 높여준다. 복합명사의 분석은 많은 노력이 요구되는 작업이다. 본 논문은 간단한 분해규칙을 이용하여 복합명사의 의미해석을 대신하였다. 실험을 위해 동아일보 사설을 대상으로 복합명사를 추출하고 이를 도출된 분해규칙을 이용하여 분해하였다. 실험을 통해 평균 96.2%의 분해 성공률을 보였다.

  • PDF

Query-based User Emotion Prediction (질의 기반 사용자 감정상태 예측)

  • Min, Hye-Jin;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.211-214
    • /
    • 2014
  • 본 연구에서는 질의를 기반으로 사용자의 감정상태를 예측하는 방법을 제안한다. 제안방법은 자극-감정 규칙베이스 구축, 규칙확률 값 기반 질의 랭킹, 질의 랭킹 기반 사용자 감정예측의 단계로 구성된다. 방법의 적절성을 검증하기 위하여 힘들다와 심심하다에 대한 결과로 사용자평가를 실시하였다. 힘들다의 결과에서는 힘들다 정도에 대한 점수가 높은 질의들을 지속적으로 검색하는 사용자들을 힘들다라고 판단할 수 있다고 분석되었다. 심심하다의 결과에서는 방법 간 유의미한 차이를 보이지 않았으나, 특정 개별질의의 지속적인 패턴을 분석하는 것이 좀 더 높은 점수를 얻은 것으로 평가되었다.

  • PDF

Design and Impelmentation of a User-Centered Web-Based Learning Systemof French Inflectional Forms (사용자를 고려한 웹기반 불어 굴절 규칙 학습 시스템의 설계 및 구현)

  • 윤애선;김기혜
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.143-149
    • /
    • 2000
  • 본고에서는 불어 자동처리 연구의 기초이면서, 불어 초·중급 학습에 가장 큰 걸림돌로 여겨지는 불어 굴절 변화형의 분석 및 생성 교육 시스템 Inflection-edu를 소개한다. inflection-edu는 부산대학교 언어 정보 연구실에서 개발한 불어 형태소 분석-생성기를 기반으로 하였으며, 동사 8,249개, 명사 29,059개, 형용사 9,957개와 그 굴절 변화형을 모두 분석 및 생성할 수 있으며, 학습자를 위한 굴절 규칙 231개를 포함한다. 제 2 장에는 분석과 생성을 위한 모델화(modelling) 방법론을 제시하고, 제 3 장에서는 이 결과를 불어 교육 시스템에 연동하기 위한 인터페이스를 제시하고, 제 4 장에서는 Inflection-edu의 인터페이스를 소개한다. 제 5 장에서는 남은 문제와 향후 응용 방향을 알아본다. 형태소 분석기와 생성기능이 교육 시스템에 통합된 Inflection-edu는 70년대 개발된 프로그램과 같이 단순하고 반복적인 교수-학습 작업을 제공하는 것이 아니다. 학습자의 요구에 정확하고 빠르게 피드백을 줄 수 있으며, 좀 더 큰 단위의 분석 및 생성이 가능하도록 하여, 좀 더 지능적인 언어 교육 시스템을 구현하는 것을 그 개발 목표로 하고 있다.

  • PDF

Access Control and Adaptation System for Ubiquitous Computing (유비쿼터스 컴퓨팅을 위한 접근제어와 상황적응 시스템)

  • Lee, Ji-Yeon;Oh, Min-Kyoung;Chang, Byeong-Mo;Ahn, Joon-Seon;Doh, Kyung-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.590-594
    • /
    • 2006
  • 본 연구는 신뢰성 있는 유비쿼터스 프로그램을 개발하기 위한 보다 효율적인 프로그래밍 환경을 제공함을 목적으로 한다. 이 프로그래밍 환경은 정책 기술 언어와 이를 바탕으로 접근 제어와 상황 적응을 관리하는 실행시스템을 제공한다. 프로그래머는 정책 기술 언어를 통해 메소드에 대한 접근 권한과 변화되는 상황에 적응하는 규칙들을 쉽게 표현할 수 있다. 본 논문의 실행 시스템은 정책 파일의 규칙들에 따라 객체가 메소드에 대한 접근 권한이 있는지를 검사하는 접근 제어기(access controller)와 변화되는 상황에 적응하여 자동으로 반응하도록 해주는 적응 엔진(adaptation engine)의 형태로 구현되었다. 또한 이 시스템을 이용하여 개발된 유비쿼터스 프로그램을 시뮬레이션 할 수 있는 시뮬레이터를 제공한다.

  • PDF

An Efficient Approach to Testing Retargetable Compiler Using Intermediate Representation (중간표현을 이용한 재목적 컴파일러의 효율적인 테스트 방법)

  • Jang, Han-Il;Woo, Gyun;Chae, Heung-Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.575-579
    • /
    • 2006
  • 컴파일러에 결함이 있다는 것은 곧 잘못된 코드를 생성한다는 것을 의미하므로 양질의 컴파일러 구성은 양질의 소프트웨어 생산을 위한 기본 요구조건이 된다. 임베디드 시스템이 널리 사용되면서 더욱 다양하고 복잡한 임베디드 프로세서가 개발되었고 이는 새로이 설계된 프로세서를 위한 새로운 컴파일러 개발의 필요를 야기하고 있다. 본 논문에서는 프로그램의 중간 표현을 기반으로 하는 효율적인 테스팅 방법을 제안한다. 언어의 구문 규칙을 모두 사용하는 테스트 케이스를 통해 컴파일러를 테스트하는 방법이 이미 연구되었으나, 기존의 소스 코드 수준의 방법으로는 테스트 케이스의 중복성이 존재하는 단점이 있다. 본 논문에서는 중간 표현의 구문 규칙을 이용해서 중복된 테스트 케이스를 제거하여 테스팅 효율을 증가시킬 수 있음을 기술한다. 또한 본 논문에서 제안하는 방법을 GCC의 중간 언어인 RTL에 적용한 예를 통해 설명한다.

  • PDF

Biological Language Resource Construction and Named Entity Recognition System using UMLS (ULMS를 이용한 언어자원 구축 및 생물학적 개체명 인식 시스템)

  • Lee, Hyun-Sook;Kim, Tae-Hyun;Jang, Hyun-Chul;Park, Soo-Jun;Park, Seon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.833-836
    • /
    • 2003
  • 본 논문에서는 생물학적 문헌으로부터 유의미한 정보를 추출하는 바이오 텍스트 마이닝의 기본 단계인 생물학적 개체명 인식 모델을 제안하였다. 기존의 생물학적 개체명 인식은 규칙 혹은 코퍼스 구축뿐만 아니라 개체명 인식에 요구되는 기본 자원을 구축하는데만도 많은 시간과 비용이 요구되므로 한정된 도메인을 대상으로 연구가 진행되어 왔다. 본 논문에서 제안하는 개체명 인식 방법은 이러한 비용 문제 및 새로운 도메인으로의 이식성 문제를 극복하기 위해 UMLS 로부터 통계적인 방법으로 정보를 추출해 기본적인 언어자원을 구축하고 이를 이용해 규칙을 생성함으로써 개체명인식을 수행한다. 본 연구에서 제안하는 방법은 바이오 텍스트 마이닝 연구의 도메인 한정적인 문제를 해결하는데 기여할 수 있을 것으로 기대된다.

  • PDF

Automatic Named Entities Extraction Using the Graph-based Measurement Technique of the Mutual Importance (그래프 기반의 상호 중요도 측정 기법을 이용한 영역별 개체명 자동 추출)

  • Bae, Sangjoon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.17-22
    • /
    • 2008
  • 본 논문에서는 영역별로 자동으로 개체명을 추출하기 위하여 씨앗단어를 이용하고, 웹페이지와 개체명 후보들 간의 상호 중요도를 측정하여 개체명 후보들의 순위를 정하는 방식을 제안한다. 제안된 방식은 크게 세 단계에 의해서 수행되어 지는데 먼저 씨앗단어 정보를 이용하여 웹페이지를 검색하고, 검색되어진 웹 페이지와 씨앗단어 정보를 이용하여 패턴 규칙을 추출한다. 추출된 패턴 규칙을 웹페이지에 적용하여 개체명 후보들을 추출하고 추출된 후보들과 웹페이지 사이의 상호 중요도를 재귀적으로 계산하여 최종적으로 개체명 후보들의 순위가 정해 진다. 한국어와 영어 개체명 영역에 제안된 기법을 적용하여 실험한 결과 한국어에서는 78.72%의 MAP를 얻을 수 있었고, 영어에서는 96.48%의 MAP를 얻었다. 특히 영어 개체명 인식에서의 성능은 구글에서 제공하고 있는 구글셋의 결과보다도 높은 성능을 보였다.

  • PDF

A Compound Noun Processing in the Two-level Morphological Analysis of Korean (Two-level 한국어 형태소 해석에서의 복합명사 처리)

  • 이근용;박기선;이용석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.505-507
    • /
    • 2002
  • Two-level 형태소 해석 모델은 단어들이 결합할 때 발생하는 철자변화를 처리하는 언어 독립적인 형태소 해석 모델이다. 그러나 한국어의 경우 활용과 첨용이 자유로운 교착어에 속하며 음절단위 표현법 때문에 two-level 모델을 이용한 형태소 해석 방법보다는 언어 종속적인 형태소 해석 방법을 사용하여 왔다. 한국어 용언과 다양한 변형을 처리하기 위한 two-level 규칙이 표현되었지만, 형태소 해석에서 사용하기 위해서 필요한 복합명사 치리와 미지어 처리에 대한 적절한 방법이 아직 계시되지 않았다. 본 논문은 어절 생성 규칙을 이용한 사전 구성을 이용하여 two-level 모델에서의 한국어 복합명사의 처리에 대해서 다루고, two-level 모델에서 한국어 복합명사 처리가 가능함을 보이고자 한다.

  • PDF