• 제목/요약/키워드: 한글 프로그래밍 언어

검색결과 58건 처리시간 0.032초

LR 파싱에서 충돌 해결을 위한 Shift 우선 전략 (Shift-first Strategy for Resolving Conflicts in the LR Parsing)

  • 이용석;황이규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.484-488
    • /
    • 1996
  • LR 파싱은 프로그래밍 언어를 위한 빠른 파싱 방법을 제공한다. 그러나 이 방법의 단점은 자연어와 같은 다양한 모호성을 가지는 문법에 적합하지 못하다. 모호성을 가지는 문법은 파싱 테이블 상에서 충돌을 야기하게 되는데 이를 해결하는 방법에 대한 연구가 많이 있어 왔다. 문장이 길어질 경우 구문 분석 도중 이러한 모호성이 파싱 효율에 큰 영향을 미치게 되는데, 본 논문에서는 Shift 우선 전략으로 LR 파싱의 효율적인 특징을 유지하면서 이러한 충돌을 해결할 수 있음을 보인다.

  • PDF

버전 상호 호환 가능한 HL7 GUI 도구의 설계 (Design of a Version-Compatible HL7 GUI Tool)

  • 윤효전;황도삼
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.454-455
    • /
    • 2019
  • 의료정보 교환을 위한 국제 표준인 HL7 메시지의 처리와 HL7의 다양한 버전 간 호환성 문제를 해결하기 위해 객체 지향적 구조에 기반한 HL7 파서(Parser)가 개발되었다. 그러나 개발된 파서를 의료정보시스템과 연동하여 사용하기 위해서는 의료분야 전문가와 소프트웨어 전문가의 협력이 필수적이다. 또한, 이들 전문가의 협업을 위해서는 각 분야의 전문지식에 대한 상호 이해가 전제되어야 하는데, 이를 위해서는 오랜 시간 상호간의 많은 노력이 필요한 과정이다. 따라서 본 연구에서는 버전 간 호환 가능한 HL7 파서를 기반으로 하여 HL7 메시지의 생성과 변환을 가능하게 하는 HL7 GUI 도구를 설계한다. 이를 통해, 컴퓨터 프로그래밍 언어에 익숙하지 않은 의료 분야의 전문가들도 HL7 GUI 도구를 통해 개념적으로 표현되는 그래프를 직접 디자인하여 의료정보시스템 간의 다양한 버전의 HL7 메시지를 처리하고 교환할 수 있는 환경을 제공한다.

  • PDF

구어파서를 위한 생성 인식 언어모델 (Generation and Recognition Language Model for Spoken Language Parser)

  • 정홍;황광일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-172
    • /
    • 1999
  • 구어는 프로그래밍 언어와는 달리 주어진 문장 내에서의 해당 어휘의 뜻(semantic information)을 알고 다른 어휘들과의 연관성 (grammatical information)을 알아야만 적절한 형태소분석이 가능하다. 또한 구어는 방대한 양의 어휘들로 구성되어 있으며 사용하는 사람마다의 다양한 응용과 공식화되기 어려운 수많은 예외들로 운용되기 때문에 단순히 찾아보기표와 오토마타만으로는 형태소분석에 한계가 있다. 이에 본 논문에서는 주어진 어휘집과 그 어휘들로 만들어진 다양한 문장들로부터 구어운용의 근본기제를 스스로 학습해나가는 강화학습중심의 언어모델을 제안하고 실제로 한국어 형태소분석에 적용하여 그 성능과 특성을 파악해보았다. 구어파서의 입력은 음절단위의 발음이며 인간이 문장을 듣거나 보는 것과 동일하게 시간에 따라 순차적으로 입력된다. 파서의 출력 또한 시간에 따라 변화되면서 나타나며 입력된 연속음절을 형태소단위로 분리(segmentation)하고 분류(labeling)한 결과를 나타낸다. 생성인식 언어모델이 기존의 언어모델과 다른 점은 구어 파싱에 있어서 필수적인 미등륵어에 대한 유연성과 앞단의 음성인식기 오류에 적절한 반응(fault tolerance)을 나타내는 것이다.

  • PDF

우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구 (Design of a Korean Question-Answering System for News Item Retrieval)

  • 정영미
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.3-23
    • /
    • 1987
  • 이 연구에서 구현한 질문응답시스템은 한글 자연어로 된 텍스트와 질문을 자동으로 처리하는 지능형 정보시스템이다. 입력데이타는 스포츠관계 기사로 국한하였으며 프로그래밍 언어로는 코볼을 사용하였다. 이 시스템의 구문분석기는 격문법에 기초한 것으로서 어휘사전, 용언의 격프레임, 언어학적 규칙 등을 사용하여 문장을 분석한다. 본문검색과 사실검색이 모두 가능한 이 시스템에서는 질문에 대한 해답이 문장형태이거나 사실데이타 형태로 출력된다.

  • PDF

버전 상호 호환 가능한 HL7 파서의 설계 (Design of an Version-Compatible HL7 Parser)

  • 이인근;황도삼
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-202
    • /
    • 2017
  • 의료정보시스템의 상호운용을 위해 개발된 의료정보 교환 국제 표준인 HL7은 복잡한 구조와 문법으로 인해 컴퓨터 소프트웨어로 관리되고 있다. 현재 개발되고 있는 HL7 인터페이스 소프트웨어에서는 다양한 버전 간 호환이 되지 않아 의료정보시스템에서 버전 상호 간의 호환을 위해 변환 소프트웨어 모듈을 개발하여 사용한다. 그러나 다양한 버전(V2.1~V2.8)의 HL7 메시지 간 상호 변환을 위해 소프트웨어 모듈을 모두 개발하는 것은 많은 시간과 막대한 비용 및 노력이 필요한 비효율적인 방법이다. 따라서 본 연구에서는 HL7 버전 호환성 정의에 기반을 두어 버전별 상호변환이 가능한 HL7 파서(Parser)를 설계하고, 객체 지향적 구조에 기반을 두어 하위 버전과의 호환(Backward Compatibility)뿐만 아니라 상위 버전과 호환(Forward Compatibility) 가능한 파서를 제안한다. 또한, 버전 간 변환 실험을 통해 효용성을 검증하였다.

  • PDF

음절단위 bigram정보를 이용한 한국어 단어인식모델 (A Statistical Model for Korean Text Segmentation Using Syllable-Level Bigrams)

  • 신중호;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-260
    • /
    • 1997
  • 일반적으로 한국어는 띄어쓰기 단위인 어절이 형태소 분석의 입력 단위로 쓰이고 있다. 그러나 실제 영역(real domain)에서 사용되는 텍스트에서는 띄어쓰기 오류와 같은 비문법적인 형태도 빈번히 쓰이고 있다. 따라서 형태소 분석 과정에 선행하여 적합한 형태소 분석의 단위를 인식하는 과정이 이루어져야 한다. 본 연구에서는 한국어의 음절 특성을 이용한 형태소분석을 위한 어절 인식 방법을 제안한다. 제안하는 방법은 사전에 기반하지 않고 원형코퍼스(raw corpus)로부터의 필요한 음절 정보 및 어휘정보를 추출하는 방법을 취하므로 오류가 포함된 문장에 대하여 견고한 분석이 가능하고 많은 시간과 노력이 요구되는 사전구축 및 관리 작업을 필요로 하지 않는다는 장점이 있다. 한국어 어절 인식을 위하여 본 논문에서는 세가지 확률 모텔과 동적 프로그래밍에 기반한 인식 알고리즘을 제안한다. 제안하는 모델들을 띄어쓰기 오류문제와 한국어 복합명사 분석 문제에 적용하여 실험한 결과 82-85%정도의 인식 정확도를 보였다.

  • PDF

버전 상호 호환 HL7 파서의 개발 (Development of a Version-Compatible HL7 Parser)

  • 이인근;윤효전;황도삼
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.520-521
    • /
    • 2018
  • 의료정보 교환 국제 표준인 HL7의 처리를 위한 인터페이스 소프트웨어에서 다양한 버전 사이의 호환성 문제의 해결 방법으로 객체 지향적 구조에 기반한 HL7 파서(Parser)의 구조가 설계되었다. 그러나 수천개의 HL7 메시지 및 구성요소를 처리할 수 있는 HL7 파서를 직접 구현하기 위해서 많은 시간과 인력이 필요하다. 또한, 구현된 파서의 기능 변경 시 수천 개의 파일을 프로그래머가 직접 수정하는 방법은 매우 비효율적이다. 따라서 본 연구에서는 버전 상호 호환 가능한 HL7 파서의 설계에 따라 HL7 파서를 효과적인 구현할 수 있는 방법을 제안한다. 제안한 방법에 따라 HL7 파서를 구현하고, HL7 메시지의 버전 간 변환 테스트를 수행하여 개발한 파서의 효용성을 확인한다.

  • PDF

특수목적영어 교육을 위한 해사영어코퍼스 구축 (A Compilation of Maritime English Corpus for English for Specific Purposes Education)

  • 이성민;김재훈;장세은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.163-164
    • /
    • 2015
  • 본 연구는 특수목적영어분인 해사영어코퍼스의 구축을 목적으로 한다. 구축과정에서 코퍼스 구축에 필요한 대표성과 균형성을 고려하여 네 가지 장르인 학술, 뉴스, 법, 책으로 나누고 각 하위코퍼스를 백만 단어씩 구축하였다. 코퍼스 구축과정에서 웹사이트와 PDF형태의 자료에서 텍스트만을 수집하고 정제하기 위하여 파이썬(Python) 프로그래밍 코딩을 하였고 무료 공개 프로그램도 병행하였다. 앞으로 해사영어코퍼스는 해사영어어휘교육에 필요한 단어목록제공이나 예문 검색 등을 통한 자료중심학습법에 활용될 수 있을 것이다. 또한 본 연구의 코퍼스구축 과정은 다른 분야의 ESP코퍼스 구축에도 응용 될 수 있을 것이다.

  • PDF

Prefix-Tuning 기반 Open-Ended Knowledge Tracing 모델 연구 (Enhancing Open-Ended Knowledge Tracing with Prefix-Tuning)

  • 손수현;강명훈;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.672-676
    • /
    • 2023
  • 지식 추적 (knowledge tacing)은 주어진 학습자의 과거 문제 해결 기록을 기반으로 학습자의 지식 습득 정도를 파악하여 목표 문제에 대한 정답 여부를 예측하는 것을 목표로 한다. 이전 연구에서는 이진 분류 기반의 모델을 사용하여 정답 유무만 예측하였기 때문에 학습자의 답변에 존재하는 정보를 활용하지 못한다. 최근 연구에서는 이를 생성 태스크로 변환하여 컴퓨터과학 분야에서 프로그래밍 질문에 대한 지식 추정을 수행하는 open-ended knowledge tracing (OKT)이 제안되었다. 하지만 최적의 OKT 모델에 대한 연구는 진행되지 않았으며 따라서 본 논문에서는 시간에 따라 변화하는 학습자의 지식 상태에 따라 답변 생성을 조정하는 새로운 OKT 방법론을 제안한다. 실험을 본 논문에서 제안하는 방법론의 우수성과 효율성을 증명한다.

  • PDF

아래아 한글 파일의 텍 파일로의 변환 소프트웨어 구현 (Implementation of Hangul to $T_EX$ conversion software)

  • 김성원;이한나;박상훈;오창혁
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.99-107
    • /
    • 2010
  • 본 연구에서는 아래아 한글 형식으로 작성된 논문 파일을 $T_EX$ 형식의 파일로 변환하는 소프트웨어를 구현하였다. 아래아 한글은 문서작성 또는 출판의 도구로써 사용되는 국내에서 많은 사용자를 가진 워드프로세서이며, 이를 이용한 수식이 포함된 논문 원고의 편집은 상대적으로 수월한 것으로 알려져 있다. $T_EX$은 일반 텍스트 편집기로 작성된 문서를 컴파일하여 고품질의 문서를 얻는 수식 전문조판 프로그래밍 언어이다. 구현된 소프트웨어는 정해진 작성 형식에 따라 아래아 한글로 작성된 논문 원고의 본문, 표, 문단 형식, 수식, 특수문자 등을 지정된 스타일 파일에 맞춘 $T_EX$ 형식으로 변환 한다. 구현의 예제로써 한국데이터정보과학회지 (JKDISS)의 아래아 한글 논문 형식과 $T_EX$ 스타일 파일을 사용하였다.