• 제목/요약/키워드: 구문문법

검색결과 193건 처리시간 0.024초

효율적인 노드 재사용을 위한 점진적 파싱 알고리즘 (An Efficient Node Reuse inIncremental Parsing Algorithms)

  • 박정윤;김영철;김상헌;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.401-403
    • /
    • 1998
  • 점진적 파싱 알고리즘은 사용자 중심의 시스템 구현을 위한 핵심적인 기술의 하나이다. 오늘날 속성문법에서 사용되는 트리에는 노드에 파스서 상태와 심볼외에 평가된 속성 정보가 포함되므로 이 정보를 재사용하는 것이 바람직하다. 따라서 효율적인 점진적 파서는 파스트리상에서 생성된 노드를 효율적으로 재사용 할 수 있어야 한다. 본 연구에서는 이전의 파싱과정에서 생성된 노드를 효율적으로 재사용할 수 있는 쓰레드 트리를 기반으로 한 점진적 파싱 알고리즘을 제안하였다. 이전에 생성된 파스결과를 쓰레드 트리로 보관하고 이를 이용하여 효율적으로 노드를 재사용할 수 있도록 하였다. 제안된 알고리즘은 LR 기반의 파싱 방법에서 확장형 파싱표와 쓰레드 트리를 이용해 생성된 트리의 노드를 효율적으로 유지할 수 있다. 본 연구에서 제시된 알고리즘은 구문분석이 필요한 대화식 환경에서 효율적으로 사용될 수 있다.

ANTLR을 이용한 MEGACO 파서의 개발 (Development of a MEGACO Parser using ANTLR)

  • 황의윤;허정석;김성규;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.787-789
    • /
    • 2004
  • MEGACO(MEdia GAteway COntro) 프로토콜은 VoIP(Voice over IP) 시스템에서 MGC(Media Gateway Controller)와 MG(Media Gateway)간에 통신을 정의하는 표준이다. MEGACO 명세서에는 통신규약에 대한 내용을 ABNF (Argumented BNF)형식으로 제공하고 있으나, 이것을 그대로 사용하여 MEGACO 메시지를 분석하는 파서(Parser)를 개발하기에는 많은 어려움이 있다. 규칙(rule)과 규칙간의 비결정적인 요소와 토큰과 토큰간의 모호성이 많이 존재하기 때문에 적절한 변환을 통하여 파서를 제작하여야 한다. 본 논문에서는 ANTLR 파서 생성기와 MEGACO 명세서에서 제공되는 ABNF문법을 사용하여 MEGACO 파서(Parser)를 개발하였다. ANTLR에서 제공하는 Syntactic predicate와 Semantic Predicate등을 적절하게 사용하여 명세서에 존재하는 여러 가지 형태의 비결정적인 구문과 모호한 토큰들을 제거하였다.

  • PDF

비주얼 프로그래밍 도구를 이용한 로봇 프로그래밍 학습 모형의 개발 (Development of the Robot Programing learning model which uses Visual Programing tool)

  • 정상엽;유인환
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2008년도 동계학술대회
    • /
    • pp.148-153
    • /
    • 2008
  • 지식 기반 사회에서는 논리적인 사고를 통해 외부의 자극에서 새로운 가치를 창조하고 스스로 지식을 형성하는 능력이 필요하다. 그리고 컴퓨터 교육의 목적은 기능의 습득이 아니라 습득한 기능을 유기적으로 이용하여 주어진 문제를 해결하는 논리적 사고력의 향상에 있다. 따라서 논리적 사고력을 기를 수 있는 프로그래밍 교육을 학생들에게 지도하여야 한다. 본 연구에서 논 프로그래밍 입문기 학습자들이 갖는 어려움, 즉 프로그래밍 언어의 단어와 문법 암기 따른 부담을 덜고 프로그래밍 학습이 갖는 논리적 알고리즘 탐구에 집중하고자 기존의 구문 중심 프로그래밍 언어가 아닌 아이콘 기반의 비주얼 프로그래밍 도구를 제시한다. 그리고 기존의 프로그래밍 학습에서 아동들이 추상적으로 해 왔던 프로그래밍 과정을 로봇을 이용하여 구체적이고 실험적인 학습을 하도록 하며 아울러 일반 학급에서 적용할 수 있는 로봇 활용 프로그래밍 교육 프로그램을 구상하였다.

  • PDF

한국어(韓國語) 규칙(規則) 음성(音聲) 합성(合成) 시스템의 구현(具現) (The Design and Implementation of Korean Text-to-Speech Conversion System on a Rule-Based Framework)

  • 손영택;김용갑;송본달랑
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.141-148
    • /
    • 1993
  • 본고는, 한글 한자가 혼용된 입력 텍스트를 음성으로 변환 출력하는 포르만트 음성 합성 방식 즉, 한국어 규칙 음성 합성(이하에는 KTTS[Korean Text To Speech System]이라고 함)의 전반적인 처리 흐름에 대하여 소개한다. 특히, 입력 텍스트에 있어서, 한자 또는 각종 부호의 한글 변환 기능, 음성 출력용 문법 정보 추출에 필요한 입력문의 해석 및 구문경계 설정 기능, 또한 음소 기호 변환 및 파라메터 값 생성과 변경 처리기능을 중심으로 설명하고자 한다. 또한 본 시스템의 완성과 더불어 실시하였던 청취 실험 평가 결과에 대하여 덧붙이겠다.

  • PDF

한국어 의미역 결정을 위한 자질 정보 확장 (Expansion of Feature Information for Korean Semantic Role Labeling)

  • 조병철;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-186
    • /
    • 2015
  • 의미역 결정은 주어진 술어와 의존 관계에 있는 여러 논항들과 그 술어간의 의미 관계를 결정하는 것이다. 의미역 결정은 보통 대량의 말뭉치를 이용하여 분류의 관점에서 문제를 해결하고자 한다. 본 논문에서는 한국어 구문 표지 부착된 말뭉치에 구축한 의미역 표지 부착 말뭉치 10,000 문장을 이용한 자동 의미역 결정 방법을 제안한다. 특히, 한국어는 그 특성상 조사와 어미가 문법 관계뿐만 아니라 의미 관계 설정에도 매우 중요한 역할을 하기 때문에 기존의 의미역 결정 연구에서 미비했던 부분인 조사와 어미 정보를 개선하여 새로운 자질 (features) 로 설계하여 의미역 결정을 시도하였다. 기존의 다른 언어에서의 의미역 결정 연구에서 사용된 자질에 본 논문에서 제시된 접사 정보에 기반한 자질을 추가하게 되면 약 77.9%의 F1 점수를 얻을 수 있었는데, 이는 기존 연구에 비하여 약 10% 포인트 향상된 결과이다.

  • PDF

실행 파일 포맷 생성기의 설계 및 구현 (Design and Implementation of Executable File Format Generator)

  • 손윤식;오세만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.623-626
    • /
    • 2004
  • EVM(Embedded Virtual Machine)은 임베디드 시스템을 위한 가상기계로서 플랫폼에 독립적이며, 모바일 디바이스와 디지털 TV등에 탑재할 수 있는 핵심 기술로 다운로드 솔루션에서는 꼭 필요한 기술이다. SIL(Standard Intermediate Language)은 임베디드 시스템을 위한 가상기계의 표준 중간 언어로 객체지향 프로그래밍 언어와 순차 적인 프로그래밍언어를 모두 수용할 수 있다. SIL로 기술된 프로그램이 EVM 에서 실행되기 위해서는 EFF(Executable File Format)형태로 변환되어야 한다. 임베디드 시스템을 위한 실행 파일 포맷인 EFF 는 구조가 간결하며 확장이 용이한 특징을 지닌다. 또한 메타데이터와 표준 중간 언어가 서로 독립적으로 구성되어 분석이 쉽고 타입 체크가 편리한 구조이다. 본 논문에서는 가상기계를 위한 표준 중간 언어인 SIL 을 EVM 에서 실행 가능한 형태로 변환시켜주는 실행 파일 포맷 생성기(EFF Generator)를 설계하고 구현한다. 먼저, SIL 구조를 위한 SIL 문법을 설계하고 파서 생성기(PGS)를 사용하여 SIL 프로그램을 위한 어휘분석기와 구문분석기를 구현한다. 그리고 AST를 생성한 후. 포맷 생성기를 통하여 AST를 운행하며 EFF를 생성한다.

  • PDF

인공지능 블록 파이썬 코딩 플랫폼의 피지컬 컴퓨팅 모듈 구현 (Implementation of Physical Computing Module of AI Block Python Coding Platform)

  • 이세훈;남지원;김관필;전우진;김기태
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.453-454
    • /
    • 2021
  • 본 논문에서는 딥아이(DIY) 블록 프로그래밍과 라즈베리파이의 피지컬 컴퓨팅을 활용해 엑츄에이터와 센서를 제어하고 센서를 통해 수집한 데이터를 전처리해 인공지능에 활용함으로써 효율적인 인공지능 교육 방식을 제안한다. 해당 방식은 블록코딩 방식을 사용함으로써 문자코딩 대비 오타을 줄이고 문법 구애율을 낮춤으로써 프로그래밍 입문자의 구문적 어려움을 최소화하고 개념과 전략적 학습을 극대화한다. 블록프로그래밍 사용언어로 파이썬을 채택해 입문자의 편의를 도모하고 파일처리, 크롤링, csv데이터 추출을 통해 인공지능 교육에 활용한다.

  • PDF

웹 기반 영어 어휘 학습 보조 시스템 설계 및 구현 (A Design and Implementation of a Web-based Learning System for English Vocabulary)

  • 유혜진;이미정
    • 정보처리학회논문지A
    • /
    • 제10A권4호
    • /
    • pp.375-380
    • /
    • 2003
  • 어휘 학습은 영어 학습에 있어 기반이 되는 매우 중요한 요소임에도 불구하고, 실제 학교 현장에서는 문법이나 독해 등 다른 요소에 비해 중요하게 다루어지지 못하고 있는 실정이다. 또한, 영어학습을 위한 인터넷 사이트들도 많이 제공되고 있지만, 이들 사이트에서 조차도 어휘 학습보다는 문법이나, 구문. 독해 등에 그 초점이 맞추어져 있는 경우가 대부분이고 어휘학습을 위한 기능제공은 극히 제한적임을 볼 수 있었다. 이에 본 연구에서는, 한정된 수업시간 내에 이루어지기 어려운 영어어휘 학습을 수업전이나 후에 학습자 스스로 수행 할 수 있도록 하기 위해 웹 기반의 어휘학습 보조 시스템을 설계, 구현하였다. 이 시스템은 학습자가 스스로 문맥을 통한 어휘학습을 수행할 수 있도록 해 주며, 어렵거나 새로운 어휘를 반복 학습하는데 효과적인 학습구조를 갖추고 있다.

접속 특성과 말마디 사전을 이용한 형태소 분석 (Morphological Analysis with Adjacency Attributes and Phrase Dictionary)

  • 임권묵;송만석
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.129-139
    • /
    • 1994
  • 본 논문은 형태소의 접속 특성과 대형 말뭉치(corpus)로부터 추출된 중의성 말마 디의 인접 정보를 이용해서 한국어 형태소 분석기를 구현한다. 일반적으로 말마디는 형태소의 접속 특성과 결합규칙을 적용함으로써 하나의 결과로 분석될 수 있으나 중 의성 말마디는 가능한 결과들로부터 적절한 하나를 선택하기 위해서 인접말마디 정보 나 문법 정보 또는 문맥 정보 등이 요구된다. 그러나 문법 정보와 문맥정보는 구문 분석과 의미분석 단계를 거쳐야만 가능하기 때문에 여기서는 표층적인 정보로서 인접 말마디 정보를 이용한 중의성 해결을 시도하였다. 형태소의 접속 특성과 중의성 말마 디의 인접 정보를 사전에 수록함으로써 축약어와 불필요한 결과를 제시하는 말마디 그리고 중의성 말마디까지도 형태소 분석이 거의 가능하게 된다. 본 분석기의 효능은 정확하고 풍부한 정보를 사전에 효율적으로 수록함으로써 이룩될 것이며, 이를 위해 형태소 사전과 말마디 사전을 데이타베이스로 설계하고, 필요한 정보 들을 대형 말뭉 치로부터 추출하여 사전에 저장한다.

  • PDF

정보 검색을 위한 숫자의 해석에 관한 구문적.의미적 판별 기법 (Syntactic and Semantic Disambiguation for Interpretation of Numerals in the Information Retrieval)

  • 문유진
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.65-71
    • /
    • 2009
  • 월드 와이드 웹의 정보 검색에서 산출되어지는 수많은 정보를 효율적으로 검색하기 위해서 자연어 정보처리가 필수적이다. 이 논문은 텍스트에서 숫자의 의미 파악을 위한 판별기법을 제안한 것이다. 숫자 의미 판별기법은 챠트 파싱 기법과 함께 문맥자유 문법을 활용하여 숫자 스트링과 연관된 접사를 해석하였으며, N-그램 기반의 단어에 의거하여 조직화된 의미 파악을 하도록 설계되었다. 그리고 POS 태거를 사용하여 트라이그램 단어의 제한조건이 자동 인식되도록 시스템을 구성하여, 점진적으로 효율적인 숫자의 의미 파악을 하도록 하였다. 이 논문에서 제안한 숫자 해석 시스템을 실험한 결과, 빈도수 비례 방법은 86.3%의 정확률을 나타냈고 조건수 비례 방법은 82.8%의 정확률을 나타냈다.