• 제목/요약/키워드: 부분 구문분석

검색결과 94건 처리시간 0.019초

LR(k) 서브 스트링 인식과 완성 (LR(k) Substring Recognition and Completion)

  • 김상헌;박용관;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.62-67
    • /
    • 2000
  • 편집 환경에서 입력되는 구문은 완전한 문장으로 입력되기보다는 문장의 일부가 부분적으로 입력되면서 점진적으로 프로그램을 완성하게 된다. 본 논문에서는 부분적인 문장의 입력을 분석하여 문장의 부족한 부분을 예측하여 서브 스트링에 대한 파스트리를 완성할 수 있는 방법을 제시한다.

  • PDF

웹서비스를 위한 모바일 웹 컨텐츠 변환 시스템 개발 (A development of the Conversion System of Mobile Web Contents for the Web Service)

  • 황인숙;김윤중;김승연
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.517-520
    • /
    • 2003
  • 본 논문에서는 XML Page로부터 닷넷 모바일 Web Page로의 변환 기능을 제공하는 웹서비스 프로바이더를 설계ㆍ구현하였다. 웹서비스 프로바이더는 플랫폼과 프로그래밍언어의 제약 없이 누구나 사용 가능하다는 장점을 가지고 있다. 본 논문에서 구현한 웹서비스 프로바이더로 제공하는 변환 라이브러리는 어휘분석기 모들과 구문 지향 번역기 모듈로 구성되어 있다. 어휘분석기 모들은 XML Page를 입력받아 각 태그들을 분석하고 토큰을 출력한다. 구문 지향 번역기 모듈은 어휘분석기에서 출력된 토큰들을 입력받아 문법을 체크하고, Parsing이 완료되면 대응되는 모바일 .NET 컨트롤로 변환하여 최종적인 닷넷 모바일 Web Page를 생성한다. 어휘분석기 모듈과 구문 지향 번역기 모들은 각각 어휘분석기 생성기(LEX)와 파서 생성기(YACC)를 사용하여 구현하였다. LEX와 YACC의 사용은 태그를 확장할 경우 변경된 부분만 설계함으로써 유연하게 대처할 수 있는 장점을 가지고 있다.

  • PDF

수화 자동 생성에서의 수지 신호와 비수지 신호 동기화 (Synchronization of Manual and Non-Manual Signals in Automatic Generation of Sign Language Expressions)

  • 정상윤;장은영;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.81-86
    • /
    • 2009
  • 비수지 신호는 수화를 통한 의사소통을 하는 과정에 수지 신호 못지않게 중요한 정보를 제공한다. 그럼에도 불구하고 비수지 신호에 대한 연구는 수지 신호에 대한 연구에 비해 아직까지 매우 부족하다. 본 연구에서는 이러한 비수지 신호의 특징에 대해 분석하였다. 비수지 신호를 수지 신호와 함께 재현하는 과정에는 정확도 문제와 동기화 문제가 있는데, 본 연구에서는 동기화 문제를 해결하는 시스템을 제안한다. 구현된 시스템은 입력된 문장을 구문 분석하여 수지 신호와 비수지 신호를 결정하는 부분과 구문 분석된 결과를 바탕으로 수화 애니메이션을 위한 액션 스크립트를 생성하는 부분으로 나뉜다. 수지 신호와 비수지 신호의 연결 순서와 방식에 따라 수화의 뜻이 달라질 수 있기 때문에, 본 연구에서 다루는 비수지 신호의 동기화 문제는 수화 자동 생성에 있어서 매우 중요한 문제이다.

  • PDF

한국어 문법관계에 대한 부분구문 분석 (Shallow Parsing on Grammatical Relations in Korean Sentences)

  • 이성욱;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권10호
    • /
    • pp.984-989
    • /
    • 2005
  • 본 연구의 목적은 한국어 문장의 문법관계를 분석하는 데 있다. 주된 문제는 문장의 주어, 목적어, 부사어를 문장에서 찾아내는 것이다. 이 문제를 해결하기 위해서 한국어 구문 분석에서 발생하는 여러 중의성을 고려해야 한다. 우리는 문법관계의 중의성을 먼저 해결하고 그 다음에 주어진 명사구와 용언구의 문법관계 확률을 이용하여 용언구의 술어-논항 관계 중의성을 해소하는 통계적 방법을 제안한다. 제안된 방법은 어절간의 거리, 교차구조 금지, 일문일격의 원칙 둥의 한국어 언어 특성을 반영하였다. 용언구와 명사구 사이의 문법관계에 대한 확률은 지지벡터 분류기를 이용하여 추정하였다. 제안된 방법은 문법관계 및 구문구조 부착 말뭉치를 이용하여 자동으로 문법관계를 학습하였고 주어, 목적어, 부사 각각의 문법관계분석에 대해 각각 $84.8\%,\;94.1\%,\;84.8\%$의 성능을 얻었다.

패킷 분석을 이용한 내부인 불법 질의 탐지 (Detection of Internal Illegal Query Using Packet Analysis)

  • 장경옥;구향옥;오창석
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.259-265
    • /
    • 2005
  • 정보 통신의 확산으로 일반 사용자도 정보 제공 매체 등을 통해 데이터베이스의 정보를 주고 받는 일련의 행위가 일상화되도록 변화되었다. 이러한 환경 변화는 데이터베이스에 대한 사용이 증가되고 사용의 편리성에 상반된 보안의 취약성을 야기한다. 본 논문에서는 이러한 문제점을 해결하기 위하여 패킷 분석을 통해 내부인 불법 질의를 탐지하는 방법을 제안한다. SQL 구문에 관련된 패킷을 분석 자료로 구축하기 위해서 네트워크 상의 패킷을 읽어 들여 각 프로토콜별로 헤더를 분석하였다. 패킷 중에서 TCP 세그먼트의 데이터부분에 SQL구문이 있는 경우 SQL 구문을 사용자 권한 정보와 사용자 하드웨어 정보를 이용하여 분석하므로 사용된 SQL 구문이 사용자의 접근 통제 범위내의 질의가 입력되었는지를 탐지할 수 있는 방법을 제안하고자 한다.

  • PDF

형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용 (Using Syntactic Unit of Morpheme for Reducing Morphological and Syntactic Ambiguity)

  • 황이규;이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권7호
    • /
    • pp.784-793
    • /
    • 2000
  • 기존의 한국어 형태소 해석은 한국어의 교착어 특성상 다양한 형태론적 모호성을 가진다. 이러한 형태론적 모호성은 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스트리의 선택을 어렵게 한다. 한국어에서 이런 형태론적 모호성의 대부분이 보조용언이나 의존 명사와 관련이 있다. 보조용언이나 의존명사는 주위의 형태소들과 강한 결합 관계를 가지고 있으며, 대부분 자립성이 없는 기능형태소이다. 결합된 형태소들은 문장 내에서 하나의 기능적 역할이나 구문적 역할을 수행한다. 우리는 품사 태깅된 20 만 어절 크기의 말뭉치로부터 이 형태소열을 찾아 이를 3가지 유형으로 분류하였다. 그리고, 이를 구문 형태소로 정의하고 구문 형태소를 구문 분석의 기본 입력 단위로 간주하였다. 본 논문에서는 구문 형태소가 아래와 같은 문제의 해결에 있어서 효율적인 방법임을 제안한다: 1) 형태소 해석의 축소, 2) 구문 해석 도중 불필요한 부분 파스트리의 배제, 3) 구문 모호성의 축소. 마지막으로, 실험 결과를 통해 구문단위 형태소가 형태소 및 구문 모호성을 축소하기 위해 반드시 필요함을 보인다.

  • PDF

확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기 (A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules)

  • 이수광;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.48-460
    • /
    • 2001
  • 국어사전의 뜻풀이말은 표제어의 의미를 기술할 뿐만 아니라, 상위/하위개념, 부분-전체개념, 다의어, 동형이의어, 동의어, 반의어, 의미속성 등의 많은 의미정보를 내재하고 있다. 본 연구는 뜻풀이말에서 다양한 의미정보를 획득을 위한 기본적인 도구로서 국어사전의 뜻풀이말 구문분석기를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어사전의 뜻풀이말을 대상으로 일정한 수준의 품사 및 구문 부착 말 뭉치를 구축하고, 이 말뭉치들로부터 품사 태그 중의성 어절의 빈도 정보와 통계적 방법에 기반한 문법규칙과 확률정보를 자동으로 추출한다. 본 연구의 뜻풀이말 구문분석기는 이를 이용한 확률적 차트파서이다. 품사 태그 중의성 어절의 빈도 정보와 문법규칙 및 확률정보는 파싱 과정의 명사구 중의성을 해소한다. 또한, 파싱 과정에서 생성되는 노드의 수를 줄이고 수행 속도를 높이기 위한 방법으로 문법 Factoring, Best-First 탐색 그리고 Viterbi 탐색의 방법을 이용한다. 문법규칙의 확률과 왼쪽 우선 파싱 그리고 왼쪽 우선 탐색 방법을 사용하여 실험한 결과, 왼쪽 우선 탐색 방식과 문법확률을 혼용하는 방식이 가장 정확한 결과를 보였으며 비학습 문장에 대해 51.74%의 재현률과 87.47%의 정확률을 보였다.

  • PDF

의존명사를 포함하는 보조용언의 구묶음 (Chunking of Auxiliary Verbs including Dependant Nouns)

  • 김태웅;조희영;서형원;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.279-284
    • /
    • 2006
  • 한국어 부분 구문분석의 단위인 말덩이(chunk)는 하나의 의미적 중심어를 가지며, 그 구문구조가 선형인 구를 말하며, 말덩이를 분석하는 과정을 구묶음(chunking)이라고 한다. 한국어 말덩이에는 여러 종류가 있으며 보조용언도 말덩이의 한 종류이다. 이 논문은 (한국해양대학교, 2005)의 연구를 바탕으로 오류를 자주 발생시킨 의존명사를 포함하는 보조용언에 대한 명확한 기준을 제시하여 구축된 말뭉치의 신뢰성을 더욱 높이고자 한다. 이 논문에서는 모든 의존명사를 포함하는 보조용언을 다루기에는 더 많은 연구가 필요하므로 "것", "바", "때문", "데" 등의 의존명사를 포함하는 보조용언을 구성하는 말덩이를 중심으로 명확한 기준을 언어학적인 방법으로 제시하고 말뭉치 구축 오류를 방지할 수 있는 해결방안을 모색한다.

  • PDF

전역 및 지역 정보를 이용한 SVM 기반 한국어 문장 구조 및 격 레이블 분석 (Labeled Statistical Korean Dependency Parsing with Global and Local Information)

  • 임수종;이창기;장명길;나동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.207-212
    • /
    • 2009
  • 한국어 문장의 구조 및 격 레이블 분석을 위해서 SVM 모델을 이용하여 얻어진 전역 및 지역 정보 통계 모델에 기반한 방법을 제안한다. 제안하는 방법은 후방 beam search 알고리즘을 이용하여 부분 구문 분석을 하는 과정에서 지역 의존 정보를 사용하였고 이렇게 구성된 문장의 후보 구조에 대해서는 전역 정보 모델를 사용하여 최적의 문장 구조 및 격 레이블을 분석하였다. 제안하는 방법은 지역이나 전역 중 한 개의 모델만을 사용할 때 발생할 수 있는 오류를 최소화하였다. 지식 DB 사업의 한국어 의존 구문 분석 말뭉치를 이용하여 실험한 결과 전역 정보나 지역 정보만을 사용한 결과보다 각각 1.2%, 3.3% 높은 79.1%의 문장 구조 및 격 레이블 분석 정확률을 나타냈고 전역 정보만을 사용할 때보다 약 76배 이상의 빠른 속도 향상을 보였다. 향후 연구로는 지배소 단위, 구 묶음 단위 등으로 통계 정보를 세분화하여 좀더 높은 성능 향상을 기대한다.

  • PDF

점진적 스레드 트리를 구성하기 위한 파싱 알고리즘 (A Parsing Algorithm for Constructing Incremental Threaded Tree)

  • 이대식
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.91-99
    • /
    • 2006
  • 점진적 파싱 기법은 프로그램의 점진적 구성을 허용하는 언어기반 환경의 중요한 부분이며, 프로그램의 변경된 부분에 대해서만 구문분석을 다시 함으로써 시스템의 성능을 향상 시킨다. 기존의 점진적 파싱은 파싱 정보를 저장하기 위해 스택 자료구조를 사용한다. 본 논문에서는 스택 자료구조를 사용하지 않고 노드 주소로 스레드를 추가하여 스레드 트리 구성 알고리즘을 제안한다. 또한 구성된 스레드 트리를 사용하여 5단계의 점진적 파싱 과정으로 나누어 점진적 스레드 트리 구성 알고리즘을 제안한다.

  • PDF