• 제목/요약/키워드: 구문패턴

검색결과 112건 처리시간 0.026초

디지털 콘텐츠의 URL 식별패턴 표준화에 관한 연구 (A Study on the Standardization of URL Identifier Pattern for Digital Contents)

  • 김문정;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.265-270
    • /
    • 2001
  • 아날로그 환경에서와 마찬가지로 디지털 환경에서도 디지털 컨텐츠 하나 하나에 고유 식별기호를 부여하여야 한다. 이러한 디지털 컨텐츠를 위한 식별기호로 IETF(Internet Engineering Task Force)에서는 URI(Uniform Resource Identifier)체계 하에 인터넷 자원에 대한 접근 메카니즘을 지정하는 URL (uniform resource locator)을 사용하고 있다. 그러나 도서관의 경우 각각 다른 OPAC(Online Public Access)시스템 환경 하에서 각각 다른 URL 식별 패턴을 사용하고 있기 때문에 동일한 자원을 검색하는데 있어서 문제가 되고 있는 것이 현실이다. 이러한 문제에 착안하여 본 연구는 디지털 콘텐츠에 대한 URL 식별구문패턴의 표준화 방안을 연구하고자 한다.

  • PDF

실시간 시스템의 실행 공간상에서 구문 및 의미패턴에 기반한 상태 최소화를 위한 추상화 방법 (An Abstraction Method for State Minimization based on Syntactic and Semantic Patterns in the Execution Space of Real-Time Systems)

  • 박지연;조기환;이문근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.103-116
    • /
    • 2003
  • 정형기법을 사용하여 실시간 시스템을 명세할 때. 상태 기반 정형 기법이 가지는 큰 문제 중의 하나는 시간 값. 자료 값, 위치 값을 통한 상대 표현으로 발생하는 상태 폭발이다. 본 논문에서는 상태 폭발 문제를 접근하기 위해, 시스템의 명세에 적용하는 추상화와, 명세된 시스템의 실행에 적용하는 추상화 기법을 정의하였다. 명세 구문에 정의한 추상화를 추문 추상화라 정의하고 명세 구문이 가진 패턴(연산 정보, 구조)을 정의하여 추상화한다. 실행에 적용되는 추상화는 의미 추상화라 정의하고 실행 시 생성되는 시간, 자료, 위치 상태 값이 파진 실행 의미의 패턴을 추상화한다. 추상화를 통하여 명세 모델과 실행 모델에 계층을 생성하여 상위 계층에서는 복잡도가 낮은 단계에서 시스템의 개략적인 정보를 분석할 수 있다. 하위 계층에서는 정확도가 높은 분석을 수행할 수 있는 반면에 많은 상태를 살펴야되기 때문에 높은 복잡도를 가진다. 본 논문에서는 추상화의 정의와 더불어, 적용 사례를 통하여 상태 감소와 계층성 생성, 복잡도 감소를 보인다.

구문 분석 결과를 이용한 한국어 무제한 정보추출 (A Syntax-Based Hybrid System for Korean Open Information Extraction)

  • 김병수;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-45
    • /
    • 2015
  • 무제한 정보추출은 주로 영어를 대상으로 연구가 진행 되었지만, 최근에는 영어가 아닌 다른 언어에 대한 적용이 시도되고 있다. 본 논문에서는 관계 어휘의 유형을 동사형과 명사형 2가지로 정의하고, 각 유형별로 구문 분석 결과 기반의 서로 다른 방법론을 적용하는 한국어 대상 무제한 정보추출 시스템을 소개한다. 동사형 관계 어휘에 대해서는 의존 관계 기반의 추출 규칙을 적용하고, 명사형 관계 어휘에 대해서는 대량의 말뭉치로부터 자동으로 학습한 의존 관계 구조 기반의 추출 패턴을 적용한다. 임의의 100개 문장에 대해서 수행한 결과는 산출된 전체 트리플에 대해 0.8이상의 정밀도를 보임으로써 본 논문에서 제안하는 방법의 효용성을 증명하였다.

  • PDF

'For/From V-ing' 사역구문의 전치사 for/from 교체현상 연구 (For/from Alternations in Causative 'FOR/FROM V-ing' Constructions)

  • 김미자
    • 비교문화연구
    • /
    • 제49권
    • /
    • pp.1-32
    • /
    • 2017
  • 본 논문은 보어로 사용된 사격 구문의 구조 및 의미적 특징을 논의하고, 비정형 V-ing 보어절 구문에 사용된 전치사 for와 from의 교체현상에서 드러난 문법적 특징을 고찰한다. 본 논문에서는 경험적 자료에 근거해 이 구문에서 사용되는 주절 동사를 기준으로 세 가지 유형의 통사적 패턴이 있다는 것을 제시하고, 이와 동시에 이 세 가지 통사 유형이 의미와 긴밀하게 연결되어 있다는 사실을 제시한다. 이런 유형분류는 수동태와 동사적 상에서 그 근거를 제시한다. 또한 비정형 V-ing절을 이끄는 전치사 for와 from의 기능을 고려해 본다면, 전치사로 취급하는 것이 타당하다는 견해를 제시한다.

학술지 디지털 콘텐츠 식별패턴에관한 연구 (A Study on the Identifier Pattern of Digital Contents of the Journal)

  • 김문정
    • 정보관리연구
    • /
    • 제33권2호
    • /
    • pp.67-94
    • /
    • 2002
  • 현대 사회의 발전과 더불어 수많은 매체나 환경을 통해 정보를 접하고 공유하며 살아가고 있다. 그러나 디지털 정보원에 대한 식별패턴이 도서관에서 사용하는 정보시스템에 따라 각기 다르다는 문제점을 지니고 있다. 이에 본 연구는 신속하고 편리한 디지털 콘텐츠의 검색을 위하여 아날로그 환경에서의 식별체제와 인터넷 자원을 대상으로 한 디지털 콘텐츠의 식별체제와 현황을 고찰하였다. 또한 OPAC 환경에서의 학술지 검색의 식별패턴 구조의 문제점을 분석하여 식별패턴 표준화의 필요성을 제시하고자 한다. 디지털 콘텐츠에 대한 효과적인 식별구문의 표준화 필요성을 제시하기 위해 본 연구는 아날로그 환경에서의 ISBN, ISSN과 디지털 환경에서의 URI체계 하의 URL, URN, URC의 식별체제 구조를 고찰하였다. 각 대학도서관 OPAC 시스템의 상이한 URL 식별 구문으로 인한 문제점을 분석한 후 효과적인 식별패턴에 대한 표준안을 제시하였다.

두단계 대역어선택 방식을 이용한 구단위 패턴기반 한영 기계번역 시스템 (Phrase-Pattern-based Korean-to-English Machine Translation System using Two Level Word Selection)

  • 김정재;박준식;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-214
    • /
    • 1999
  • 패턴기반기계번역방식은 원시언어패턴과 그에 대한 대역언어패턴들의 쌍을 이용하여 구문분석과 변환을 수행하는 기계번역방식이다. 패턴기반 기계번역방식은 번역할 때 발생하는 애매성을 해소하기 위해 패턴의 길이를 문장단위까지 늘이기 때문에, 패턴의 수가 급증하는 문제점을 가진다. 본 논문에서는 패턴의 단위를 구단위로 한정시킬 때 발생하는 애매성을 해소하는 방법으로 시소러스를 기반으로 한 두단계 대역어 선택 방식을 제안함으로써 효과적으로 애매성을 감소시키면서 패턴의 길이를 줄이는 모델을 제시한다. 두단계 대역어 선택 방식은 원시언어의 한 패턴에 대해 여러 가능한 목적언어의 대역패턴들이 있을 때, 첫 번째 단계에서는 원시언어 내에서의 제약조건에 맞는 몇가지 대역패턴들을 선택하고, 두번째 단계에서는 목적언어 내에서의 제약조건에 가장 적합한 하나의 대역패턴을 선택하는 방식이다. 또한 본 논문에서는 이와 같은 모델에서 패턴의 수가 코퍼스의 증가에 따른 수렴가능성을 논한다.

  • PDF

자연언어 데이터베이스 인터페이스 시스템을 위한 프레임워크 (A Framework for Natural Language Database Interface System)

  • 임경업;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.593-596
    • /
    • 2009
  • 자연언어 데이터베이스 인터페이스 시스템은 입력된 자연언어를 데이터베이스의 질의문(query)으로 바꿔주는 시스템으로, 데이터베이스에 잘 모르는 일반 사용자도 쉽게 데이터베이스를 이용할 수 있게 하는 장점이 있다. 본 논문에서는, 범용적인 분야의 자연언어 데이터베이스 인터페이스 시스템을 설계하기 위한 하나의 틀을 제안한다. 패턴 매칭과 구문 분석 기법을 동시에 사용하여 자연언어 처리 능력과 속도를 향상시켰으며, 패턴을 4개 분류로 나누어 의미 처리를 가능하게 하였다.

기계 번역을 위한 한국어 문장 패턴에 관한 연구 (A Study on the Sentence Pattern of the Korean Language for Machine Translation)

  • 송재관;홍성웅;박찬곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.308-312
    • /
    • 1996
  • 본 연구에서 말뭉치를 이용하여 기계 번역을 위한 한국어 문장 패턴을 추출하였다. 문장 패턴은 해당 언어의 기본 문법 구조를 가지고 있기 때문에 언어 습득을 위해서 유용하다. 기계 번역을 위해서는 기본 문법 구조뿐만 아니라 각 단어간의 의미 관계를 나타낼 수 있어야 한다. 본 연구는 품사 태깅 및 명사에 의미 소성을 태깅하여 한국어의 문장 패턴을 추출하였다. 추출된 문장 패턴은 구문분석시 애매성을 해소할 수 있으며, 동음다의어의 해석이 가능하며, 의미의 부정합 판정이 가능하다.

  • PDF

질의응답시스템을 위한 서술형 정답 추출 (A Extraction of Descriptive Answer for a Question-Answering System)

  • 고병일;강유환;신승은;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.303-307
    • /
    • 2004
  • 본 논문에서는 서술형 정답을 요구하는 질의에 대해 올바른 서술형 정답을 추출하는 서술형질의응답시스템에 대해 기술한다. 질의응답시스템에서 요구되는 다양한 서술형 정답을 추출하기 위해 정답 유형을 10가지로 정의하였다. 말뭉치로부터 각 서술형 정답 유형에 대한 정답 패턴을 정의하고, 패턴별 제약 규칙 및 각 유형별 패턴적용 순위화 등을 사용하여 정확한 서술형 정답이 추출되도록 하였다. 정답 패턴은 서술형 정답의 구문 구조 및 각 패턴 또는 정답 유형별 실마리 어휘 등으로 구성된다. 현재 학습되지 않은 일반 문서에 대해 59.2%의 서술형 정답 추출 정확도를 보이며, 시스템 성능 향상을 위해 연구가 진행중이다.

  • PDF

한중 기계번역 시스템을 위한 동사구 패턴 반자동 확장 방안 연구 (A Study on Semi-Automatic Construction of Verb Patterns for a Korean-Chinese MT System)

  • 홍문표;류철;김영길;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.273-278
    • /
    • 2003
  • 본 논문에서는 한-중 기계번역 시스템에서 사용되는 한중 동사구 패턴의 반자동 생성을 위한 방법론을 제안한다. 한중 동사구 패턴은 한국어와 중국어간의 변환을 위한 정보를 제공할 뿐만 아니라, 한국어의 구문분석과 중국어의 생성을 위해 중요한 정보를 제공하는 고급 언어자원이다. 본 논문에서 제시하는 새로운 패턴 반자동확장 방안은 기존의 한중 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 동사구 패턴을 생성해내는 방법이다. 본 방법론은 시스템 개발 초기에 일반적으로 이루어지는 사전기반 패턴 구축이 끝난 후, 패턴의 커버리지 문제를 해결하기 위해 실용적으로 적용할 수 있는 방법론으로서, 한국어와 중국어 같이 활용 가능한 대역 코퍼스가 아직 많지 않은 경우에 효과적이다. 본 논문에서 제시한 방법론은 실험 결과 67.15%의 정확률과 4.58배의 패턴 확장률을 나타냈다.

  • PDF