• 제목/요약/키워드: 속성 문법

검색결과 58건 처리시간 0.023초

IT 인물 관련 텍스트 정보의 효율적인 검색을 위한 Sub-language의 속성 연구 (Studies on the linguistic properties of the IT-People documents for an efficient Information Retrieval)

  • 고승희;김소연;천승미;남지순;김권양;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.241-249
    • /
    • 2007
  • 본 연구는 IT 인물 관련 텍스트 정보의 효율적인 검색을 위하여 문서 내에서 인물과 관련된 정보를 담고 있는 문장들이 어떠한 특징을 가지고 실현되는가를 살펴보고 언어적 속성을 어떻게 구조화하고 형식화할 것인가를 논의하는 것을 목적으로 한다. 언어적 속성 분석을 위해서 전자신문 내에서 인물 관련 코퍼스를 수집하고 이들의 분석을 통해 다음과 같이 문제가 되는 특징들을 확인하였다. 즉 외래어 음차 표기문제, 복합명사 및 명사구 그리고 서술 명사적 표현의 문제 등으로 요약된다. IT라는 특정 영역에 대해 텍스트 내에서의 어휘-통사적 패턴을 분석하고 언어적 특징에 대한 효율적 기술을 위해서는 LGG 부분 문법 그래프 모델을 활용하도록 한다. 본 연구는 특정 영역인 IT 관련 문서에서 자연언어 텍스트를 대상으로 정보 검색할 때 문제가 되는 다양한 언어학적 현상들을 다루며, 향후보다 확장된 영역에서의 효율적 언어 처리에 대한 방법론적 대안을 제시할 수 있을 것으로 기대된다.

  • PDF

비문법적 실어증의 형태-통사론적 분석 (A morpho-syntactic analysis of agrammatic aphasia in Korean)

  • 김영주
    • 인지과학
    • /
    • 제9권1호
    • /
    • pp.41-46
    • /
    • 1998
  • 이 논문에서는 뇌졸중으로 인한 Broca 유형의 실어증 환자가 회복 초기와 회복이 진행됨에 따라 발화하는 서술어의 논항 구조적 속성이 정상 언어 집단의 서술어 분포와 어떻게 다르며, 또한 편으로는 전도 실어증 환자의 서술어 분포와는 어떻게 다른지 세 환자와, 조건이 비슷한 정상인의 자유 발화 산출 자료를 분석하여 비교한다. Broca 유형 실어증 환자가 발화하는 서술어 중에서 비대격 동사가 차지하는 비율을 언어간 비교해 본 결과, 영어 실어증 환자의 경우에는 계사가 아닌 비대격 동사에 심한 어려움을 겪어 거의 산출되어 못하는 것으로 나타난 반면(Kegl 1995), 한국어 실어증 환자의 경우에는 별다른 어려움을 겪지 않는 것으로 나타났다. 이에 대한 설명으로 영어의 비계사 비대격 구문에서는 d-구조와 s-구조 사이에서 동사에 상대적인 논항 이동이 일어나는 데 반해, 한국어에서는 격 부여라는 동기로 유발되는 그러한 논항 이동이 없거나, 설사 있더라도 공허하기(vacuous) 때문에 비문법적 실어증 환자들이 어려움을 느끼지 않으리라는 제안을 한다.

  • PDF

비정형 자연어 요구 사항 기반 상태 모델을 통한 3D 객체의 상태 표현 메커니즘 (3D Object State Representation via State Diagram based on Informal Natural Language Requirement Specifications)

  • 진예진;서채연;김영철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.494-496
    • /
    • 2024
  • 현재 소프트웨어 산업에서 자연어 요구사항의 정확한 분석 연구는 활발히 진행되고 있다. 그러나, 문법적인 분석만을 통해 해석하는 것이 일반적이다. 본 연구는 요구공학과 언어학 그리고 카툰 공학을 접목을 제안한다. 이를 위해서, 1) 언어학적 관점에는 촘스키의 구문 구조 분석 이론과 필모어의 의미역 이론을 결합하여 문법적, 의미적 분석을 수행한다. 2) 요구공학 관점에서는 요구사항 분석으로 상태 모델 속성 추출 및 접목한다. 3) 카툰 공학에서는 3D 이미지 생성한다. 또한, 해결 못했던 동사와 형용사에 대해 분석하여 범위를 확장한다. 즉 언어학적 분석을 바탕으로 UML 상태 다이어그램을 추출하고, 이를 3D 상태 이미지 생성한다. 본 연구는 AI 기술(Text to Image)에 소프트웨어 공학적 방법에서의 절차적인 공정과 재사용 적용함으로써, AI 내부 작동 원리에 대해 체계적으로 연구하고자 한다.

공간 프로세스 대수를 이용한 정형 명세와 분석에서의 시간속성의 시각화 (Visual Representation of Temporal Properties in Formal Specification and Analysis using a Spatial Process Algebra)

  • 온진호;최정란;이문근
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.339-352
    • /
    • 2009
  • 유비쿼터스 컴퓨팅 환경에서 분산된 실시간 시스템의 행위와 공간, 시간 속성을 분석하고, 검증하기 위한 다양한 정형기법들이 존재한다. 그러나 대부분의 경우 공간과 행위를 같이 표현하는 구조적, 근본적 한계가 존재한다. 게다가 시간 속성이 포함되는 경우는 더욱 복잡해지게 된다. 이러한 한계를 해결하기 위하여 본 논문은 Timed Calculus of Abstract Real-Time Distribution, Mobility and Interaction(t-CARDMI)라는 새로운 정형기법을 제안한다. t-CARDMI는 행위의 표현으로부터 공간정보의 표현을 분리시켜 복잡도를 단순화 시키며, 시간 속성에 대해서 오직 행위적 표현에서만 허용하여 복잡한 명세를 덜 복잡하게 표현한다. t-CARDMI는 대기기간, 실행시작 만족시간, 실행시간, 실행완료 만족시간 등의 특유의 시간속성을 이동과 통신의 행위에서 모두 포함하는 특징을 갖는다. 새롭게 제안된 Timed Action Graph(TAG)는 공간과 시간을 포함하는 시스템의 명세를 분석하고 검증하기 위해서 공간과 시간속성을 2차원의 다이어그램으로 표현하며 그 안에서 이동과 통신의 정보를 분산된 그림정보로 표현하는 그래프로 t-CARDMI를 좀더 효율적으로 명세하고 분석할 수 있는 방법을 제공한다. t-CARDMI는 유비쿼터스 컴퓨팅에서의 분산된 실시간 시스템의 공간적, 행위적, 시간적 속성에 대한 명세, 분석 및 검증에 매우 효율적이고 효과적인 혁신적인 정형기법의 하나로 고려될 수 있다. 본 논문은 t-CARDMI의 문법과 의미, TAG 그리고 Specification, Analysis, Verification, and Evaluation (SAVE)로 명명된 툴을 제안하고 유비쿼터스 헬스케어 시스템 예제를 통해 효율성을 분석한다.

언어 유형학적인 비교를 통한 독일어와 한국어 동사의 부정성 ($Infinitivit\"{a}t$ des deutschen und koreanischen Verbs - Im sprachtypologischen Vergleich beider Sprachen)

  • 박진길
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.79-98
    • /
    • 2002
  • 지금까지 우리는 한국어와 독일어를 비교하면서 동사의 정형과 부정형을 관찰해 왔다. 이 부정성(역으로 말하면 비구속성)은 한국어 동사에는 전반적으로 통용되는 데 반해 독일어에는 부정형/동사원형과 분사가 그러할 뿐이다. 동사의 특성 연구는 어느 자연어/개별언어의 상이한 기능을 위해서 뿐만이 아니라 외국어 학습/습득을 위해서도 큰 의미를 갖는다. 이러한 중요성에도 불구하고 독특한 한국어 동사의 부정성, 그 연구는 거의 찾아볼 수가 없다. 한국어와 독일어 동사의 부정성 비교에서 드러난 문제점은 대체로 다음과 같이 요약될 수 있을 것이다. $\ast$ 한국어 동사의 특징인 부정성은 우리의 운명으로 간주해야 할 것이다. 왜냐하면 우리가 어떤 면에서는 유익함을, 그리고 어떤 다른 면에서는 문제점을 감수해야 하기 때문이다. 특히 전형적인 전치성 언어인 유럽언어를 습득할 때 언어간섭현상을 통해 그러하다. $\ast$ 독일어의 부정사/분사 및 한국어 동사가 인칭변화를 하지 않는다는 것은 그들이 주어를 갖지 않고 있거나 (독일어의 경우), 아니면 그것이 어떤 문법/통사적 역할을 하는가 (한국어의 경우)에 주된 원인이 있다. $\ast$ 비교 대상의 양쪽은 생략가능성, 즉 원자가 요구에 대한 자유/비구속성을 누린다. 핵(성분), 즉 독일어의 부정형 및 분사 그리고 한국어 동사는 혼자 남을 때까지 생략이 계속될 수 있다. 이러한 의미에서 부정성은 <비한정성/비구속성>과 관련된 것 같으며, 반면에 정동사의 특성은 <한정성/구속성>과 관계되어 있다. $\ast$ 원자가 요구/충족에 대한 자유/비구속성은 한국어 동사/술어가 문장 끝에 고정되어 있다는 사실은, 직접 또는 간접으로 본동사 앞에 놓여 있어야 되는 모든 문장성분과 부문장 때문에, 즉 한국어의 전면적인 전위수식 현상으로 흔히 큰 부담/복잡함을 야기한다는 데에 그 원인이 있다. 이러한 상황에서 동사는 가능한 한 그의 문장성분을 줄이려 한다. 통사적으로 보장되어 이미 있으니 말이다. 그래서 한국어 동사의 부정성은 일종의 부담해소 대책으로 간주될 수 있을 것이다. $\ast$ 두 비교 대상에서의 핵 및 최소문장 가능성은 역시 원자가에 대한 비구속성에서 비롯된다. $\ast$ 우리 한국인이 빨리 말할 때 흔히 범하는 부정성으로 인한 인칭변화에서의 오류는 무엇보다도 정형성/제한성을 지닌 독일어 정동사가 인칭 변화하는 데 반해 한국어에서는 부정성/비구속성을 지닌 동사가 그것과는 무관한 페 기인한다. 동사의 속성을 철저히 분석함으로써 이런 과오를 극복해야 할 것이다. 한국어 동사의 부정성은 지금까지 거의 연구되지 않았다. 이 문제는 또한 지속적으로 수많은 다른 자연어들과의 비교분석을 통해 관찰돼야 할 것이다. 이 논문이 이런 연구와 언어습득을 위한 작업에 도움이 되기를 바란다.

  • PDF

XML의 RDF 변환과 저장 및 질의 처리에 관한 연구 (The Study of Storing and Query Processing Strategy based on Transition of XML to RDF)

  • 김연희;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.154-156
    • /
    • 2003
  • 웹 상의 데이터 표현 및 교환의 표준으로 각광받는 XML은 논리적 구조와 내용 정보를 이용하여 보다 정확한 검색이 가능하다. 그러나 더욱 빠른 속도로 증가하는 많은 양의 데이터에 대해 보다 정확하고 풍부한 검색을 하기 위해서 메타데이터를 활용하는 방법이 고려되었고, RDF와 같은 메타데이터 기술 언어들에 대한 연구가 많이 이루어지고 있다. RDF는 XML의 문법 구조를 이용하여 작성되므로 XML 문서를 RDF 형태로 작성한다던가, 약간의 수정을 통해 기존 XML 문서를 RDF 형태로 변환하는 것이 가능하다. XML의 RDF 변환은 여러 이점 때문에 앞으로 활성화될 가능성이 크기 때문에 RDF의 특성을 고려한 저장 및 검색에 대한 연구가 필요하다. 따라서 본 논문에서는 XML을 기본적인 RDF 형태로 변환하는 기본적인 규칙을 소개하고 변환된 RDF 문서를 위한 저장 구조를 제안한다. 제안한 저장 구조는 기존 웹 애플리케이션과의 쉬운 연동을 위하여 관계형 데이터베이스를 기반으로 구성되며, 리소스/속성/값의 RDF 기본 구조를 고려한 세 종류의 테이블로 구성된다. 또한 본 논문에서는 RDF 문서에 대한 키워드 질의 처리를 고려하여, 질의 처리 결과의 단위를 리소스로 정의한다. 그리고 주어진 키워드들에 대한 질의 처리 결과로 반환된 리소스들 간의 중요도를 평가하기 위하여 키워드간의 근접도, 키워드 내포 정도, 다양한 속성 관계를 맺고 있는 다른 리소스들을 고려한 랭킹 평가 기법을 제안한다.

  • PDF

무선 인터넷 서비스를 위한 WAP 게이트웨이용 WML 컴파일러의 설계 및 구현 (A Design and Implementation of WML Compiler for WAP Gateway for Wireless Internet Services)

  • 최은정;한동원;임경식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권2호
    • /
    • pp.165-182
    • /
    • 2001
  • 무선 마크업 언어(Wireless Markup Language) 컴파일러는 텍스트로 구성된 문서를 바이너리 문서로 변환, 압축함으로써, 낮은 대역폭을 갖는 무선 선로에서 트래픽을 감소시키며, 낮은 성능을 갖고 있는 이동 단말기에서 브라우징 처리를 간단하게 하는 역할을 한다. 또한 이러한 변환 과정에서 확장 마크업 언어(eXtensible Markup Language)의 well-formedness와 validation 과정을 동시에 처리함으로써, 이동 단말기에서 문서처리 부담을 대폭 경감하는 효과를 가져온다. 본 논문에서 구현한 무선 마크업 언어 컴파일러는 어휘분석기 모듈과 파서 모듈로 구성되어 있는데, 파서 모듈은 파서 생성기를 사용하여 구현하였다. 이는 향후 응용 수준에서 보안 기능을 제공하기 위하여 태그를 확장하거나 무선 마크업 언어의 버전이 업그레이드 될 때에서 변경된 부분에 해당하는 문법만 다시 설계함을써 유연하게 대처할 수 있는 장점을 가지고 있다. 사용된 문법은 LALR(1) context-free 문법으로서, 확장 마크업 언어 1.0과 무선 마크업 언어 1.2의 문서 형태 정의(Document Type Definition)를 기반으로 무선 응용 프로토콜 바이너리 확장 마크업 언어(Wireless Application Protocol Binary XML) 문법을 고려하여 설계되었다. 구현된 컴파일러의 기능을 실험하여 데모하기 위하여 세 가지 방법(수작업, WML 디컴파일러, 노키아 WAP 툴킷)을 사용하였으며, 다양한 태그 조합을 갖는 임의의 130여 개 문서에 대해 실험한 결과, 최대 85%의 압축효과를 얻을 수 있었다. 그러나, 태그나 속성에 비해 일반 문자열 데이타가 많아지면 상대적으로 압축효과가 감소되므로, Hyper Text Markup Language 문서로부터 무선 마크업 언어 문서로 자동 변환된 텍스트를 인코딩하는 경우와 같이 특정한 응용 분야에서는 일반 문자열에 대한 확장 인코딩 기법을 적용할 필요가 있을 수 있다.

  • PDF

객체 지향 언어를 위한 의미 명세 (Specification of Semantics for Object Oriented Programming Language)

  • 한정란
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.35-43
    • /
    • 2007
  • 의미 기반 표기법은 새로운 프로그래밍 언어를 명세하여 그 언어를 구현하기 위한 정적이고 동적인 의미를 명세하는데 필요한 것이다. 프로그래밍 언어에 대한 의미를 보다 실제적으로 정의하면 그 의미에 따라 언어를 구현함으로써 번역기를 쉽게 만들 수 있다. 본 논문에서는 번역기를 쉽게 만들 수 있는 정적이고 동적인 의미를 명세 하고자 한다. 객체 지향 언어를 위한 정적이고 동적인 의미를 적절하게 명세 할 수 있도록 속성 문법을 확장하고 변형하여 실제적인 의미 기반의 작용식을 제시하였고 기존의 연구 방법과 비교하여 제시된 작용식의 의미 명세가 우월함을 알 수 있었다.

  • PDF

온톨로지 기반의 문서 생성 시스템 (A Document Generation System Based on an Ontology)

  • 류재현;박성배
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.313-316
    • /
    • 2016
  • 온톨로지란 사물이나 개념의 속성이나 관계를 사람과 컴퓨터 모두 이해할 수 있는 형태로 표현한 모델로 정보검색, 인공지능, 소프트웨어 공학 등의 분야에서 많이 활용된다. 온톨로지에는 다양한 정보가 구조화되어 저장되어 있지만 일반적으로 온톨로지가 제공하는 그래프 형태의 데이터들은 사용자들이 직관적으로 이해하기가 힘들다. 따라서 본 논문에서는 온톨로지의 정보를 문장화하여 한국어 문서를 생성하는 시스템을 제안한다. 제안하는 시스템은 주제와 관련된 트리플을 추출하고 이를 문장정렬, 결합, 생성을 위한 정보가 담긴 템플릿을 생성한 뒤 한국어 문법에 맞게 문장을 생성한다. 또한 기존 연구에서 다루지 않았던 이벤트 온톨로지의 내용을 포함하여 문장을 생성한다. 두 온톨로지로부터 생성된 문장을 연결하여 주제어를 설명하는 하나의 문서를 작성한다.

  • PDF

다중 에이전트 기반 워크플로우 모델링 시스템에 관한 연구 (A Study on Multi Agent-Based Workflow Modeling System)

  • 김학성;김광훈;백수기
    • 인터넷정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.19-26
    • /
    • 2002
  • 본 논문에서는 워크플로우 관리 시스템의 빌드타임 기능에 속하는 모델링 시스템을 다중 에이전트 기반으로 구현하였다. 본 논문에서 제안된 다중 에이전트 기반 워크플로우 모델링 시스템은 클라이언트의 경량을 위하여 자바를 이용하였으며, 프로세스 정의에 필요한 세션, 조직, 관련데이터, 응용프로그램 속성들을 별도의 에이전트로 구성하였다 또한, 프로세스 정의를 위한 모델은 ICN(Information Control Net)을 이용하여 작성된 모델의 문법(syntax)를 검증하였으며, 타 워크플로우 엔진과의 연동을 위하여 WfMC에서 정의된 인터페이스 형태인 WPDL로 import/export할 수 있는 기능을 제공한다.

  • PDF