• 제목/요약/키워드: 부분구문분석

검색결과 94건 처리시간 0.02초

XML 스키마 메타모델에서 OCL 생성 (Generate of OCL on XML Sechma Meta Model)

  • 이돈양;최한용
    • 한국콘텐츠학회논문지
    • /
    • 제6권6호
    • /
    • pp.42-49
    • /
    • 2006
  • XML이 인터넷에서 정보전송을 위한 메타언어의 표현방법으로 급속하게 이용되고 있다. 아울러 XML 스키마는 XML 데이터의 다양한 유형을 표현하는데 사용하는 빈도수가 늘고 있다. 본 논문에서는 UML을 이용한 XML 스키마의 simpleType형 메타모델에 대한 설계를 하였다. 그러나 XML 스키마의 구조가 복잡하고 다양한 데이터의 유형을 지원하기 때문에 UML에서 나타내고 있는 모델의 속성에 대한 사용자의 이해와 적용에 어려운 부분이 많이 발생하는 것을 알 수 있다. 이를 해결하는 방법으로 본 연구에서는 OCL의 기능을 적용하여 XML 스키마 메타모델에서 구조적인 표현을 명확하게 명시할 수 있도록 하였으며, 아울러 이를 바탕으로 컴파일단계에서 어휘분석과 구문분석을 위한 파스트리와 토큰생성에 대한 구체적인 설계방법을 제시하였다.

  • PDF

행위 그래프 기반의 변종 악성코드 탐지 (Metamorphic Malware Detection using Subgraph Matching)

  • 권종훈;이제현;정현철;이희조
    • 정보보호학회논문지
    • /
    • 제21권2호
    • /
    • pp.37-47
    • /
    • 2011
  • 네트워크 및 컴퓨터의 발전에 따라 악성코드 역시 폭발적인 증가 추이를 보이고 있으며, 새로운 악성코드의 출현과 더불어 기존의 악성코드를 이용한 변종 역시 큰 몫을 차지하고 있다. 특히 실행압축 기술과 코드 난독화를 이용한 변종들은 제작이 쉬울 뿐만 아니라, 자신의 시그너쳐 혹은 구문적 특징을 변조할 수 있어, 악성코드 제작자들이 널리 사용하는 기술이다. 이러한 변종 및 신종 악성코드를 빠르게 탐지하기 위해, 본 연구에서는 행위 그래프 분석을 통한 악성코드 모듈별 유사도 분석 기법을 제안한다. 우리는 우선 악성코드들에서 일반적으로 사용하는 2,400개 이상의 API 들을 분석하여 총 128개의 행위로 추상화 하였다. 또한 동적 분석을 통해 악성코드들의 API 호출 순서를 추상화된 그래프로 변환하고 부분 그래프들을 추출하여, 악성코드가 가진 모든 행위 부분 집합을 정리하였다. 마지막으로, 이렇게 추출된 부분 집합들 간의 비교 분석을 통하여 해당 악성코드들이 얼마나 유사한지를 분석하였다. 실험에서는 변종 을 포함한 실제 악성코드 273개를 이용하였으며, 총 10,100개의 분석결과를 추출하였다. 실험결과로부터 행위 그래프를 이용하여 변종 악성코드가 모두 탐지 가능함을 보였으며, 서로 다른 악성코드들 간에 공유되는 행위 모델 역시 분석할 수 있었다.

확장된 PLR(1) 문법에 대한 단일 틈 파싱 (A One-Gap Parsing with Extended PLR(1) Grammars)

  • 이경옥
    • 정보과학회 논문지
    • /
    • 제42권3호
    • /
    • pp.361-366
    • /
    • 2015
  • 틈(Gap) 파싱은 완전하지 않고 틈이 있는 입력 스트링에 대한 구문 분석을 수행한다. 이런 틈 파싱에 관한 기존 연구로서 임의의 문법에 대한 단일 틈 파싱 알고리즘과 LL(1) 문법에 대한 단일 틈 파싱 알고리즘이 제안되었으며, 이들의 시간복잡도는 각각 $O(n^3)$$O(n^2)$이다. 본 논문에서는 확장된 PLR(1) 문법에 대한 단일 틈 파싱 알고리즘을 제안한다. 확장된 PLR(1) 문법은 LR(1) 문법의 부분 클래스이지만 LL(1) 문법보다는 휠씬 넒은 범위의 문법 클래스이다. 이 문법 클래스에 대한 단일 틈 파싱 알고리즘이 LL(1) 문법에 대한 기존에 알려진 단일 틈 파싱 알고리즘의 복잡도와 동일한 $O(n^2)$임을 보인다.

X-바 이론을 변형한 자질기반의 한국어 구구조 문법 (Feature-based Korean Phrase Structure Grammar adjusting X-bar Theory)

  • 박소영;황영숙;정후중;곽용재;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.222-229
    • /
    • 1998
  • 본 논문에서는 X-바 이론을 한국어에 적용하여 서로 다른 범주들간의 구조적 일반성을 파악하고, 한국어에 가능한 규칙만을 허용하여 불가능한 규칙을 배제시킬 수 있는 틀을 제시하고자 한다. 한국어가 비중심어간 어순이 자유롭고 기능어가 발달했다는 점을 고려하여, 중심어와 보충어 관계 중심의 기존 X-바 이론을 통사적 파생과 의미적 파생, 수식 및 하위범주의 관계를 중심으로 변형한다. 또한, 한국어의 빈번한 생략현상과 부분 자유 어순에 효과적으로 대응할 수 있도록 이진결합 중심의 CNF(Chomsky Normal Form)를 따른다. 제안하는 자질기반의 한국어 구구조 문법은 직관적이고 간단하면서도 대부분의 문장을 처리할 수 있을 만큼 표현력이 뛰어나다는 장점이 있다. 신문기사에서 454문장을 추출하여 실험한 결과, 약 97%의 문장에 대해 올바른 구문 분석 결과를 생성할 수 있음을 보였다.

  • PDF

EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링 (Verb Clustering for Defining Relations between Ontology Classes of Technical Terms Using EM Algorithm)

  • 김미훈;남상협;이용훈;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.233-240
    • /
    • 2007
  • 온톨로지 구축에서 클래스간 관계 설정은 중요한 부분이다. 본 논문에서는 클래스간 상 하위 관계 외의 관계 설정을 위한 클래스간 관계 자동 정의를 목적으로 의존구문분석의 (주어, 용언) (목적어, 용언) 쌍들을 추출하고, 이렇게 추출된 데이터를 이용하여 용언들을 클러스터링 하는 방법을 제안한다. 도메인 전문 코퍼스 데이터 희귀성 문제를 해결하고자, 웹검색을 결합한 방식을 선택하여 도메인 온톨로지 구축 클래스간 관계 자동 설정에 대한 방법론을 제시한다.

  • PDF

그린인프라스트럭처 개념을 적용한 가로 녹시율 개선 방안 - 중국 쓰촨성(四川省) 청두시(成都市)을 중심으로 - (A Green View Index Improvement Program for Urban Roads Using a Green Infrastructure Theory - Focused on Chengdu City, Sichuan Province, China -)

  • 호우슈쥔;정태열
    • 한국조경학회지
    • /
    • 제51권6호
    • /
    • pp.61-74
    • /
    • 2023
  • 그린인프라스트럭처(Green Infrastructure)의 개념은 자연 시스템과 도시 사회 시스템 간의 밀접한 관계를 강조하며, 생태 환경을 보호하고 인간의 삶의 질을 향상시키는 서비스를 제공한다. 녹시율은 도시의 녹지 공급을 측정하는 중요한 지표로, 녹피율보다 더 많은 3차원 공간 요소를 포함한다. 가로 녹지는 도시 그린인프라스트럭처의 중요한 부분이며 가로 녹시율의 개선은 도시 기후 위기에 대처하고 인간의 복지를 향상시키는 데 매우 중요하다. 본 연구는 중국 쓰촨성(四川省) 청두시(成都市)의 3순환가로 이내 지역을 중심으로 한다. 연구 목적은 첫째, 스트리트뷰 이미지 데이터를 활용하여 가로 녹시율의 공간 분포 특성 및 도시 공원 녹지 시스템과의 상관관계를 분석하는 것이다. 둘째, 낮은 녹시율 가로의 특성을 분석한다. 셋째, 공간 구문론을 활용하여 도로 교통과 가로 녹시율의 연결성을 분석한다. 연구 결과를 살펴보면, 첫째, 연구 범위 내에서 남서부 가로 녹시율은 북동부보다 높다. 가로 녹시율의 공간적 분포는 도시 공원 녹지와 상관관계가 있다. 둘째, 낮은 녹시율의 가로 이미지는 주로 상업 시설 집적 지역, 도시 신규 건설 지역, 고가가로 및 주변, 도시 4급 이하 가로, 교차로 지역에 집중되어 있다. 셋째, 도시 교통과 인구 집중 지역에서 높은 통합도와 낮은 녹시율의 가로는 주로 1순환가로 중심 지역에 집중되어 있다. 이는 향후 쓰촨성 청두시 가로 녹시율를 개선하기 위한 기초자료를 제공할 수 있다.

웹기반 언어 학습시스템을 위한 한국어 철자/문법 검사기의 성능 향상 (Improving a Korean Spell/Grammar Checker for the Web-Based Language Learning System)

  • 남현숙;김광영;권혁철
    • 인지과학
    • /
    • 제12권3호
    • /
    • pp.1-18
    • /
    • 2001
  • 이 논문의 목적은 한국어 철자/문법 검사기를 교육적으로 활용한 웹 기반 국어 작문 학습 시스템의 구현이다. 웹 기반 학습시스템 \\`우리말 배움터\\`의 학습효과를 최대화하려면 한국어 철자/문법 검사기의 성능을 꾸준히 향상해야 한다 오늘날 자연어처리 시스템의 성능은 의미처리를 얼마나 정확하게 수행하는가에 달려있다 한국어 철자/문법 검사기에서 의미처리와 관련이 있는 부분은 철자 검사기에서 접사나 꼬리말과 파생하는 단어와 복합명사를 교정하는 처리기와 의미·문체 오류를 교정하는 문법 검사기이다. 본 시스템에서는 의미처리를 위하여 의존문법에 기반하여 부분문장분석과 연어관계정보를 이용한다. 여기에 더 세부적인 규칙을 추가하기 위해 단어를 개념적으로 분류하고 문장의 핵심요소인 동사를 하위범주화한 결과를 적용한다. 의미처리 기능을 강화한 철자/문법 검사기를 온라인으로 운영함으로써 웹에 기반한 한국어 학습시tm템과 통합된 환경에서 능동적이고 지능적인 학습 모형을 구현한다. 이 논문에서 다루는 의미처리의 대상은 주로 구문 단위이기 때문에 여러 개의 절이 모여 하나의 문장이 된 복문이나 중문은 다루지 못하고 있다. 또한 일률적인 체계 속에서 단어를 의미적으로 분류하는 데에도 많은 한계가 있다. 한편 이러한 자연어처리시스템을 웹 기반 학습시스템에 연결하여 효율적인 학습효과를 거두려면 학습내용 구성이나 인터페이스 설계 면에서도 고려해야 할 중요한 문제가 많다. 결론에서는 아직 완전하게 해결하지 못한 문제에 대해 고찰한다.

  • PDF

한국어 특성을 고려한 감성 분류 (Sentiment Classification considering Korean Features)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권3호
    • /
    • pp.449-458
    • /
    • 2010
  • 다양한 분야에서 인터넷 상의 방대한 양의 문서 혹은 리뷰로부터 유용한 정보를 얻고자 하는 노력이 높아짐에 따라 문서 혹은 리뷰 상의 생각 및 의견에 대한 자동 분류 연구의 필요성이 대두되었다. 이러한 자동분류를 감성 분류라 하며, 감성 분류 연구는 크게 세 가지 단계를 가지는데, 첫 번째로 주관적인 생각이나 느낌을 표현하는 문장을 추출하기 위한 주관성 분류 연구, 두 번째로 문서 또는 문장을 긍정, 부정으로 나누는 극성 분류 연구, 그리고 세 번째로 문서 또는 문장이 어느 정도의 주관성 및 극성을 갖는지 그 강도를 구하는 강도 분류 연구이다. 최근 의견 분류에 대한 연구들을 살펴보면, 분류를 위해 자질(Feature)로서 단일어(Single word)가 아닌 2개 이상의 N-gram 단어, 어휘 구문 패턴 및 통사 구문 패턴 등을 사용하는 것을 확인할 수 있다. 특히, 패턴은 단일어나 N-gram 단어에 비해 유연하고, 언어학적으로 풍부한 정보를 표현할 수 있기 때문에 이를 이용한 많은 연구가 이루어져 왔다. 그럼에도 불구하고, 이러한 연구들은 주로 영어에 대한 연구들이었으며, 한국어에 패턴을 적용하여 주관성을 갖는 문장을 분류하거나, 극성을 분류하는 연구들은 아직 미비하다. 한편, 한국어는 용언의 활용이 발달되어 있어, 어미의 변화가 다양하며, 그 변화에 따라 의미가 미묘하게 변화한다. 그러나 기존 한국어에 대한 의견 분류 연구들은 단어의 핵심 의미만을 파악하기 위해 어미부분을 제거하고 어간만을 취해서 처리하여 어미에 대한 의미변화를 고려하지 못하였다. 그래서 본 연구는 영어에 적용된 패턴을 이용한 기존 방법들을 정리하고, 그 방법들 중에서 극성을 지닌 문장성분 패턴을 한국어에 적용하였다. 그리고 어미의 변화에 대한 패턴을 추출하여 이 변화가 의견 분류의 성능에 미치는 영향을 분석하였다.

  • PDF

중등 컴퓨터과학교육을 위한 객체지향형 EPL '두리틀'의 적용 및 평가 (Application and Evaluation of Object-Oriented Educational Programming Language 'Dolittle' for Computer Science Education in Secondary Education)

  • 권대용;길혜민;염용철;유승욱;카네무네 스스무;구노 야스시;이원규
    • 컴퓨터교육학회논문지
    • /
    • 제7권6호
    • /
    • pp.1-12
    • /
    • 2004
  • 제 7차 컴퓨터교과 교육과정은 소프트웨어 활용 부분에 치중되어 컴퓨터과학에 관한 원리교육이 이루어지지 못하고 있다. 한편, ACM K-12 컴퓨터과학 교육과정 모델에 관한 보고서에서는 현재의 컴퓨터교육이 그릇된 방향이며 컴퓨터과학 중심의 컴퓨터교육을 위해서 프로그래밍언어 교육을 통한 원리교육의 중요성을 강조하고 있다. 본 논문에서는 프로그래밍 체험학습을 위한 객체지향 기반의 새로운 교육용프로그래밍언어인 두리틀(Dolittle)을 소개한다. 두리틀은 간결한 구문과 한국어와의 대응성, 인크리멘탈 방식의 프로그래밍, 수치, 문자열, 배열과 같은 알고리즘과 구조화, 텍스트 위주의 프로그래밍 등의 설계방침을 적용한 언어이다. 중학생을 대상으로 실제 수업에 적용해 보고 학습효과를 분석한 결과, 객체지향기반이지만 클래스나 상속 등의 개념을 모르고도 활용 가능한 교육용프로그래밍언어라는 것을 확인할 수 있었다. 또한 객체와 메소드 활용을 통하여 프로그래밍 결과를 쉽게 확인할 수 있고 오류 수정이 용이하므로, 학생들의 높은 흥미도를 유지하면서 학업성취도를 향상시키고 차후 학습으로의 연계가 수월하였다.

  • PDF

형태소 단위의 한국어 확률 의존문법 학습 (Korean Probabilistic Dependency Grammar Induction by morpheme)

  • 최선화;박혁로
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.791-798
    • /
    • 2002
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 한국어의 부분 자유 어순성질과 문장의 필수적 성분의 생략과 같은 특성으로 인하여 한국어 구문분석에 관한 연구들에서는 주로 의존문법을 선호하고 있다. 본 논문에서는 기존의 어절단위학습방법에서는 학습할 수 없었던 어절 내의 의존관계를 학습할 수 있는 형태소 단위의 학습 방법을 제안한다. KAIST의 트리 부착 코퍼스 약 3만 문장에서 추출한 25,000문장의Tagged Corpus을 가지고 한국어 확률 의존문법 학습을 시도하였다. 그 결과 초기문법 2,349개의 정확한 문법을 얻을 수 있었으며, 문법의 정확성을 실험하기 위해 350개의 실험문장을 parsing한 결과 69.77%의 파싱 정확도를 보였다. 이로서 한국어 어절 특성을 고려한 형태소 단위 학습으로 얻어진 의존문법이 어절 단위 학습으로 얻어진 문법보다 더 정확하다는 사실을 알 수 있었다.