• 제목/요약/키워드: syntax tree

검색결과 60건 처리시간 0.036초

구문트리 비고를 통한 프로그램 유형 복제 검사 (A Program-Plagiarism Checker using Abstract Syntax Tree)

  • 김영철;김성근;염세훈;최종명;유재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.792-802
    • /
    • 2003
  • 기존의 프로그램 유형 복제 검사 시스템들은 단순한 텍스트 기반의 프로그램 복제 검사나, 속성 및 토큰 스트링을 이용하여 복제 검사를 수행한다. 이 시스템들은 들여쓰기, 여백, 설명문과 같은 프로그램의 구문과 상관없는 프로그램 스타일에 어려움을 갖고 있다. 본 연구에서는 서로 다른 두 프로그램의 구문트리를 이용하여 복제 검사를 수행하는 모델을 제시한다. 구문트리를 이용한 프로그램 유형 복제 검사는 프로그램 스타일에 취약한 기존의 복제 검사 시스템의 단점을 극복할 수 있으며, 구문분석과 의미분석을 통해 프로그램의 구조적인 검사까지 수행할 수 있다는 장점을 가지고 있다. 또한 본 시스템은 인터넷이나 사이버 교육 체제에서 대량의 C/C+. 언어의 프로그램 복제 검사를 수행하기 위하여 AST 생성, 역파서 및 유사도 검사 알고리즘을 제시하며, 프로그램 복제 유형에 대해서 평가한다.

XML 어플리케이션을 위한 트리 기반 문서 편집 시스템의 설계 및 구현 (A Design and Implementation of the Tree-based Document Editing System for XML Application)

  • 김영철;강춘길
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.959-966
    • /
    • 2004
  • 본 논문에서는 구조 중심형 환경에서 사용 가능한 트리기반 XML 어플리케이션 문서 편집 시스템의 설계 및 구현에 관하여 논의한다. 본 시스템은 DTD를 ASTD( Syntax Tree Definition)로 변환하여 내장하는 구조로서 잘 설계된(well-formed) 문서는 물론 편집 중에 유효한(valid) 문서를 작성하도록 하기 위하여 구문 지향 편집(syntax-directed editing)을 지원한다. 또한 구조 중심형 환경에서 사용자와의 인터페이스를 담당하는 편집기를 설계함에 있어 새로운 도구의 추가로 인한 기능 확장이 용이하도록 고려하였으며, 편집기의 구현 시 기존의 문법 검증에 대한 비효율성을 감안하여 다중 엔트리(multiple entry)를 적용한 파서를 사용하여 실시간으로 유효성 검증이 가능하도록 하였다. 본 논문은 XML 문서 편집 시스템의 개발 모델을 제시함으로써 관련 어플리케이션 개발에 크게 기여할 것으로 기대된다.

추상구문트리를 이용한 구문지향 XML 문서 편집기 (A Syntax-Directed XML Document Editor using Abstract Syntax Tree)

  • 김영철;유두규
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.117-126
    • /
    • 2005
  • 기존의 XML 문서 편집기는 일반 텍스트 위주의 편집을 하고 내부적으로 구문적 검사를 하지 않는다. 따라서 작성된 XML 문서가 잘 설계(well-formed) 되었는지 유효(valid) 문서인지를 검사하지 못한다. 본 논문에서는 XML 문서를 편집하는데 있어서 구문에 맞도록 설계할 수 있는 구문지향 편집기를 설계하고 구현한다. 또한 트리 기반의 편집기로 구현되어 있기 때문에 향후에 XML 문서 확장이 용이하며, 다른 시스템과는 달리 실시간으로 유효성을 검증할 수 있도록 설계되었다. 본 시스템은 향후에 XML 관련 어플리케이션 개발에 많은 영향을 줄 것으로 기대된다.

  • PDF

공간구문분석을 위한 공간형상 인식 및 관리 방법 (Methods to Recognize and Manage Spatial Shapes for Space Syntax Analysis)

  • 정상규;반영운
    • KIEAE Journal
    • /
    • 제11권6호
    • /
    • pp.95-100
    • /
    • 2011
  • Although Space Syntax is a well-known technique for spatial analysis, debates have taken place among some researchers because the Space Syntax discards geometric information as both shapes and sizes of spaces, and hence may cause some inconsistencies. Therefore, this study aims at developing methods to recognize and manage spatial shapes for more precise space syntax analysis. To reach this goal, this study employed both a graph theory and binary spatial partitioning (BSP) tree to recognize and manage spatial information. As a result, spatial shapes and sizes could be recognized by checking loops in graph converted from spatial shapes of built environment. Each spatial shape could be managed sequentially by BSP tree with hierarchical structure. Through such recognition and management processes, convex maps composed of the fattest and fewest convex spaces could be drawn. In conclusion, we hope that the methods developed here will be useful for urban planning to find appropriate purposes of spaces to satisfy the sustainability of built environment on the basis of the spatial and social relationships in urban spaces.

구문트리에서 키워드 추출을 이용한 프로그램 유사도 평가 (A Program Similarity Evaluation using Keyword Extraction on Abstract Syntax Tree)

  • 김영철;최재영
    • 정보처리학회논문지A
    • /
    • 제12A권2호
    • /
    • pp.109-116
    • /
    • 2005
  • 본 논문에서는 프로그램의 분석 과정에서 생성된 구문트리에서 키워드만을 추출하여 유사도 평가하는 방법을 소개한다. 이 방법은 기존의 구조 기반 방법과 같이 프로그램 구조적 특징에 상관없이 유사도를 평가한 수 있으며, 구문트리의 키워드만을 평가에 이용함으로써 기존 시스템의 단점이었던 속도를 개선할 수 있었다. 따라서 본 논문에서는 유사도 평가 모델을 제시하고, 생성된 구문트리에서 키워드를 추출하는 방법을 제시하였다. 본 논문의 평가 부분에서는 기존 시스템에 비해 본 시스템이 구조적 특징이나 속도 면에서 많이 개선되었다는 것을 보여주었다. 따라서 본 시스템은 향후에 텍스트 위주의 문서의 유사도나 XML과 같은 전자 문서의 유사도 평가에 지대한 영향을 줄 것으로 기대된다.

AST를 이용한 프로그램 유사도 평가 시스템 설계 (A Design of the Similarity Evaluation System using Abstract Syntax Tree)

  • 정재은;김영철;김상헌;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.430-432
    • /
    • 1999
  • 본 논문에서는 AST(Abstract Syntax Tree)를 이용하여 서로 다른 프로그램의 유사도를 측정하는 방법을 제시한다. 지금까지 유사도 평가 방법은 거의 제시되지 않고 프로그램의 비교평가 연구는 찾아볼 수가 없다. 본 시스템은 서로 다른 여러 프로그램을 입력받아 파싱함으로써 AST를 생성하여 생성된 AST를 유사도 측정에 이용한다. 따라서 다른 비교 측정 시스템보다 비용과 속도 면에서 경제적이고 빠르게 유사도를 검출해 낼 수 있으며, 또한 신속히 평가 결과를 학생들에게 피드백 함으로써 큰 학습성과를 기대할 수 있다.

  • PDF

추상구문트리를 이용한 어스팩트 마이닝 프로세스 설계 (Aspect Mining Process Design Using Abstract Syntax Tree)

  • 이승형;송영재
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.75-83
    • /
    • 2011
  • 어스팩트 지향 프로그래밍은 시스템에서 크로스커팅 개념을 추출하고 소프트웨어 모듈화를 통하여 기능의 분산과 코드의 혼란을 해결하기 위한 패러다임이다. 현존하는 어스팩트 개발 방법은 크로스커팅 대상 영역을 추출에 어려움이 있기 때문에, 어스팩트 마이닝을 적용하기가 쉽지 않다. 어스팩트 마이닝에서는 기존 프로그램의 리팩토링 요소를 크로스커팅 영역으로 변환하는 기술이 필수적이다. 본 논문에서는 리팩토링에 적합한 크로스커팅 영역 자동 추출을 위한 시스템에서 크로스커팅 개념을 추출하기 위한 어스팩트 마이닝 방법을 제안한다. 소스 모듈의 추상 구문구조 명세를 이용하여, 모듈의 구조적 중복 관계 요소를 추출한다. Apriori 알고리즘을 통하여 중복 구문트리를 생성하고, 크로스커팅 영역 대상인 중복된 소스 모듈을 자동 생성, 최적화 할 수 있다. Berkeley Yacc의 berbose.c 모듈을 제안하는 마이닝 프로세스에 적용해 본 결과, 원본 대비 9.47%의 길이와 부피의 감소하였고, CCFinder 대비 4.92%의 길이 감소, 5.11%의 부피 감소 효과를 확인하였다.

Tree-Pattern-Based Clone Detection with High Precision and Recall

  • Lee, Hyo-Sub;Choi, Myung-Ryul;Doh, Kyung-Goo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.1932-1950
    • /
    • 2018
  • The paper proposes a code-clone detection method that gives the highest possible precision and recall, without giving much attention to efficiency and scalability. The goal is to automatically create a reliable reference corpus that can be used as a basis for evaluating the precision and recall of clone detection tools. The algorithm takes an abstract-syntax-tree representation of source code and thoroughly examines every possible pair of all duplicate tree patterns in the tree, while avoiding unnecessary and duplicated comparisons wherever possible. The largest possible duplicate patterns are then collected in the set of pattern clusters that are used to identify code clones. The method is implemented and evaluated for a standard set of open-source Java applications. The experimental result shows very high precision and recall. False-negative clones missed by our method are all non-contiguous clones. Finally, the concept of neighbor patterns, which can be used to improve recall by detecting non-contiguous clones and intertwined clones, is proposed.

XML DTD 기반의 구문지향 문서 작성기 (Syntax-Directed Document Editor based XML DTD)

  • 김영철;김성근;최종명
    • 컴퓨터교육학회논문지
    • /
    • 제7권4호
    • /
    • pp.67-75
    • /
    • 2004
  • XML은 문서의 정적인 요소나 확장성을 해결할 수 있는 차세대 웹 문서 표준 언어이다. 그러나 XML 구조의 복잡성과 문법의 제약 때문에 일반 사용자는 잘 설계된 (Well-formed) 문서나 유효한 (valid) 문서를 만들기가 어렵다는 문제를 가지고 있다. 본 논문에서는 XML 구문지향 문서 작성기를 설계하고 구현한다. XML 구문지향 문서 작성기는 편집기에 제시되는 구문에 따라 쉽게 문서를 작성할 수 있으며, 작성된 문서는 모두 유효하다(valid) 는 특정을 가지고 있다. 본 편집기는 XML 초보자에게 도움을 줄 수 있으며, XML 문서를 작성하는데 높은 생산성을 줄 것이다.

  • PDF

The Parallel Corpus Approach to Building the Syntactic Tree Transfer Set in the English-to- Vietnamese Machine Translation

  • Dien Dinh;Ngan Thuy;Quang Xuan;Nam Chi
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.382-386
    • /
    • 2004
  • Recently, with the machine learning trend, most of the machine translation systems on over the world use two syntax tree sets of two relevant languages to learn syntactic tree transfer rules. However, for the English-Vietnamese language pair, this approach is impossible because until now we have not had a Vietnamese syntactic tree set which is correspondent to English one. Building of a very large correspondent Vietnamese syntactic tree set (thousands of trees) requires so much work and take the investment of specialists in linguistics. To take advantage from our available English-Vietnamese Corpus (EVC) which was tagged in word alignment, we choose the SITG (Stochastic Inversion Transduction Grammar) model to construct English- Vietnamese syntactic tree sets automatically. This model is used to parse two languages at the same time and then carry out the syntactic tree transfer. This English-Vietnamese bilingual syntactic tree set is the basic training data to carry out transferring automatically from English syntactic trees to Vietnamese ones by machine learning models. We tested the syntax analysis by comparing over 10,000 sentences in the amount of 500,000 sentences of our English-Vietnamese bilingual corpus and first stage got encouraging result $(analyzed\;about\;80\%)[5].$ We have made use the TBL algorithm (Transformation Based Learning) to carry out automatic transformations from English syntactic trees to Vietnamese ones based on that parallel syntactic tree transfer set[6].

  • PDF