• 제목/요약/키워드: 구문구조

검색결과 477건 처리시간 0.029초

프로그램 표절 검출 방법에 대한 조사 (Survey on Program Clone Detection Methods)

  • 이효섭;도경구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.916-918
    • /
    • 2005
  • 표절이란 원본 자료의 출처를 밝히지 않고 사용하는 행위인데, 프로그램 표절은 표절로 의심되는 유사 소스코드를 말한다. 프로그램 표절을 검출하는 방법은 소스코드의 토큰 요약 후 비교하거나 단어와 키워드의 개수를 측정해 통계적으로 비교, 계산하거나 또는 프로그램의 구문구조를 비교하는 등 여러 접근 방법이 있다. 본 조사 보고서에서는 프로그램 표절 검출 방법 및 응용 도구에 대한 최근 연구 동향을 조사하여 정리하고 향후 발전 방향을 토론한다.

  • PDF

디지털 콘텐츠 식별 시스템(DOI)의 구축 (Adoption of Digital Object Identifier system in Korea)

  • 정상원;오상훈
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.153-156
    • /
    • 2000
  • 인터넷을 통해 유통되는 디지털 콘텐츠의 식별과 접근을 위한 고유 식별체계로서 DOI(Digital Object Identifier)의 개발, DOI의 구문구조 DOI의 관리와 운영, DOI 메타데이터와 장르, DOI변환과 핸들시스템(Handle System)을 소개하고, DOI의 국내 도입을 위한 DOI 등록 시스템, DOI 변환 시스템, DOI 검색시스템 INDECS 메타데이터를 이용한 디지털콘텐츠 유통관리시스템, DOI 참조링크 시스템의 개념적 설계와 구축내용을 기술한다.

  • PDF

DOI 구문 식별 코드 개발 (The Development of Prefix/Suffix Code of DOI Syntax)

  • 김세정;안계성
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.63-66
    • /
    • 2000
  • 본 연구는 인터넷상에서 제공되는 지적콘텐츠에 대한 영속적이고 고유한 식별 체계인 DOI 상용 서비스의 일환으로 DOI 구문을 구성하고 있는 Prefix와 Suffix 식별코드를 개발하였다. 이를 위해서 현재 인터넷상에서 지적콘텐츠를 유통시키고 있는 기관들을 조사 분류하여 콘텐츠 보유기관 식별코드를 개발하였다. 또한 지적콘텐츠의 속성 및 유형 분석을 토대로 Suffix 코드의 구조 및 식별코드를 개발하였으며 관련 콘텐츠간의 연계를 위한 저작권 식별기호를 고려하였다.

  • PDF

다중 문서요약에서 문장의 중복도 측정방법 개선 (Measuring Improvement of Sentence-Redundancy in Multi-Document Summarization)

  • 임정민;강인수;배재학;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.493-495
    • /
    • 2003
  • 다중문서요약에서는 단일문서요약과 달리 문장간의 중복도를 측정하는 방법이 요구된다. 기존에는 중복된 단어의 빈도수를 이용하거나, 구문트리 구조를 이용한 방법이 있으나, 중복도를 측정하는데 도움이 되지 못하는 단어와, 구문분석기 성능에 따라서 중복도 측정에 오류를 발생시킨다. 본 논문은 주절 종속절의 구분, 문장성분, 주절 용언의 의미를 이용하는 문장간 중복도 측정방법을 제안한다. 위의 방법으로 구현된 시스템은 기존의 중복된 단어 빈도수 방식에 비해 정확율에서 56%의 성능 향상이 있었다.

  • PDF

공간구문론을 활용한 전통정기시장 공간구조분석 -평창 대화장을 중심으로- (Spatial Structure Analysis of Traditional Periodical Market using Space Syntax Method)

  • 정대영;윤아영;윤지환;김상범
    • 농촌지도와개발
    • /
    • 제20권3호
    • /
    • pp.679-700
    • /
    • 2013
  • 최근 농촌지역이 쇠퇴하면서 농촌사회의 중심공간이었던 전통정기시장이 점차 축소되고 상권이 붕괴되면서 존폐를 위협하고 있는 실정이다. 다양한 분야에 걸쳐 전통정기시장의 활성화를 위한 대안을 제시하고 있지만 사회적, 지리적 관점에서 이루어진 연구는 정량적으로 분석하는데 한계가 있었다. 이에 본 연구에서는 강원도의 대표적인 5일장이었던 평창 대화장을 대상으로 정량적인 분석방법인 공간구문론을 활용하여 공간구조 및 보행동선을 분석하였다. 분석결과, 전체적인 공간구조는 통합도와 명료도가 높게 나타나 방문객이 전체 공간을 인지하고 이동하기에 효율적인 구조이지만 소비를 촉진시키는 전략이 필요할 것으로 판단되었다. 또한 보행동선을 분석한 결과 시장의 중심부에 위치하거나 주요시설 주변에 분포하는 동선의 통합도가 높게 나타났다. 자연발생적으로 생겨난 전통정기시장은 단순하고 명료한 공간구조를 갖고 있다는 점에서 문제점이 있으며, 쇠퇴한 정기시장을 활성화하기 위해서는 장소성을 강화하고 방문객의 소비를 촉진하는 전략이 필요할 것으로 사료된다.

구문 분석의 결과로 나타나는 구조의 모호성을 해결하기 위한 방법 연구 (A Study of Disambiguation Method To Improve The Syntactic Analysis System)

  • 박용욱
    • 한국산학기술학회논문지
    • /
    • 제16권4호
    • /
    • pp.2764-2769
    • /
    • 2015
  • 본 논문에서는 형태소 단위의 입력요소에 대해 의존규칙을 적용하여 가능한 모든 구분분석 구조를 생성할 수 있는 알고리즘을 적용한 구문분석기를 구현하였다. 따라서 형태소의 수가 증가함에 따라 생성되는 구문분석 트리의 개수가 기하급수적으로 증가할 수 있다. 이를 해결하기 위하여 본 논문에서는 주어진 문장에 대해 문장의 기본 구성요소들에 대하여 구간을 나누고, 나누어진 구간에서 최대연결단위를 구성하였다. 최대연결단위는 한 구간에 존재하는 모든 형태소가 결합된 것을 의미한다. 입력되는 문장에 따라서 한 구간에 하나 이상의 최대연결단위가 구성될 수 있다. 중학교 교과서에서 임의로 추출한 10어절 이내의 516문장에 대하여 실험한 결과 제안한 방법을 사용하지 않은 방법에 비해 약 28%의 개선효과가 있었다.

구묶음과 구간분할을 이용한 의존 관계 추출 기법 (A Method for Extracting Dependency Relations Using Chunking and Segmentation)

  • 박의규;조민희;김성원;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.131-137
    • /
    • 2004
  • 본 논문에서는 구묶음과 구간분할에 기반하여 한국어 문장에서 명백한 의존관계를 파악 추출하는 기법에 대해 다룬다. 구묶음 기법은 문장에 나타나는 복합 명사, 본용언/보조용언. 의존명사 등을 묶어서 문장의 구조를 단순하게 만든다. 특히 문장에 다양한 형태로 나타나는 의존명사의 처리를 강화하여 구묶음을 효과적으로 할 수 있도록 하였다. 구간분할 기법은 긴 문장을 여러 개의 구간으로 나누어 각 구간을 구문분석 한다. 각 구간은 분할 이전보다는 단순화된 형태이기 때문에 긴 문장보다는 중의성이 줄어들어 견고한 구문분석을 할 수 있게 된다. 본 논문에서는 한국어 구문분석 시스템 개발의 1 단계 과정으로써 일단 중의성이 있는 상황이 아닌 명백한 의존관계를 수집하는 것을 목표로 한다. 본 논문에서는 실험을 통하여 구묶음과 구간분할 기법이 문장의 구조 중의성을 줄여 줌으로써 보다 많은 명백한 의존관계를 정확하게 추출할 수 있음을 보였다.

  • PDF

이태리어 속격구문 연구: 통사구조 내 의미역 위계를 중심으로 (Studio sul Sintagma Genitivale in italiano: focalizzato sulla gerarchia tematica nella struttura sintattica)

  • 강순행
    • 이탈리아어문학
    • /
    • 제33호
    • /
    • pp.1-27
    • /
    • 2011
  • Questo studio ha lo scopo di configurare la gerarchia tematica del sintagma genitivale in italiano all'interno della struttura sintattica. Il sintagma genitivale composto dalla forma "sostantivo+di+sostantivo", può avere i significati di descrizione, origine, apposizione, parte, luogo, e anche può rappresentare la struttura argomentale come argomento esterno(caso soggettivo) o argomento interno(caso oggettivo) e può assegnare il ruolo tematico di agente, tema, esperiente, beneficario in relazione al rapporto con la testa nominale oltre ad avere il significato possesivo. Per quanto riguarda la realizzazione e il significato dell'argomento nel sintagma genitivale diverse che cambiano secondo il tipo della testa nominale, ho classificato i nomi deverbali come nomi monoargomentali, nomi biargomentali, nomi triargomentali sulla base di Renzi et al(1991). Inoltre avendo confermato che il marcatore del caso genitivale di deve esserci nel caso in cui obbligatoriamente la struttura del sintagma nominale composto dai vari livelli, come NP, FP e DP, proposti da Longobardi(2001) per spiegare la differenza semantica del sintagma genitivale con la struttura sintattica, ho cercato di individuare l'ordine degli argomenti, osservando l'ambiguità e il cambiamento del significato del sintagma genitivale nel sintagma nominale. Cioé la differenza della possibilità interpretativa è una cosa strutturale, quindi possibilmente si può configurare la semantica del sintagma genitivale nella struttura sintattica.

제품 설명서에 나타나는 중의적 명사 수식 구문 연구 - 통제 언어의 관점에서- (A study on the ambiguous adnominal constructions in product documentation)

  • 박아름;지은별;홍문표
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.23-28
    • /
    • 2012
  • 번역을 지원하는 도구로 자동 번역 시스템을 효율적으로 활용하기 위해 중요한 것은 자동 번역에 적합하도록 원문을 작성하거나 이미 작성된 원문에 대한 전처리 작업을 하는 것이다. 본 연구의 궁극적인 목표는 제품 설명서 작성자가 통제언어 체커를 통해 통제언어 규칙들을 적용하여 원문을 작성하도록 하는 것이다. 본 논문은 그 중간 단계로써 제품 설명서에 나타나는 문제 사항이 번역 품질에 어떠한 영향을 미치는지 밝혀내는 것을 목적으로 한다. 연구 대상은 제품 설명서에서 자동 번역의 성능을 저해시키는 요소 중 중의적 명사 수식 구문이다. 이러한 명사 수식 구문들은 분석 단계에서 구조적인 모호성을 초래하여 한국어 분석의 정확도를 떨어뜨리기 때문에 결과적으로 번역 품질을 악화시킬 수 있다. 이를 검증하기 위해 우선 제품 설명서 데이터를 분석하여 자동 번역 결과에 부정적인 영향을 미치는 명사 수식 구문을 다음과 같이 4가지로 유형화 하였다. (유형 1) 관형격 명사구 + 명사 병렬 접속, (유형 2) 동사의 관형형이 수식하는 명사구 + 명사 병렬 접속, (유형 3) 관형격 조사 '의' 중복, (유형 4) 병렬 접속어를 잘못 쓴 경우, 각각의 유형에 대해서 한국어 분석 단계에서 발생할 수 있는 문제에 대해 설명하였으며, 문제 사항에 대해 통제언어 규칙을 제시하였다. 통제언어 규칙에 따라 중의적 명사 수식 구문을 수정한 결과, 한국어 원문의 번역결과보다 한국어 수정문의 번역결과가 작성자의 의도를 더 잘 나타낸다는 것을 확인할 수 있었다.

  • PDF

한국어 구문 분석과 문장 생성을 위한 범주 문법 적용의 몇 가지 원칙 (Some Application Principles of Categorial Grammars for Korean Syntactic Analysis and Sentence Generation)

  • 송도규;차건회;박재득
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-359
    • /
    • 1997
  • 주로 영어, 불어 등의 형상적 언어(configurational languages)의 구문 분석을 위해 개발된 범주 문법은 문장 구성 성분의 문장 내의 위치가 대체적으로 고정적이며 통사 기능이 그 위치로서 할당 되는 형상적 언어의 통사적인 특성에 따라 방향성의 개념을 도입하였다. 그러나 이 방향성 개념은 문장 구성 성분의 문장 내의 위치가 비교적 자유로운 한국어 등의 비형상적 언어(non-configurational languages)에 그대로 적용하기에는 많은 무리가 따른다. 심지어 형상적 언어에 적용하는 경우에도 도치나 외치된 문장 또 격리된 구조(unbounded dependency constructions)가 있는 문장들도 적절히 분석해 내지 못한다. 이런 이유로 본고에서는 범주 문법에 도입되어 있는 방향성을 재고하고 아울러 한국어 구문 분석과 문장 생성을 위한 범주 문법 적용상의 다섯 원칙을 제안한다.

  • PDF