• 제목/요약/키워드: program plagiarism

검색결과 42건 처리시간 0.023초

프로그램 및 자연어 표절 검출을 위한 국내.외 동향 및 감정 S/W 툴의 분석 (Analysis of Domestic.Foreign Trend and Assessment Tools for Programs and Natural Language Plagiarism)

  • 조동욱;신승수;윤미희
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권12호
    • /
    • pp.1659-1668
    • /
    • 2002
  • 컴퓨터 소프트웨어, 디지털 콘텐츠등 디지털 정보 재산권의 보호는 현재 뿐 아니라 향후 국가의 국력을 좌우할 수 있을 정도로 대단히 주요한 과제가 아닐 수 없다. 본 논문에서는 디지털 정보 재산권과 관련된 국내ㆍ외 연구 동향과 표절의 감정을 체계적으로 행하기 위한 소프트웨어 툴에 대해 비교ㆍ분석을 행하고자 한다. 주요 내용으로는 JISC을 중심으로 한 국외 감정 기관의 사업 동향과 분석 그리고 국내기관이나 단체의 움직임을 살펴보고자 한다. 또한 자연어 표절이나 프로그램 표절을 감정 할 수 있는 S/W툴에 대해 비교ㆍ분석을 행하고자 한다.

  • PDF

제한된 프로그램 소스 집합에서 표절 탐색을 위한 적응적 알고리즘 (An Adaptive Algorithm for Plagiarism Detection in a Controlled Program Source Set)

  • 지정훈;우균;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.580-585
    • /
    • 2006
  • 본 논문에서는 대학생들의 프로그래밍 과제물이나 프로그래밍 경진대회에 제출된 프로그램과 같이 동일한 기능을 요구받는 프로그램 소스 집합들에서 표절 행위가 있었는지를 탐색하는 새로운 알고리즘을 제시한다. 본 논문에서는 프로그램의 소스 집합에서 추출된 키워드들의 빈도수에 기반한 로그 확률값을 가중치로 하는 적응적(adaptive) 유사도 행렬을 만들어 이를 기반으로 주어진 프로그램의 유사구간을 탐색하는 지역정렬(local alignment) 방법을 소개한다. 우리는 10여개 이상의 프로그래밍 대회에 제출된 실제 프로그램으로 본 방법론을 실험하였다. 실험결과 이 방법은 이전의 고정적 유사도 행렬(일치 +1, 불일치 -1, 갭(gap)을 이용한 일치 -2)에 의한 유사구간 탐색에 비하여 여러 장점이 있음을 알 수 있었으며, 보다 다양한 표절탐색 목적으로 제시한 적응적 유사도 행렬이 응용될 수 있음을 알 수 있었다.

  • PDF

프로그램 표절 감정 툴에 대한 비교, 분석 및 개발 툴에 대한 방향제시 (A Comparison and Analysis of Program Plagiarism Inspection Tools & Proposal of Developing Tools)

  • 조동욱;소정;김진용;최병갑;김선영;김지영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.757-760
    • /
    • 2003
  • 컴퓨터 소프트웨어, 디지털 콘텐츠등 디지털 정보 재산권의 보호는 현재 뿐 아니라 향후 국가의 국력을 좌우할 수 있을 정도로 대단히 중요한 과제가 아닐 수 없다. 본 논문에서는 소프트웨어 표절의 자동검출을 위하여 제작된 각종 소프트웨어 감정 도구들을 여러 각도에서 비교 분석하여 각 도구의 유용성, 제한성, 주요 적용환경 및 분야, 사용방법 등을 제시함으로써 향후 소프트웨어 복제 감정에 효과적으로 활용할 수 있도록 하고자 한다.

  • PDF

Parse Tree Kernel을 이용한 소스코드 표절 검출 (Program Plagiarism Detection Using Parse Tree Kernels)

  • 손정우;박성배;이상조;박세영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.157-159
    • /
    • 2006
  • 표절이란 원작자의 허락 없이 저작물의 일부분 혹은 전체를 사용하는 것이다. 이는 특히 대학의 프로그래밍 코스에서 심각한 문제가 된다. 이를 해결하기 위해 많은 표절 검출 시스템이 연구되어 왔으나 복사된 소스코드에 필요 없는 코드를 첨가할 경우, 성능이 낮아지는 문제가 있었다. 이 문제는 기존 시스템이 소스코드의 구조적인 정보를 효율적으로 다루지 않았기 때문이다. 본 논문에서는 Parse Tree Kernels를 이용한 소스 코드 표절 검출 시스템을 제안한다. 제안한 시스템은 Parse Tree Kernels를 이용하여 소스코드의 구조적 정보를 효과적으로 다룬다. 이를 보이기 위한 실험에서는 기존의 표절 검출 시스템인 SID, JPlag와 비교하여 제안한 시스템이 소스 코드의 구조적 정보를 기존 시스템에 비해 효율적으로 이용하고 있음을 보였다.

  • PDF

표절검사를 위한 프로그램 추적기법 (The Tracing Method of Program for Plagiarism Detection)

  • 지정훈;우균;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.709-712
    • /
    • 2006
  • 표절을 검사하는 방법으로는 문서 내의 특정 정보들을 추출하여 비교하는 지문법(fingerprint)과 파스트리(parse tree)와 같이 프로그램의 특정한 구조를 이용하여 문서의 구조적 유사성을 검사하는 구조적(structure metrics) 검사방법들이 있다. 본 논문에서는 표절검사를 위한 프로그램 추적 기법을 제안한다. 프로그램 추적 기법은 프로그램을 구문단계에서 정적으로 수행을 하여 그 수행되는 함수들의 순서에 따라 주요 키워드를 추출하여 새롭게 정렬하는 방법이다. 실험결과 사용하지 않는 코드 삽입, 함수 위치 변경 및 합성 등과 같은 표절 스펙트럼에서 정의한 표절 방법에 대하여 효과적으로 검출할 수 있었다.

  • PDF

웹기반 프로그래밍 언어 강의 지원 시스템의 설계 및 구현 (Design and Implementation of a Web-based Programming Class Support System)

  • 박소영
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2775-2782
    • /
    • 2010
  • 본 논문에서는 강사가 학생에게 프로그래밍 언어를 효과적으로 가르칠 수 있도록 지원하는 웹기반 프로그래밍 언어 강의 지원 시스템을 제안한다. 제안하는 시스템은 오류 분석 단계와 검사 수행 단계로 구성된다. 먼저, 오류 분석 단계에서는 학생들이 제출한 프로그램에 컴파일 오류나 실행 오류가 있는지 확인한다. 이 때, 오류가 있으면 학생들이 이를 수정할 수 있도록 친절한 피드백을 제공한다. 그리고, 오류가 없으면 제출한 프로그램에 대해 소스 코드의 스타일 검사, 주석 검사, 표절 검사를 수행하고, 학생에게 검사결과에 대한 신속한 피드백을 제공한다. 따라서, 학생은 프로그램 과제물을 제출하고 바로 검사결과를 확인할 수 있다. 제안하는 시스템을 C 언어 수업에서 활용한 결과 학생들이 보다 적극적으로 프로그램 과제물을 제출하려는 경향이 나타났다.

자동화된 프로그래밍 과제 평가 시스템의 설계 및 구현 (Design and Implementation of an Automatic Grading System for Programming Assignments)

  • 김미혜
    • 인터넷정보학회논문지
    • /
    • 제8권6호
    • /
    • pp.75-85
    • /
    • 2007
  • 프로그래밍 교육에 있어 학습자의 학업 성취도를 향상시킬 수 있는 중요한 요인 중의 하나는 다양한 형태의 과제를 학습자에게 부여하여 문제 해결 연습 기회를 많이 제공해 주는 것이다. 그러나 프로그래밍 과제 평가는 대부분 수작업으로 행해지고 있으면 정확한 평가 방법을 제공해 줄 수 있는 자동화된 도구 또한 결여되어 있는 게 현실이다. 이러한 제한된 환경 하에서 과제 평가는 교수자들에게 많은 시간과 노력을 요구하게 되어 다양한 형태의 과제 부여는 현실적으로 어려움이 있다. 이러한 문제를 극복하기 위해서는 교수자가 효율적이고 일괄적인 방법으로 과제를 쉽게 평가할 수 있고, 학습자들 상호간의 프로그램 소스코드의 표절 또한 용이하게 검사할 수 있는 자동화된 프로그래밍 평가 시스템이 필요하다. 따라서 본 논문에서는 교수자가 프로그램의 성능을 자동적인 방법으로 평가할 수 있을 뿐만 아니라 적절한 피드백과 함께 프로그램의 스타일과 표절에 대한 검사 또한 용이하게 수행할 수 있는 웹을 기반으로 한 프로그래밍 과제 평가 시스템을 설계하고 구현한다.

  • PDF

Cross-architecture Binary Function Similarity Detection based on Composite Feature Model

  • Xiaonan Li;Guimin Zhang;Qingbao Li;Ping Zhang;Zhifeng Chen;Jinjin Liu;Shudan Yue
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.2101-2123
    • /
    • 2023
  • Recent studies have shown that the neural network-based binary code similarity detection technology performs well in vulnerability mining, plagiarism detection, and malicious code analysis. However, existing cross-architecture methods still suffer from insufficient feature characterization and low discrimination accuracy. To address these issues, this paper proposes a cross-architecture binary function similarity detection method based on composite feature model (SDCFM). Firstly, the binary function is converted into vector representation according to the proposed composite feature model, which is composed of instruction statistical features, control flow graph structural features, and application program interface calling behavioral features. Then, the composite features are embedded by the proposed hierarchical embedding network based on a graph neural network. In which, the block-level features and the function-level features are processed separately and finally fused into the embedding. In addition, to make the trained model more accurate and stable, our method utilizes the embeddings of predecessor nodes to modify the node embedding in the iterative updating process of the graph neural network. To assess the effectiveness of composite feature model, we contrast SDCFM with the state of art method on benchmark datasets. The experimental results show that SDCFM has good performance both on the area under the curve in the binary function similarity detection task and the vulnerable candidate function ranking in vulnerability search task.

심층신경망을 이용한 소스 코드 원작자 식별 (Souce Code Identification Using Deep Neural Network)

  • 임지수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권9호
    • /
    • pp.373-378
    • /
    • 2019
  • 현재 프로그래밍 소스들이 온라인에서 공개되어 있기 때문에 무분별한 표절이나 저작권에 대한 문제가 일어나고 있다. 그 중 반복된 저자가 작성한 소스코드는 프로그래밍 특성상 고유의 지문이 있을 수 있다. 본 논문은 구글 코드 잼 프로그램 소스를 심층신경망을 이용한 학습을 통해 각각의 저자를 분별하는 것이다. 이 때 원작자의 소스를 예측 기반 벡터나, 주파수 기반 접근법인 TF-IDF등의 전처리기를 사용하여 입력값들을 벡터화해주고, 심층신경망을 이용한 학습을 통해 각 프로그램 소스 원작자를 식별하고자 한다. 전처리기를 이용하여 언어에 독립적인 학습시스템을 구성하고, 기존의 다른 학습 방법들과 비교하였다. 그 중 TF-IDF와 심층신경망을 사용한 모델은 다른 전처리기나 다른 학습방식을 사용한 것보다 좋은 성능을 보임을 확인하였다.

고등학교급 과학영재를 위한 사사교육에서 수행되는 연구윤리교육과 연구환경 조성에 대한 멘토 과학자와 교사의 인식비교 (Comparison between Mentor Scientists and Teachers' Perceptions of Research Ethics Education and of Creation of an Ethical Research Environment in the Mentoring Program for the Science-Gifted Students in High School)

  • 이지원;이범진
    • 한국과학교육학회지
    • /
    • 제39권3호
    • /
    • pp.427-439
    • /
    • 2019
  • 이 연구에서는 사사교육을 수행하고 있는 과학자와 교사는 연구윤리교육을 어떻게 하고 있는지, 사사교육에서 윤리적 교육환경을 어떻게 조성하고 있는지를 알아보았다. 이를 위하여 고등학교급 과학영재를 대상으로 사사교육을 수행하고 있는 과학자 32명과 교사 44명을 대상으로 설문조사를 수행하였다. 연구윤리교육의 내용에 대하여 과학자와 교사 모두 위조, 변조, 표절하지 않기를 가장 우선적으로 가르쳐야 한다고 보았다. 연구윤리교육의 수준에 대해서 과학자와 교사 모두 고등학교급 과학영재에게 대학생 수준의 연구윤리를 가르쳐야 한다고 인식하였다. 교육방법에 대해 교사는 연구수행 중 각 단계별로 필요한 윤리적 의사결정의 개별 교육, 과학자는 연구노트 작성법 지도가 가장 순위가 높았다. 연구윤리교육의 어려움에 대해 교사는 입시 위주의 교육풍토를 들었고, 과학자는 연구윤리가 학생 스스로의 문제라고 인식시키는 것이 어렵다고 응답하였다. 과학영재가 윤리적으로 연구를 수행하는데 영향을 미치는 주요 요소를 교사는 연구지도에 주어진 시간, 과학자는 멘토의 윤리성이라고 보았다. 윤리적 연구 환경의 조성 방법에 대해 교사는 실패가 용인되는 분위기를 조성하는 것, 과학자는 결과에 대한 자유도를 늘리는 것이라고 하였다. 윤리적 연구환경 조성의 주요 어려움으로 교사는 연구시간의 제약, 과학자는 결과에 대한 압박을 들었다. 이 결과는 과학영재 학생들을 위한 사사 교육 중 어떻게 연구윤리를 교육하여야 하는지와 어떻게 윤리적 연구 환경을 만들어나갈지에 대한 시사점을 제공한다.