• 제목/요약/키워드: 식별방법

검색결과 2,333건 처리시간 0.028초

작성자 분석과 CNN을 적용한 소스 코드 작성자 식별 프레임워크 (The Identification Framework for source code author using Authorship Analysis and CNN)

  • 신건윤;김동욱;홍성삼;한명묵
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.33-41
    • /
    • 2018
  • 최근 인터넷 기술이 발전함에 따라 다양한 프로그램들이 만들어지고 있고 이에 따라 다양한 코드들이 많은 사람들을 통해 만들어진다. 이러한 측면을 이용하여 특정 작성자가 작성한 코드들 그대로 가져가 자신이 작성한 것처럼 보여주거나, 참고한 코드들에 대한 정확한 표기 없이 그대로 사용하여 이에 대한 보호가 점차 어려워지고 있다. 따라서 본 논문에서는 작성자 분석 이론과 합성곱 신경망 기반 자연어 처리 방법을 적용한 작성자 식별 프레임워크룰 제안한다. 작성자 분석 이론을 적용하여 소스 코드에서 작성자 식별에 적합한 특징들을 추출하고 이를 텍스트 마이닝에서 사용하고 있는 특징들과 결합하여 기계학습 기반의 작성자 식별을 수행한다. 그리고 합성곱 신경망 기반 자연어 처리 방법을 소스 코드에 적용하여 코드 작성자 분류를 수행한다. 본 논문에서는 작성자 분석이론과 합성곱 신경망을 적용한 작성자 식별 프레임워크를 통해 작성자를 식별하기 위해서는 작성자 식별만을 위한 특징들이 필요하다는 것과 합성곱 신경망 기반 자연어 처리 방법이 소스 코드등과 같은 특수한 체계를 갖추고 있는 언어에서도 적용이 가능하다. 실험 결과 작성자 분석 이론 기반 작성자 식별 정확도는 95.1%였으며 CNN을 적용한 결과 반복횟수가 90번 이상일 경우 98% 이상의 정확도를 보여줬다.

정보검색기반 결함위치식별 기술의 성능 향상을 위한 버그리포트 품질 예측 (Bug Report Quality Prediction for Enhancing Performance of Information Retrieval-based Bug Localization)

  • 김미수;안준;이은석
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.832-841
    • /
    • 2017
  • 버그리포트는 소프트웨어의 유지보수 단계에서 발생한 결함 정보를 담고 있는 문서로서 개발자가 해당 결함을 수정하기 위해 필수적인 정보이다. 이 때 개발자가 버그리포트를 해결하기 위해 결함을 추적하는 시간을 단축시키기 위한 정보검색기반 결함위치식별 기술들이 제안되었다. 그러나 정보검색에 유용하지 못한 내용들로 작성된 낮은 품질의 버그리포트가 등록 될 경우 결함위치식별 성능이 크게 저하된다. 본 논문에서는 낮은 품질의 버그리포트를 선별하기 위한 품질 예측 방법을 제안한다. 이 과정에서 버그리포트의 쿼리로써의 품질 요소를 정의하고, 기계학습을 사용하여 품질을 예측한다. 제안 방법을 오픈 소스 프로젝트에 적용하여 기존 품질 예측 기술 대비 평균 6.62% 더 정확하게 예측하였다. 또한 기존 결함위치식별 기술에 제안 예측 기술과 자동 쿼리 재구성 기술을 함께 적용한 경우 결함위치식별 정확도를 1.3% 향상시켜, 제안 품질 예측 기술이 정보검색기반 결함위치식별 기술의 성능 향상을 도울 수 있음을 확인하였다.

수술 동영상의 비식별화를 위한 개인식별정보 자동 검출 시스템 설계 및 구현 (Design and Implementation of Automated Detection System of Personal Identification Information for Surgical Video De-Identification)

  • 조영탁;안기옥
    • 융합보안논문지
    • /
    • 제19권5호
    • /
    • pp.75-84
    • /
    • 2019
  • 최근 의료정보기술 분야에서 비디오는 풍부한 임상정보를 포함하는 특징으로 인하여 새로운 서비스 창출 및 연구개발을 위한 중요한 데이터로서 그 가치를 새롭게 평가받고 있다. 그러나 임상정보는 개인정보를 포함하고 있어, 생명윤리 혹은 연구 윤리에 대한 고려가 필요하다. 따라서 비디오 또한 의료영상으로서 비식별화가 요구되지만 기존 방법은 주로 정형데이터와 정지영상에 특화되어 기존의 방법을 그대로 적용하기 어려운 문제가 있다. 본 논문에서는 개인정보 비식별화 처리 시스템과의 연동을 고려하여 비디오 내에서 개인식별정보를 검출하는 자동화 시스템을 제안한다. 제안 시스템은 장면분할과 체내외 영역 검출의 전처리 후에 텍스트 및 사람검출을 통한 인덱싱과정을 수행한다. 검출된 개인식별 인덱스 정보는 비식별화를 수행하는 외부 시스템 및 시각화를 위한 메타데이터로 제공된다. 제안 시스템의 효용성을 검증하기 위하여 프로토타입을 구현하고 실제 수술비디오를 대상으로 인덱싱 속도를 측정하였다. 그 결과 입력 비디오의 재생시간 대비 2배 이상의 빠른 작업속도를 보였으며, 수술교육콘텐츠 제작 및 학술용 반자동 편집시스템의 사례를 통해 빠른 의사결정을 보조할 수 있음을 확인하였다.

독립척도 기반의 비즈니스 컴포넌트 식별 (Identification of Business Component based on Independence Metric)

  • 최미숙;조은숙
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.625-634
    • /
    • 2004
  • 컴포넌트 아키텍쳐 설계를 위하여 재사용 가능한 독립적인 비즈니스 컴포넌트의 식별은 컴포넌트 기반 시스템 구축을 위하여 가장 중요한 작업이다. 그러나 기존 컴포넌트 기반 개발 방법론들의 컴포넌트 시별 방법은 대다수 개발자의 직관과 경험에 의존하고 있다. 또한 개발자들에 의해서 식별된 컴포넌트가 보다 독립적으로 잘 정의되었는지 평가할 기준이 없다. 따라서 본 논문에서는 개발자의 직관과 경험에 의존하는 비즈니스 컴포넌트 식별의 어려운 점을 보완하기 위하여 비즈니스 컴포넌트 식별의 평가 기준이 되는 메트릭을 컴포넌트의 특성을 부여하여 정의한다. 즉, 비즈니스 컴포넌트 식별을 위하여 컴포넌트 내의 응집도는 높고 컴포넌트 간의 결합도는 낮아야 하는 컴포넌트 특성을 적용한 응집척도와 결합척도를 제안한다. 또한 컴포넌트의 응집도와 결함도의 비율에 의하여 비즈니스 컴포넌트의 독립의 정도를 평가할 수 있는 독립척도를 제안한다. 본 논문에서 제안한 응집척도, 결합척도 그리고 독립척도를 사례에 적용하여 그 효율성을 평가한다.

국내 학술논문의 동명이인 저자명 식별을 위한 방법 (A Method for Same Author Name Disambiguation in Domestic Academic Papers)

  • 신다예;양기덕
    • 한국비블리아학회지
    • /
    • 제28권4호
    • /
    • pp.301-319
    • /
    • 2017
  • 저자명 식별이란 다른 이름으로 표기된 한 명의 개인을 식별하는 것과 같은 이름을 가진 서로 다른 저자들을 각기 구별된 개인으로 분류하는 것으로, 저자의 연구 목록 및 연구 업적 평가, 특정 분야의 전문가를 검색하거나, 인용색인과 같은 학술 정보 서비스의 원활한 운영을 위해 반드시 해결해야 할 문제이다. 본 연구는 단순 머신러닝만을 사용한 실험 결과와 휴리스틱 방식으로 데이터 셋의 오류 수정 및 정규화 작업을 이후 머신러닝의 처리 과정에 룰 베이스 기반의 규칙을 부여한 저자명 식별 실험의 결과의 비교를 통하여, 인간의 개입이 머신러닝의 단점을 보완하고 저자명 식별 성능을 향상시킬 수 있는지 알아보았다. 그 결과 F-measure 0.1 이상 향상시킨 정규화 된 email기반의 룰 베이스 저자식별 결과로 정규화 과정과 휴리스틱 설정에 필요한 인간의 패턴인식과 추론능력이 머신러닝의 단점을 보완해줄 수 있음에 대한 가능성을 나타내었다.

해부병리조직에 대한 칼라 영상분석 (Color Image Analysis of Histological tissue Sections)

  • 최흥국
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.253-260
    • /
    • 1999
  • 본 논문에서는 조합된 텍스쳐와 칼라 정보로부터 다변수의 선형 구별 알고리즘을 사용하여 영상분할에 대한 새로운 방법론의 개발을 제시한다. 그 칼라 텍스쳐는 칼라 영상의 공간과 색깔의 밴드로부터 한 화소가 갖는 3X3의 마스크에서 Haralick 과 Pressman의 텍스쳐 특성들을 계산했다. 모두 9X28개의 텍스쳐 특성들 중에서 학습을 기반으로 크게 식별자(classifier)에 영향을 주는 특성들을 도출하였으며 결과적으로 뽑혀진 10개의 특성이 한 영상을 4부분으로 분할하는데 사용되어졌다. 이 방법론의 결과로 얻어진 영상은 고전적인 칼라와 텍스쳐 분할 방법론의 상자식별자(Box Classifier)와 Maximum Likelihood 식별기들과 비교했다. 이것은 Fastred-Lightgreen으로 염색된 전립선암이 조직에서 얻은 영상을 통해 비교를 했을 경우에 잘 나타난다. 학습 데이터를 통해 나타난 이 새로운 방법론은 97.5%의 정확한 식별성으로 또한 검증된 최상의 방법론중의 하나이다. 이 결과들이 더 많은 영상에 사용된다면, 이 방법론은 칼라와 텍스쳐가 분할에 관련됨으로써 보다 정확한 영상을 분할하기 위한 효율적인 도구가 될 것이다.

  • PDF

3차원 GIS 기법을 이용한 비행안전구역 모형 생성 및 장애 식별 (Flying Safety Area Model Creation and Obstruction Identification using 3D GIS Techniques)

  • 박완용;허준;손홍규;이용웅
    • 대한토목학회논문집
    • /
    • 제26권3D호
    • /
    • pp.511-517
    • /
    • 2006
  • 본 논문은 우리나라 민 군 겸용 비행장의 고도제한의 기준이 되는 군용항공기지법을 중심으로 비행안전구역을 분석하기 위한 방법을 연구하여 개발사업 시행시에 제한 지역을 분석할 수 있는 효과적인 방법을 제시하고 최근 대두되고 있는 비행장 주변지역의 고도제한에 따른 문제 해결에 도움을 주고자 한다. 이를 위해서 지리정보체계(GIS) 기법을 활용하여 항공기 지법에서 규정하고 있는 비행안전구역의 3차원 모형을 효과적으로 생성하기 위한 방법을 제시하고, 비행안전구역 내에서 자연지형 및 인공지물로 인한 장애지역과 대상을 자동으로 식별하기 위한 기법을 제시하였다. 제시한 방법을 실제적으로 적용해보기 위하여 실험지역으로 선정한 비행장에 대하여 상용의 수치지도 자료와 위성영상을 기반으로 지형공간정보를 생성하기 위한 단계적인 방법을 제시하였으며 실험지역 비행장의 비행안전구역 모형을 생성하고, 장애지역과 대상을 식별하여 비행장 비행안전구역 분석을 위한 통합 모형을 가시화함으로써 제시한 방법들의 활용성을 보였다.

학술정보의 식별체계 현황 분석 및 연계 방안 연구 (A Study on the Analysis of Identification System and the Linkage Method of Academic-information)

  • 강주연;설재욱;황혜경
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.115-143
    • /
    • 2020
  • 4차 산업혁명 시대의 도래로 데이터 중심의 융합 연구가 증가하고 있다. 이러한 연구는 정보의 식별 및 연계의 중요성을 증가시키고 있어, 이를 지원하기 위한 학술정보의 효과적인 관리 및 유통을 위한 방안 모색이 필요하다. 이에 본 연구는 국내외 주요 학술정보서비스 12개의 식별체계 현황과 연계 가능한 정보를 분석하여 학술정보를 식별하고 연계할 수 있는 방안을 제안하고자 하였다. 현황 분석은 2차에 걸쳐 진행되었으며, 각 서비스가 제공하고 있는 학술정보의 유형과 검색 가능한 항목, 연계 정보 유형, 사용 중인 식별체계 등을 살펴보았다. 분석 결과, 국내외 주요 학술정보서비스들은 영구 식별자와 더불어 자체 식별자를 중심으로 평균 3~4개의 정보를 직·간접적으로 연계하고 있다. 또한, 기계학습 방법론을 기반으로 하여 동일 학술정보를 반자동으로 식별하고, 해당 데이터를 수집, 구축하고 있다. 상기 분석 결과를 바탕으로 실무적인 측면에서 영구 식별자 중심의 학술정보 연계 방안과 사회적인 측면에서 기관 협력 네트워크 기반의 연계 방안을 제안하였다.

러프집합 기반 GAS 식별 모델 설계 (Design of GAS Identification model based on Rough Sets)

  • 방영근;조해파;김남석;이철희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.1776-1777
    • /
    • 2011
  • 인간의 감각 중 후각에 해당하는 가스 센서들에 관한 연구가 현재 상당히 이루어지고 있다. 본 논문에서는 32개의 가스 센서들로 부터 측정된 각각의 값들과 GA를 이용하여, 4개의 센서로 구성되는 8개의 센서그룹을 결정한 후 각각의 그룹에서 나타나는 측정값들의 패턴과 러프집합이론을 이용하여 1차 식별 규칙을 생성하였다. 그 다음 8개 가스 그룹의 식별 패턴을 분석하여 다시 러프집합을 통한 2차 식별 규칙을 생성함으로써 보다 효율적이면서도 판단의 정확성을 높일 수 있는 식별 모델을 설계하는 방법을 다룬다.

  • PDF

시스템 식별에 대한 소개와 기초이론 맛보기

  • 고상호
    • 제어로봇시스템학회지
    • /
    • 제18권2호
    • /
    • pp.33-38
    • /
    • 2012
  • "시스템 식별(system identification)"이란 신호처리(signal processing)의 한 분야로서, 제어분야에서는, 제어시스템 설계 시 요구되는 제어대상 플랜트(plant)의 수학적 모델을 실제 시스템의 입력과 출력데이터를 활용하여 얻기 위한 필요한 체계적인 절차들을 제공해준다. 본 기법은 물리적 또는 화학적 기초원리(first principles)로부터 시스템 모델을 얻기가 어렵거나 매우 복잡한 경우에 주로 쓰이고 있으며, 이때 따라 산업현장에서도 점차 그 역할이 중요해지고 있다. 제어의 다른 분야와 유사하게 이 분야 또한 매우 수학적이어서 제어로봇시스템 학회지의 이번 호부터 총 4회에 걸쳐서 이 분야의 가장 근본적이며 실제적인 이론과 적용방법 들을 간단한 예제와 함께 다룰 계획이다. 첫 번째 순서로서 이번 호에서는 시스템 식별분야에 대한 빠른 이해를 위해 단순한 정적 그리고 동적인 시스템 예제에 대하여 최소자승법(least squares method)을 통한 시스템 파라미터 추정기법을 설명하며, 시스템 식별기법의 종류 그리고 시스템 식별 수행 시 반드시 거쳐야 단계와 절차를 소개한다.