• Title/Summary/Keyword: 평가 집합

Search Result 841, Processing Time 0.034 seconds

Automatic Generation of Code-clone Reference Corpus (코드클론 표본 집합체 자동 생성기)

  • Lee, Hyo-Sub;Doh, Kyung-Goo
    • Journal of Software Assessment and Valuation
    • /
    • v.7 no.1
    • /
    • pp.29-39
    • /
    • 2011
  • To evaluate the quality of clone detection tools, we should know how many clones the tool misses. Hence we need to have the standard code-clone reference corpus for a carefully chosen set of sample source codes. The reference corpus available so far has been built by manually collecting clones from the results of various existing tools. This paper presents a tree-pattern-based clone detection tool that can be used for automatic generation of reference corpus. Our tool is compared with CloneDR for precision and Bellon's reference corpus for recall. Our tool finds no false positives and 2 to 3 times more clones than CloneDR. Compared to Bellon's reference corpus, our tools shows the 93%-to-100% recall rate and detects far more clones.

Sequencing Document Clusters to Support Human Annotation Efforts (효율적인 문서 처리 작업을 위한 문서집합 나열)

  • Nah, Chong-Yeol;Moon, Il-Chul;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.75-78
    • /
    • 2008
  • 온톨로지 어노테이션(Annotation)과정은 수동에 의해 대부분의 문서 처리 작업이 진행되고 있다. 그러므로 계획적이지 않은 문서 처리는 자칫 일관성이나 효율성을 떨어뜨릴 수가 있다. 예를 들어, 처리되는 문서들의 도메인이 자주 바뀌면, 수동 어노테이션을 하는 작업자는 객관성을 잃을 가능성이 높다. 따라서, 본 연구에서는 처리되는 문서집합의 도메인이 최대한 연관성이 유지되도록 처리 문서를 집합하여 나열하는 알고리즘을 소개한다. 첫번째로, 문서들을 유사한 주제 집합으로 형성한다. 두번째로, 두개 이상의 집합에 겹치는 문서들을 계산한다. 마지막으로, 이러한 겹침이 최대화 되도록 문서들의 처리 순서를 나열한다. 본 알고리즘을 IT관련 위키피디아 문서집합을 이용하여 평가를 시행했다. 평가 결과 우리의 알고리즘을 이용하면 처리되는 문서들의 도메인 이동이 무작위로 처리하는 것 보다 연속적이었음을 수치상으로 계산할 수 있었다.

  • PDF

An Effective Large itemset Generation Algorithm (효과적인 빈발 항목 생성 알고리즘T)

  • 채덕진;황부현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.198-200
    • /
    • 2000
  • 대용량의 데이터베이스에서 여러 트랜잭션에 동시에 나타나는 항목들의 모임인 빈발 항목집합을 찾아내는 데이터 마이닝 방법을 연관 규칙 탐사라고 한다. 빈발 항목집합을 찾아내는 데이터 마이닝 방법을 연관 규칙 탐사라고 한다. 빈방 항목집합을 찾아내는 문제는 항목 집합들의 후보 집합을 생성하고 빈발 항목집합의 조건을 충족시키는 후보 집합을 추출함으로써 해결된다. 그리고 이러한 작업은 각각의 빈발 k-항목집합에 대해 k가 증가함에 따라 반복적으로 수행된다. 그러나 연관 규칙 탐사에 관한 기존의 연구는 주로 데이터베이스를 이루는 항목들의 수가 많거나 트랜잭션의 길이가 긴 경우의 대용량 데이터베이스에서 빈발 항목집합의 발견에 초점을 맞추고 있다. 본 논문에서는 데이터베이스를 이루는 전체 항목의 수가 적거나 트랜잭션의 크기가 작은 경우 효과적으로 빈발 항목집합을 찾을 수 있는 연관 규칙 탐사 방법을 제안한다. 그리고 성능 평가를 통하여 제안하는 방법의 성능 및 타당성을 보인다.

  • PDF

A Study on the Knowledge Base Development of Expert System for Naval Combat System (해군 전투체계 지원용 전문가시스템의 지식베이스 개발에 관한 연구(구축함 중심))

  • 김화수;이정훈
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.183-192
    • /
    • 2002
  • 본 논문에서는 구축함의 대공방어분야에 대한 업무를 IDEF0기능 모델링 방법을 통해 체계적으로 분석하였으며 미국방성의 산하기구인 DARPA에서 연구한 CPOF(Command Post Of Future) 의사결정 모델을 토대로 구축함의 대공방어분야에서 상황평가 단계에 대한 의사결정 과정을 심도 깊게 분석하였다. 또한 구축함의 대공방어분야에서 분석된 업무수행 절차를 토대로 상황평가 단계에서 의사결정과정에 따른 필요한 규칙집합을 식별하고 규칙집합 내부의 규칙들을 효과적으로 추출하기 위하여 규칙집합들에 대한 정의, 규칙에 입력되는 데이터, 규칙집합의 결과값, 규칙집합간의 상호관계를 분석하였다. 이러한 도메인 지식개발은 장차 해군 전투체계 지원용 전문가시스템을 개발하는데 중요한 기회기반이 될 것이다.

  • PDF

Comparison of Gene Selection Method for Prediction of Non-muscle Bladder Cancer Recurrence (비침윤성 방광암 환자의 재발 예측을 위한 유전자 선택 기법 비교)

  • Lee, Kyung Seok;Park, Hyun Woo;Park, Soo Ho;Yun, Seok Joong;Ryu, Keun Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.87-89
    • /
    • 2013
  • 이 논문에서는 비침윤성 방광암 환자의 재발 예측을 위해 마이크로어레이 데이터에서 최적의 속성 부분 집합을 찾고 이를 비교 평가한다. 정보 이득(information gain)을 통해 구한 상위 40개, 80개, 100개의 속성 집합과 FCBF(fast correlation based filter) 알고리즘을 적용하여 구한 최적의 속성 부분집합을 SVM 분류 모델에 적용하여 정확도를 비교 평가한 결과 정보 이득을 적용한 상위 100개 속성 부분집합의 분류 정확도가 가장 높게 나왔으며, FCBF 알고리즘을 적용한 속성 집합은 비교적 적은 속성을 사용하면서 이와 비슷한 분류 정확도를 보임을 확인할 수 있었다.

반경 방향 집합조직을 가진 압력관에서의 $K_{IH}$

  • 김성수;주기남;안상복;권상철;김영석;국일현
    • Proceedings of the Korean Nuclear Society Conference
    • /
    • 1998.05b
    • /
    • pp.93-98
    • /
    • 1998
  • CANDU 압력관의 집합조직을 원주 방향 집합조직에서 반경 방향 집합조직으로 변화시켜 $K_{IH}$ 를 평가하였다. 집합조직은 평면 변형에 의한 25% 확관 방법으로 번화시켰고 (0002) direct pole figure와 basal pole component (기저면 성분, Kearns number)로 분석하였다. 반경 방향집합조직의 압력관의 $K_{IH}$ 는 2$50^{\circ}C$에서 17MPa√m 이상으로 나타났으며, 이것은 상용 압력관의 $K_{IH}$ =8-10 MPa√m보다 70% 이상 높은 값이다. 반경 방향 집합조직의 압력관에서 나타나는 $K_{IH}$ 거동을 균열 진전면에서의 기저면 성분과 연계하여 분석하였으며, 평면 면형에 따른 집합조직의 변화는 슬립과 쌍정 기구의 작용으로 설명하였다. 본 연구의 결과는 CANDU 압책관의 delayed hydride cracking (DHC) 저항성 관점에서 반경 방향으로 집합조직을 제어하면 매우 효율적이라는 것을 보여 준다.

  • PDF

베타형 Ti-Nb-Ge 합금의 초탄성 거동에 미치는 집합조직의 영향

  • Kim, Han-Sol;Lee, Hae-Jin;Song, Guk-Hyeon;Kim, Won-Yong
    • Proceedings of the Materials Research Society of Korea Conference
    • /
    • 2012.05a
    • /
    • pp.102.1-102.1
    • /
    • 2012
  • Ti 및 Ti 합금은 치과 및 정형외과 등의 분야에서 생체재료로써 다양한 용도로 적용되고 있으며, 보다 안전하고 우수한 특성의 Ti 합금 개발에 대한 관심이 높아지고 있다. 본 연구에서는 Ti-Nb-Ge 합금의 초탄성 특성에 미치는 집합조직의 영향에 대해 조사하였다. 집합조직 제어를 위해 등속 및 이주속 압연을 적용한 후 $850^{\circ}C$에서 30분~2시간까지 어닐링하였다. 광학현미경과 SEM-EBSD를 이용하여 미세조직 및 집합조직을 분석하고, 순환식 인장시험을 통해 시편의 초탄성 특성을 평가하였다. 등속압연 후 어닐링한 시료의 경우 alpha-fiber 집합조직이 발달하는 한편, 이속압연 후 어닐링한 시료는 {113}// 및 {331}의 집합조직이 발달하는 것으로 나타났다. 마르텐사이트 변태에 의한 변형회복능과 집합조직 성분별 강도의 관계를 비교한 결과, alpha-fiber 집합조직이 발달할수록 변형회복능이 증가하는 것으로 나타났다.

  • PDF

A Metamodel for Creation and Maintenance of Evaluation Set of Software Package Evaluation (소프트웨어 패키지 평가를 위한 평가집합의 생성 및 유지를 위한 메타 모델)

  • Oh, Jae-Won;Lee, Chong-Won;Park, Dong-Chul;Lee, Byung-Jeong;Wu, Chi-Su;Kim, Soon-Yong;Song, Gi-Pyeung
    • The KIPS Transactions:PartD
    • /
    • v.11D no.3
    • /
    • pp.577-590
    • /
    • 2004
  • Today, the growth of software industry leads to e quantitative expansion of software package products. Due to this rapid increase of software package products, qualify certification has been required fur software products which users select. Unlike the quality certification of industrial products, the history of software product certification has not been so long. For this reason, software quality evaluation and certification methods have not matured yet. When certifying software products, one of most important factors is the systematic generation of evaluation sets. The evaluation sets include checklists with metrics, and criteria for the software quality certification according to the classification of software product type. This paper presents a metamodel for the systematic generation and maintenance of the evaluation sets. Then, we construct prototype level evaluation sets to show the validity of the metamodel.

Extension and Validation of Hangul Text Collection(HANTEC) (한국어 테스트 컬렉션 HANTEC의 확장 및 보완)

  • Kim, Ji-Young;Jang, Dong-Hyun;Myaeng, Sung-Hyon;Lee, Suk-Hoon;Seo, Jeong-Hyon;Kim, Hyun
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.210-215
    • /
    • 2000
  • HANTEC1.0은 12만 건의 문서집합과 30개의 질의집합, 그리고 각 질의에 대한 적합문서로 구성된 정보검색용 한글 테스트 컬렉션이다. 본 연구에서는 HANTEC1.0의 확장 및 보완하기 위해 과학기술분야 20개의 질의를 추가하였는데, 질의 추가를 위해서 일본 NACSIS 테스트 컬렉션의 질의를 번역하여 사용함으로써 한일 교차언어 검색환경을 조성하고자 하였다. 추가된 각 질의에 대해서는 여러 검색기에서 총 41가지 검색방법으로 검색한 후, 각 검색조합의 상위 50개 문서로 구성된 중간 결과집합을 만들었으며, 이를 대상으로 적합성판정에 대한 평가기준 및 절차 교육이 이루어진 평가자가 각 질의에 대한 적합성평가를 실시하였다. 이렇게 구축된 HANTEC 테스트 컬렉션의 적합문서 집합의 객관적 품질 평가와 시스템 성능평가를 위하여 통계적인 방법을 적용하므로써 공신력있고 일반화된 테스트 컬렉션을 구축하고자 하였다. 현재 HANTEC2.0은 검색분야 연구자 및 개발자에게 자유롭게 배포 중이며 정복머색 시스템의 신뢰도 측정을 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용되어질 것이다.

  • PDF

Extension and Validation of Hangul Text Collection(HANTEC) (한국어 테스트 컬렉션 HANTEC의 확장 및 보완)

  • Kim, Ji-Young;Jang, Dong-Hyun;Myaeng, Sung-Hyon;Lee, Suk-Hoon;Seo, Jeong-Hyun;Kim, Hyun
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.210-215
    • /
    • 2000
  • HANTEC1.0은 12만 건의 문서집합과 30개의 질의집합, 그리고 각 질의에 대한 적합문서로 구성된 정보검색용 한글 테스트 컬렉션이다. 본 연구에서는 HANTEC1.0의 확장 및 보완하기 위해 과학기술분야 20개의 질의를 추가하였는데, 질의 추가를 위해서 일본 NACSIS 테스트 컬렉션의 질의를 번역하여 사용함으로써 한일 교차언어 검색환경을 조성하고자 하였다. 추가된 각 질의에 대해서는 여러 검색기에서 총 41가지 검색방법으로 검색한 후, 각 검색조합의 상위 50개 문서로 구성된 중간 결과집합을 만들었으며, 이를 대상으로 적합성판정에 대한 평가기준 및 절차 교육이 이루어진 평가자가 각 질의에 대한 적합성평가를 실시하였다 이렇게 구축된 HANTEC 테스트 컬렉션의 적합문서 집합의 객관적 품질 평가와 시스템 성능평가를 위하여 통계적인 방법을 적용하므로써 공신력있고 일반화된 테스트 컬렉션을 구축하고자 하였다. 현재 HANTEC2.0은 검색분야 연구자 및 개발자에게 자유롭게 배포 중이며 정보검색 시스템의 신뢰도 측정을 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용되어질 것이다.

  • PDF