• Title/Summary/Keyword: data repository

Search Result 436, Processing Time 0.032 seconds

Transfer Learning based DNN-SVM Hybrid Model for Breast Cancer Classification

  • Gui Rae Jo;Beomsu Baek;Young Soon Kim;Dong Hoon Lim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.1-11
    • /
    • 2023
  • 유방암은 전 세계적으로 여성들 대다수에게 가장 두려워하는 질환이다. 오늘날 데이터의 증가와 컴퓨팅 기술의 향상으로 머신러닝(machine learning)의 효율성이 증대되어 암 검출 및 진단 등에 중요한 역할을 하고 있다. 딥러닝(deep learning)은 인공신경망(artificial neural network, ANN)을 기반으로 하는 머신러닝 기술의 한 분야로 최근 여러 분야에서 성능이 급속도로 개선되어 활용 범위가 확대되고 있다. 본 연구에서는 유방암 분류를 위해 전이학습(transfer learning) 기반 DNN(Deep Neural Network)과 SVM(support vector machine)의 구조를 결합한 DNN-SVM Hybrid 모형을 제안한다. 전이학습 기반 제안된 모형은 적은 학습 데이터에도 효과적이고, 학습 속도도 빠르며, 단일모형, 즉 DNN과 SVM이 가지는 장점을 모두 활용 가능토록 결합함으로써 모형 성능이 개선되었다. 제안된 DNN-SVM Hybrid 모형의 성능평가를 위해 UCI 머신러닝 저장소에서 제공하는 WOBC와 WDBC 유방암 자료를 가지고 성능실험 결과, 제안된 모형은 여러 가지 성능 척도 면에서 단일모형인 로지스틱회귀 모형, DNN, SVM 그리고 앙상블 모형인 랜덤 포레스트보다 우수함을 보였다.

신뢰성 있는 전자기록관리기관 감사인증도구 개발에 관한 연구 (Development Process and Methods of Audit and Certification Toolkit for Trustworthy Digital Records Management Agency)

  • 이해영;김익한;임진희;심성보;조윤선;김효진;우현민
    • 기록학연구
    • /
    • 제25호
    • /
    • pp.3-46
    • /
    • 2010
  • 전자기록관리는 수많은 사회적 기술적 요소가 상호작용하는 하나의 시스템이다. 신뢰받는 상태를 계속 유지하기 위해 전자기록관리기관은 감사와 인증의 정규적인 수행이 필요할 것이다. 이에 따라 개별 전자기록관리기관에서는 스스로의 신뢰도를 지속적으로 평가해보는 도구로 사용할 수 있고 스스로의 환경과 시스템을 자체 평가하여 부족한 부분도 파악할 수 있게 하는 도구의 필요성이 생겼다. 본 연구의 목적은 OAIS 참조모형(ISO 14721)과 영국 UKDA와 TNA의 자가진단보고서, TRAC 및 DRAMBORA 등 4개 표준과 국제모범사례를 분석하고, MoReq2와 현행 국내 법령 및 표준 등을 종합, 분석하여 자체인증도구를 개발하고자 하는 것이었다. 본 연구에서는 이 인증도구의 개발과정과 전체적인 틀을 기술함으로써, 타 기관에서도 기관의 특성에 따라 이러한 도구를 개발하고 자체적으로 활용할 수 있는 개발방법론을 제시하고자 하였다. 본 연구의 진행 결과, (기관) 운영관리, 분류체계 및 기준정보 관리, 입수, 등록 기술, 저장 보존, 처분, 서비스, 검색도구 제공, 시스템 관리, 접근통제 보안, 모니터링 감사증적 통계, 위험관리 등 총 12개 영역으로 진단영역이 확정되었다. 설정된 12개 영역 각각에 대해 각 영역별로 프로세스 맵 또는 기능차트 등을 만들고 업무기능을 분석한 후, 영역별 주요 업무기능 단위를 중심으로 구성된 54개의 '평가지표'가 도출되었다. 각 평가지표 별로 실제 자가진단을 시행할 수 있는 측정 가능하고 증빙이 가능하도록 작성한 208개의 '평가세부지표'를 도출하였다. 본 연구의 결과물로 생성된 이 지표는 전자기록관리기관의 감사인증도구로 사용될 수 있어, 기관 스스로 정기적으로 자가진단을 실행하는 데에 활용함으로써, 발견된 미비점을 보완하고 향후 기관의 발전 전략에 반영할 수 있다.

온톨로지 기반의 수강지도 시스템 (Ontology-based Course Mentoring System)

  • 오경진;윤의녕;조근식
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.149-162
    • /
    • 2014
  • 수강지도는 학생의 졸업인증이나 공학교육인증 이수를 위해 수강 신청 이전에 수행되는 과정을 지칭한다. 수강지도는 학생의 수강이력 점검과 향후 수강 과목의 안내 등을 포함하여 학생들의 졸업 및 교과과정 인증과 관련된 중요한 역할을 하고 있다. 현재 대부분 대학에서는 수강지도를 위한 전산시스템의 부재로 인해 지도교수가 직접 수동적으로 수강지도를 진행하고 있다. 하지만 이러한 수동적인 방식의 수강지도는 지도교수가 각 학생에 대한 정보를 분석해야 하고, 때때로 휴먼에러를 일으키게 된다. 수강신청이 학기 단위로 이루어지기 때문에 휴먼에러로부터 발생된 피해는 원상태로 되돌리는 것이 거의 불가능하다. 따라서 수강지도를 진행함에 있어 자동화된 시스템은 필수적인 요소로 판단된다. 관계 데이터 모델을 이용한 수강지도 시스템의 도입은 수동적인 수강지도의 문제점을 해결할 수 있게 해준다. 하지만 교육과정 및 인증제도의 변화에 따라 기존 시스템의 스키마 변경이 요구되고, 수강 과목 사이에 존재하는 관계 및 의미적인 검색을 제공하는 것이 어렵다는 한계가 존재한다. 본 논문에서는 수강지도 시스템을 위한 수강지도 온톨로지를 모델링하고, 온톨로지 기반의 수강지도 시스템을 설계한다. 온톨로지 인스턴스 생성을 위해 JENA 프레임워크를 이용하여 온톨로지 생성 모듈을 개발하였고, 실험에 참가한 학생의 수강 이력 데이터를 기반으로 온톨로지 인스턴스를 생성하고 추론과정을 통해 트리플 저장소에 저장하였다. 실험은 제안하는 시스템이 학생들이 향후 수강할 수 있는 과목을 모두 제공하는지 여부와 제공되는 과목에 대한 정보 및 학점 계산들이 정확한 지를 측정하였다. 실제 학생의 수강내역을 이용한 실험의 결과는 온톨로지 기반의 수강지도 시스템이 현 수강지도 시스템의 수동적 방법을 해결하고, 사람이 지도한 내용과 같은 내용을 도출하는 것을 확인함으로써 제안하는 시스템의 유효성을 보여준다.

XML 실체뷰를 이용한 XML 질의 처리 : 경로 표현식의 분할 처리 및 결과 통합 (Processing XML Queries Using XML Materialized Views : Decomposition of a Path Expression and Result Integration)

  • 문찬호;강현철
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.621-638
    • /
    • 2003
  • 웹 상에서 XML 문서의 수요가 증가함에 따라 XML 문서를 자원으로 갖는 웹 서비스 응용들이 증가하고 있다. 이들 웹 서비스 응용에서 질의 처리 시 성능 향상을 위해 XML 데이타에 대한 뷰 메커니즘을 고려할 수 있다. XML 질의 결과를 실체뷰로 유지하고, 하부 XML 문서에 대한 원래의 질의를 관련된 실체뷰에 대한 질의로 변환하여 수행한다면 질의 응답시간을 줄일 수 있을 것이다. 실체뷰를 이용한 질의 처리의 유형으로는 $\circled1$ 실체뷰로부터 원하는 결과를 모두 얻을 수 있는 유형과 $\circled2$ 질의 결과의 일부는 실체뷰에 존재하지만 일부는 하부 XML 문서로 부터 검색해야 하는 유형이 있다. 본 논문에서는 두 번째 유형에 대하여 연구한다. 본 논문의 질의는 여러 XML 질의어들이 갖는 핵심적인 기능 중 하나인 XML 경로 표현식이다. 본 논문에서는 먼저, XML 저장소 내 하부 XML 문서들로부터 도출된 XML 실체뷰의 저장 구조를 제시 한 후, 주어진 XML 질의를 실체뷰에 대한 질의와 하부 데이타에 대한 질의로 분할하는 알고리즘과 분할 질의의 결과를 통합하는 알고리즘을 제시한다. 그리고, 성능 평가를 통하여 실체뷰를 이용한 질의 분할 처리가 성능 향상을 가져오는 조건을 구한다.

개발자 별 버그 해결 유형을 고려한 자동적 개발자 추천 접근법 (A Technique to Recommend Appropriate Developers for Reported Bugs Based on Term Similarity and Bug Resolution History)

  • 박성훈;김정일;이은주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.511-522
    • /
    • 2014
  • 소프트웨어 개발 및 유지보수 과정에서 여러 종류의 버그가 발생된다. 버그는 소프트웨어의 개발 및 유지 보수 시간을 증가시키는 주요원인으로 소프트웨어의 품질 저하를 초래한다. 버그의 발생을 사전에 완벽하게 방지하는 것은 불가능하다. 대신 버그 질라(Bugzilla), 멘티스BT(MantisGBT), 트랙 (Trac), 질라 (JIRA)와 같은 버그 트래킹 시스템을 이용하여 버그를 효과적으로 관리하는 것이 가능하다. 개발자 또는 사용자가 발생된 버그를 버그 트래킹 시스템에 보고하면, 프로젝트 매니저에 의해서 보고된 버그는 버그 해결에 적합한 개발자에게 전달되어 해결될 때까지 버그 트래킹 시스템에 의해서 추척된다. 여기서 프로젝트 매니저가 버그 해결에 적합한 개발자를 선별하는 것을 버그 분류 작업 (Bug triaging)이라고 하며, 대량으로 발생되는 버그 리포트들을 수동으로 분류하는 것은 프로젝트 매니저에게 있어서 매우 어려운 문제가 된다. 본 논문에서는 버그 트래킹 시스템에 저장된 과거에 해결된 버그 리포트에서 개발자 별 버그 해결 유형을 추출하고, 이를 활용한 버그 분류 작업, 즉 개발자 추천 방법을 제안한다. 먼저 버그 트래킹 시스템에서 각 개발자가 해결한 버그 리포트들을 분류한 후, 자연 언어 처리 알고리즘과 TF-IDF (Term frequency-Inverse document frequency)를 활용하여 각 개발자 별 단어 리스트를 생성한다. 그 후, 새로운 버그가 발생되었을 때 코사인 유사도를 통해서 생성된 개발자 별 단어 리스트와 새로운 버그 리포트의 단어 리스트를 비교하여 가장 유사한 단어 리스트를 가지는 개발자를 추천하는 방법이다. 두 오픈 소스 프로젝트인 이클립스 JDT.UI와 CDT.CORE를 대상으로 수행한 개발자 추천 실험에서 기계 학습 모델 기반의 추천 방법보다 제안하는 방법이 더 우수한 결과를 얻은 것을 확인하였다.

고준위폐기물처분시스템 공학적 방벽에서의 지하수 포화공정 해석 (An Analysis of the Water Saturation Processes in the Engineered Barrier of a High Level Radioactive Waste Disposal System)

  • 박정화;이재완;권상기
    • 방사성폐기물학회지
    • /
    • 제9권1호
    • /
    • pp.23-32
    • /
    • 2011
  • 한국형 기준 처분시스템의 공학적 방벽에서의 열-수리-역학 복합 현상을 실증하기 위한 공학적 규모 실증실험 장치인 KENTEX에서 얻은 열, 수리, 역학적 실험 데이터를 이용하여 벤토나이트의 포화공정을 해석하였다. ABAQUS를 사용한 모델계산의 함수율과 실험 결과의 비교에서 불포화 영역에서는 온도상승으로 인해 초기 수분이 감소하는 수분 재분포 공정을 모델에 포함시키지 않아 함수율의 차가 컸다. 포화 영역에서는 실험에서 초기 수분보다 낮은 함수율에서부터 지하수로 포화가 진행되지만 모델과 실험에서 얻은 함수율 값의 차이가 점점 감소해 완전포화에 도달할 때에는 두 함수율 값이 거의 비슷한 결과를 보여주였다. 포화도 약 95%에 이르는 시간은 실험결과와 계산 결과가 서로 비슷한 약 500일 정도로 예측할 수 있었다. 그리고 불포화 영역의 수분 재분포가 벤토나이트의 완전포화에 도달하는 시간에는 큰 영향을 미치지 않는 것으로 분석되었다. 따라서 본 해석기법을 사용하면 지하처분연구시설의 완충재인 벤토나이트의 포화시간을 예측할 수 있을 것으로 판단된다.

대용량 분산파일시스템을 위한 비공유 메타데이타 관리 기법 (A Non-Shared Metadata Management Scheme for Large Distributed File Systems)

  • 윤종현;박용훈;이석재;장수민;유재수;김홍연;김영균
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권4호
    • /
    • pp.259-273
    • /
    • 2009
  • 최근 많은 연구가 진행 중인 대부분의 클러스터 기반 분산파일시스템은 파일에 대한 읽기, 쓰기 작업으로부터 메타데이타의 처리를 분리했다는 특징을 가지고 있다. 즉 파일시스템에 기록된 파일에 대한 권한 정보, 파일의 실제 데이타가 저장된 저장소의 위치 정보, 파일시스템의 네임스페이스 유지 등 메타데이타와 관련된 정보 및 이를 처리하는 기능을 별도의 메타데이타 서버가 관리한다. 하지만 기존 시스템의 메타데이타 관리기법들은 데이타의 분산 관리 및 입출력 성능만 중점을 두고 설계되어 있어 파일시스템 확장에 따른 메타데이타 입출력 성능 및 확장성에서 한계를 나타내고 있는 상황이다. 따라서 본 논문에서는 클러스터 기반 분산파일시스템에서 보다 나은 성능과 확장성을 제공하는 수 있는 비공유 메타데이타 관리 기법을 제안한다. 먼저 본 논문에서는 새로운 메타데이터 분할 기법으로 사전식 분할 기법을 제안한다. 다음으로 제안하는 메타데이타 분할 기법을 지원하기 위한 부하 분산 기법을 제시한다. 본 논문에서 제안하는 메타데이타 관리 기법은 기존 메타데이타 관리기법과 비교하여 확장성 및 부하 분산에서 우수함을 보인다.

국내 SOC 리포트카드 작성 지원을 위한 SOC 정보시스템 시범 구축 연구 (A pilot study on SOC information system for SOC report card writing support)

  • 장윤미;홍창희
    • 한국산학기술학회논문지
    • /
    • 제18권2호
    • /
    • pp.142-148
    • /
    • 2017
  • 우리나라는 1970년대 경제성장과 함께 도로, 철도, 공항 등 SOC가 급증하였고, 30년의 세월동안 시설물들은 노후화가 진행되고 있다. 노후화가 진행된 SOC는 국가경쟁력 저하 뿐 만 아니라, 국민의 안전까지 위협하는 시설물이 되고 있다. 국민의 생활과 밀접한 관계가 있는 SOC에 대한 체계적인 관리와 운영이 필요한 실정이며, 이를 위해 SOC리포트카드 작성을 통한 체계적이고 효율적인 시설물 관리가 필요할 것으로 보인다. 미국에서는 주기적으로 SOC리포트카드를 발간하여, 예산확보에 활용하고 있다. 국내의 경우에는 SOC별 관리기관과 운영 주체가 각각 다르며 통합적으로 SOC를 모니터링 할 수 있는 시스템은 없는 실정이다. 이에, 국내의 산재되어 있는 자료들을 한 곳으로 모아 정량적 평가를 지원할 수 있는 'SOC 정보 시스템'을 시범 구축하였다. 시범 구축한 시스템은 'SOC 정보 시스템'을 통해 평가 정보들을 웹 화면에 도시하였고, 이를 통해 평가지원 시스템 구현의 가능성을 확인하였다. 산재되어 있는 SOC 정보들을 하나의 저장소로 모으는 작업은 정책적 역할이 뒷받침 되어야하며 단기간에 해결될 수 없는 일이지만 궁극적으로 국가경쟁력 및 국민안전의 질적 향상을 기대할 수 있을 것으로 판단된다.

국가직무능력표준(NCS)의 4년제대학 정보시스템개발 교육과정을 위한 중요도분석연구 (An Importance Analysis of National Competency Standard for 4-year College Information Systems Development Curriculum)

  • 김재경
    • 한국산업정보학회논문지
    • /
    • 제22권4호
    • /
    • pp.117-129
    • /
    • 2017
  • 본 연구는 4년제 대학의 정보시스템개발 교육과정과 연관된 국가직무능력표준(National Competency Standard-NCS)에서 제시된 학습모듈을 파악하고 정보시스템개발 교육과정에 대한 NCS의 활용가능성을 분석하고자 한다. 두 전문가 그룹인 대학교수와 정보시스템개발자를 대상으로 NCS의 응용SW엔지니어링 분야에 속한 26개 능력단위의 중요도를 계층화분석과정을 통해 능력단위별로 쌍대비교 분석한 결과는 다음과 같다. 첫째, 능력단위별 능력단위요소들에 상대적 중요도는 요구사항 확인하기, UI요구사항확인하기, 물리데이터저장소설계하기, 개발자통합테스트하기와 개발자결함조치하기로 나타났다. 둘째, 초 중급개발자 그룹은 시스템개발 이행단계에 속한 능력단위요소를 보다 중요하다고 판단하였고, 고급개발자 그룹은 이론중심의 설계와 관련 있는 능력단위요소를 중요하다고 제시하였다. 또한 교수자 그룹은 두 개발자 그룹이 각각 중요하다고 판단한 실무 및 이론적 내용 모두 중요하다고 판단하였다. 본 결과를 바탕으로 정보시스템개발 관련 직무수행역량의 함양과 교육의 질적 제고를 가져올 수 있는 교육과정 개발에 대한 시사점을 제시하였다.

디지털 보존의 비용요소에 관한 연구 (A Study on Costs of Digital Preservation)

  • 정혜경
    • 정보관리학회지
    • /
    • 제22권1호
    • /
    • pp.47-64
    • /
    • 2005
  • 디지털 자료에의 장기적인 접근을 보장하기 위해서는 체계적인 디지털 보존이 이루어져야 하며, 디지털 보존에 대한 지속적인 예산 지원에는 비용요소에 대한 구체적인 파악이 선행되어야 한다. 본 연구는 기존 관련연구를 토대로 디지털 보존의 필수 비용요소들을 추출하였으며, 이를 보존과의 관련성 정도에 따라 직접보존비용과 간접보존비용으로 범주화하였다. 디지털화 사업이 대규모로 진행되고 있는 국내 도서관을 사례분석 대상으로 선정하여 디지털 보존현황을 분석하고 보존비용을 추정하였다. 사례분석 결과, 기본적인 디지털 보존은 이루어지고 있으나 디지털 자료에의 장기적인 접근을 보장하기 위한 보다 포괄적이고 체계적인 보존기능이 미흡한 것으로 나타났다. 현재 사례분석 대상 도서관에서 수행되고 있는 디지털 보존을 토대로 분석했을 때, 도서관 A와 B에서는 각각 원문DB 구축비용의 $11.8\%$$8.6\%$에 달하는 디지털 보존비용이 매년 투입되어야 하는 것으로 추정되었다. 그러나 본 연구의 결과는 매우 보수적인 추정치라고 할 수 있다. 이는 대상 도서관의 경우 디지털 서고의 구축과 메타데이터 생성 등의 보존기능이 수행되지 않고 있어 이에 소요되는 비용이 추정에서 배제되었기 때문이다. 본 연구는 디지털 보존이 디지털 자료의 생산 단계부터 접근까지의 모든 활동에 직${\cdot}$간접으로 관련되어 있는 종합적인 활동이며, 디지털화 사업을 착수하는 단계에서부터 반드시 고려되어야 하는 사업임을 입증해 주고 있다.