• 제목/요약/키워드: Indexing Process

검색결과 174건 처리시간 0.032초

국내 학술논문 주제 분류 알고리즘 비교 및 분석 (Comparison and Analysis of Subject Classification for Domestic Research Data)

  • 최원준;설재욱;정희석;윤화묵
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.178-186
    • /
    • 2018
  • 학술정보 성과물을 서비스하기 위하여 논문 단위의 주제 분류는 필수가 된다. 하지만 현재까지 저널 단위의 주제 분류가 되어 있으며 기사 단위의 주제 분류가 서비스되는 곳은 많지 않다. 국내 성과물 중에서 학술 논문의 경우 주제 분류가 있으면 좀 더 큰 영역의 서비스를 담당할 수 있고 범위를 정해서 서비스 할 수 있기 때문에 무엇보다 중요한 정보가 된다. 하지만, 분야 별 주제를 분류하는 문제는 다양한 분야의 전문가의 손이 필요하고 정확도를 높이기 위해서 다양한 방법의 검증이 필요하다. 본 논문에서는 정답이 알려져 있지 않은 상태에서의 정답을 찾는 비지도 학습 알고리즘을 활용해서 주제 분류를 시도해 보고 연관도와 복잡도를 활용해서 주제 분류 알고리즘의 결과를 비교해 보고자 한다. 비지도 학습 알고리즘은 주제 분류 방법으로 잘 알려진 Hierarchical Dirichlet Precess(HDP). Latent Dirichlet Allocation(LDA), Latent Semantic Indexing(LSI) 알고리즘을 활용하여 성능을 분석해 보았다.

수술 동영상의 비식별화를 위한 개인식별정보 자동 검출 시스템 설계 및 구현 (Design and Implementation of Automated Detection System of Personal Identification Information for Surgical Video De-Identification)

  • 조영탁;안기옥
    • 융합보안논문지
    • /
    • 제19권5호
    • /
    • pp.75-84
    • /
    • 2019
  • 최근 의료정보기술 분야에서 비디오는 풍부한 임상정보를 포함하는 특징으로 인하여 새로운 서비스 창출 및 연구개발을 위한 중요한 데이터로서 그 가치를 새롭게 평가받고 있다. 그러나 임상정보는 개인정보를 포함하고 있어, 생명윤리 혹은 연구 윤리에 대한 고려가 필요하다. 따라서 비디오 또한 의료영상으로서 비식별화가 요구되지만 기존 방법은 주로 정형데이터와 정지영상에 특화되어 기존의 방법을 그대로 적용하기 어려운 문제가 있다. 본 논문에서는 개인정보 비식별화 처리 시스템과의 연동을 고려하여 비디오 내에서 개인식별정보를 검출하는 자동화 시스템을 제안한다. 제안 시스템은 장면분할과 체내외 영역 검출의 전처리 후에 텍스트 및 사람검출을 통한 인덱싱과정을 수행한다. 검출된 개인식별 인덱스 정보는 비식별화를 수행하는 외부 시스템 및 시각화를 위한 메타데이터로 제공된다. 제안 시스템의 효용성을 검증하기 위하여 프로토타입을 구현하고 실제 수술비디오를 대상으로 인덱싱 속도를 측정하였다. 그 결과 입력 비디오의 재생시간 대비 2배 이상의 빠른 작업속도를 보였으며, 수술교육콘텐츠 제작 및 학술용 반자동 편집시스템의 사례를 통해 빠른 의사결정을 보조할 수 있음을 확인하였다.

의미기반 비디오 검색을 위한 인덱싱 에이전트의 설계 (Design of Indexing Agent for Semantic-based Video Retrieval)

  • 이종희;오해석
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.687-694
    • /
    • 2003
  • 최근 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이터에 대한 다양한 검색은 더욱 중요한 의미를 가지게 되었다. 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

필드와 모션벡터의 특징정보를 이용한 스포츠 뉴스 비디오의 장르 분류 (Automatic Genre Classification of Sports News Video Using Features of Playfield and Motion Vector)

  • 송미영;장상현;조형제
    • 정보처리학회논문지B
    • /
    • 제14B권2호
    • /
    • pp.89-98
    • /
    • 2007
  • 비디오와 브라우징, 검색, 조작을 위해서 비디오 내용을 기술하는 색인이 요구된다. 지금까지 색인의 구성은 대부분 비디오 내용에 제한된 키워드를 수작업으로 할당하는 전문가에 의해 수행되었는데 이는 비용과 시간을 소비하는 사업이므로 비디오 내용을 자동으로 분류하는 것이 필요하다. 이 연구는 축구, 골프, 야구, 농구, 배구 등 5종의 스포츠 뉴스 비디오의 분석과 요약을 위해서 자동적이고 효율적인 방법을 제안한다. 우선, 스포츠 뉴스 비디오를 앵커 장면과 스포츠 기사 장면으로 분류한다. 장면 분류는 앵커 장면의 영상 전처리와 색상 특정을 기반으로 한다. 그리고 필드의 우세색상과 모션 방향을 특징으로 이용하여 스포츠 장면을 5개의 장르로 분류한다. 241개의 스포츠 뉴스 장면에 대한 실험에서 75%의 정확도를 얻었다. 따라서 제안된 기법은 향후 개별 스포츠 뉴스와 스포츠 하이라이트를 위한 뉴스 비디오를 검색하는데 이용될 수 있을 것이다.

헬스케어 정보 관리 시스템의 3D 의료영상 데이터 다중 워터마킹 기법 (3D Medical Image Data Watermarking Applied to Healthcare Information Management System)

  • 이석환;권기룡
    • 한국통신학회논문지
    • /
    • 제34권11A호
    • /
    • pp.870-881
    • /
    • 2009
  • 의료 IT 기술 발전과 함께 의료 디지털 도서관, 3D PACS, 3D 의료진단기기 등의 헬스케어 정보 관리 기술이 급격히 발전되면서 이에 대한 보안 이슈가 제기되고 있다. 본 논문에서는 헬스케어 정보 관리 시스템에서 3D 의료영상 데이터의 저작권 보호, 인증, 인덱싱 및 진단 정보 은닉 등을 위한 다중 워터마킹 기법을 제안한다. 제안한 기법에서는 POCS 워터마킹 기반으로 의료진의 디지털 서명 및 정보 검색 인덱싱을 위한 강인한 워터마크를 꼭지점 정규곡률 분포에 삽입하고, 진단 정보와 인증 기준 메시지를 위한 연약한 워터마크를 꼭지점 거리 차이에 삽입한다. 이 때 강인성, 연약성 및 비가시성에 대한 각각의 볼록 집합들을 설계한 다음, 3D 의료영상 데이터들을 이들 집합으로 반복 투영함으로써 다중 워터마크를 삽입한다. 실험 결과부터 제안한 기법이 다양한 3D 기하학 및 메쉬 변형에 대한 강인성과 연약성을 모두 만족함을 확인하였다.

시공간 데이타베이스에서 영역 합 질의를 위한 색인 기법 (An Indexing Technique for Range Sum Queries in Spatio - Temporal Databases)

  • 조형주;최용진;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.129-141
    • /
    • 2005
  • 시공간 데이타베이스는 최근에 많은 주목을 받았지만, 영역 합 질의에 대한 연구는 그 중요성에 비하여 많이 부족하다. 영역 합 질의를 처리하기 위하여, 많은 양의 데이타에 대한 직접적인 접근은 엄청난 계산 비용을 야기하기 때문에, 최근에 기존 색인 기법을 활용한 materialization 방법이 제안되었다. 간단하면서 효과적인 방법은 시공간 조건을 가지는 윈도우 질의를 효율적인 처리하는 MVR-tree에 materialization 방법을 적용하는 것이다. 그러나, MVR-tree는 노드들 사이의 존재하는 원형 경로 때문에, 중간 노드에 미리 계산된 합을 유지하는 것이 불가능하다. 다른 색인 구조들에 기초한 집합적 구조(aggregate structures)는 만족스러운 질의 성능을 제공하지 못 한다. 본 논문에서는 적응적 분할 기법을 사용하는 새로운 색인 기법(Adaptive Partitioned Aggregate R-Tree, APART)과 다양한 환경에서 영역합 질의를 효율적으로 처리하는 질의 처리 알고리즘을 제안한다. 실험 결과는 APART의 성능이 다양한 상황에서 기존의 집합적 색인 기법들보다 2배 이상 우월하다는 것을 보여준다.

새로운 주제 탐지를 통한 지식 구조 갱신에 관한 연구 (A Study on Updating the Knowledge Structure Using New Topic Detection Methods)

  • 김판준;정영미
    • 정보관리학회지
    • /
    • 제22권1호
    • /
    • pp.191-208
    • /
    • 2005
  • 새로운 주제의 탐지를 위한 여러 접근법들을 지식 구조 표현 방법 중 하나인 디스크립터의 부여 및 갱신 과정에 적용하였다. 새로운 주제 탐지는, 특히 특정 학문 분야에서 새로운 주제의 출현 및 성장으로 인하여 지식구조상의 변화가 발생하는 경우에, 기존의 색인어로는 이를 표현할 수 없거나 표현상의 제한이 따르는 문제를 해결하는 데 응용할 수 있다. 실험 결과, 정보학 내에서 긍정적 측면의 변화가 발생한 것으로 식별된 신흥 주제들은 상당수가 서로 밀접하게 연관되어 있으면서 동시에 성장${\cdot}$발전의 단계에 있는 주제임을 확인하였다. 또한, 새로운 주제 탐지를 통한 후보 디스크립터 리스트의 사용이 색인자의 색인작업을 지원하는 효율적인 도구가 될 수 있다는 가능성을 보여 주었다. 특히, 적절한 디스크립터의 선정과 부여를 위한 후보 디스크립터 리스트의 제공은 색인작업의 효율성과 정확성을 향상시키는 데 기여할 수 있을 것이다.

이동 객체 궤적의 색인을 위한 개선된 분할 알고리즘 (An Improved Split Algorithm for Indexing of Moving Object Trajectories)

  • 전현준;박주현;박희숙;조우현
    • 정보처리학회논문지D
    • /
    • 제16D권2호
    • /
    • pp.161-168
    • /
    • 2009
  • 최근 GPS, 이동 전화, 무선 네트워크 등의 발달로 인해 넓은 공간상에서 시간의 흐름에 따라 변화하는 이동 객체에 대한 위치 정보를 수집하여 실생활에 활용하는 다양한 위치 기반 서비스의 사용이 늘어나고 있다. 그와 함께 대용량의 이동 객체를 빠르게 검색하기 위한 효율적인 색인 방법의 필요성이 대두 됨에 따라 관련된 많은 연구가 현재 진행 중이다. 본 논문에서는 이동 객체의 궤적에 대한 색인 과정에서 필요한 개선된 궤적 분할 방법을 제안한다. 궤적의 적절한 분할 위치를 찾아 근사치 영역을 나타내는 최소 경계 사각형(MBR)을 만드는 과정에서 평균적인 질의의 크기를 고려하여 형성되는 확장된 최소 경계 사각형(EMBR)의 영역을 이용한다. 이에 따라 EMBR의 총면적이 최소에 가까운 분할을 만들어내어 색인 구성 후 질의 수행 과정 동안에 불필요한 탐색 공간을 감소시키는 이점을 보이게 된다. 본 논문에서 제안하는 궤적 분할방법의 우수성을 입증하기 위해 최적의 궤적 분할 방법과 기존의 궤적 분할 방법을 구현하여 각각의 EMBR 면적을 비교 분석한다. 비교 결과 제안하는 궤적 분할 방법이 기존의 방법보다 최적의 분할에 더 가까운 EMBR의 총면적을 나타내는 것을 알 수 있었다.

대용량 영구 메모리 기반 실시간 빅데이터 검색 플랫폼 성능 분석 (Performance Analysis of Real-Time Big Data Search Platform Based on High-Capacity Persistent Memory)

  • 이은서;박동철
    • Journal of Platform Technology
    • /
    • 제11권4호
    • /
    • pp.50-61
    • /
    • 2023
  • 다양한 빅데이터 기술의 발전은 많은 산업에 큰 영향을 미치고 있으며, 방대한 양의 데이터를 빠르게 처리하고 분석하기 위해 여러 연구가 진행되고 있다. 이러한 상황에서 인텔 차세대 대용량 영구 메모리 모듈이나 CXL과 같은 새로운 형태의 메모리와 컴퓨팅 기술이 크게 주목받고 있다. 그러나, 현존하는 대부분의 빅데이터 소프트웨어 플랫폼들은 여전히 기존의 전통적인 DRAM 환경을 기반으로 최적화되어 있으며, 특히 빅데이터 실시간 검색 플랫폼 관련 연구는 상대적으로 미흡한 실정이다. 본 연구에서는 차세대 영구 메모리인 인텔 옵테인 영구 메모리의 기본 성능을 평가하고, 옵테인 영구 메모리 기반 시스템에서 빅데이터 실시간 검색 플랫폼으로 유명한 Elasticsearch의 다양한 성능 분석 결과를 통해 대용량 영구 메모리의 효용성과 가능성을 검증한다. 본 논문은 대용량 영구 메모리 기반 시스템이 기존 DRAM 기반 시스템에 비하여 색인과 검색 측면에서 각각 1.45배, 3.2배의 성능 향상을 확인하였고, 이를 통해 고성능 I/O와 대용량, 비휘발성 등의 다양한 이점을 가진 차세대 영구 메모리가 Elasticsearch와 같은 빅데이터 검색 플랫폼에서 좋은 대안이 될 수 있음을 확인하였다.

  • PDF

적응형 스트리밍 서비스를 지원하는 비디오 검색 시스템 (Video Retrieval System supporting Adaptive Streaming Service)

  • 이윤채;전형수;장옥배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권1호
    • /
    • pp.1-12
    • /
    • 2003
  • 최근 인터넷을 이용한 분산처리와 멀티미디어에 대한 연구가 활성화됨에 따라 일반 사용자에 대한 비디오 컨텐츠의 원활한 제공과 편리한 검색방법이 절실히 요구되고 있는 실정이다. 따라서 본 논문에서는 클립단위의 대표프레임 추출로 인한 비디오 인덱싱 정보를 활용함으로써 실시간으로 비디오 검색 시스템을 지원하는 웹 서비스 시스템을 설계 및 구현한다. 구현된 시스템은 비디오 컨텐츠 제공자의 원활한 서비스를 지원하는 내용기반 인덱싱 시스템과 사용자의 다양한 검색을 지원하는 웹 기반 검색 시스템으로 구성되어있다. 기존의 데이타 순차처리 검색시스템과 달리 인덱싱 시스템은 비디오 분할에 의한 대표 프레임 추출과 연관된 정보의 클러스터링에 의한 클립 과일생성 및 클립단위의 비디오 데이타베이스 구축 방법으로 이루어진다. 대표프레임 추출은 프레임 조정방식과 화질 고정방식을 동시에 채택하여 적용함으로써 고화질이 보장되는 전송환경과 느린 회선에서도 끊김없이 안정적인 스트리밍 서비스를 제공받을 수 있도록 한다. 또한 클립단위로 이루어진 비디오 인덱싱 정보의 검색 시스템은 키워드 질의에 의한 검색 방법과 대표 프레임의 2차원 브라우징 방법 및 클립의 내용을 실시간으로 볼 수 있는 방법으로 이루어진다. 결론적으로 본 논문에서 제안한 시스템은 실제 네트워크 환경에서 보다 안정된 스트리밍 서비스를 제공받을 수 있으며, 클립 기반에서 부분적인 비디오 데이타 검색의 편리성을 제공하기 위해 검색 엔진을 범용으로 사용하는 데이타베이스를 이용함으로써 비디오 내용을 쉽게 검색할 수 있도록 해준다.ons), IPSEC(Internet Protocol Security Protocol) 서비스에 추가될 수 있다., tamoxifen(6.3%) 순으로 나타났다. 항에스트로젠제의 생체내 투여는 estrogen 존재 유무에 따라 estrogen 수용체 농도에 agonist 또는 antagonist로 작용하였다. 항에스트로젠제의 단독투여는 progesterone 수용체 생성을 증가시키나, estrogen에 의하여 유도된 progesterone 수용체 생성을 억제하였다. 이상의 결과로 보아, tamoxifen과 LY117018은 estrogen유무에 따라 흰쥐 자궁세포에서 estrogen antagonist로서 뿐만 아니라 agonist로서도 작용함을 알 수 있다. 그러나 estrogen수용체와의 결합능력이 아주 낮은 tamoxifen은, 용량에 비례하여 estrogen수용체에 결합하므로써 작용하는 LY117018과는 다른 기전으로 작용하는 것으로 생각된다.this entire process is pipelined to reduce I/O node contention dynamically. In other words, the design provides support for dynamic contention management. Then we present a software caching method using collective I/O to reduce I/O cost by reusing data already present in the memory of other