• Title/Summary/Keyword: 인덱싱

Search Result 448, Processing Time 0.033 seconds

Construction and Performance Evaluation of Standard System for Medical Big Data (의료 빅데이터를 위한 표준화 시스템 구축 및 성능평가)

  • Kim, Seung-Jin;Jeong, Chang-Won;No, Si-Hyeong;Kim, Ji-Eon;Kim, Tae-Hoon;Jun, Hong Yong;Lee, Yun Oh;Yoon, Kwon-Ha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.275-276
    • /
    • 2018
  • 본 논문에서는 원광대학교병원 의료정보시스템의 임상데이터를 OHDSI 가 제안하는 공통데이터 모델로 변환하여 표준화 시스템 구축에 대해서 기술한다. 또한, 검색속도 향상을 위해 인덱싱 기법을 적용한 성능평가 결과를 보인다. 구축된 표준화 시스템은 다양한 임상연구에 활용될 것을 기대하고 있다.

Design and Implementation of Keywords Extraction System from CQI Reports by the Analysis of Graph Centrality (그래프 중심성 분석에 의한 CQI 보고서 핵심어 추출 시스템의 설계 및 개발)

  • Pheaktra, They;Lim, JongBeom;Lee, JongHyuk;Gil, Joon-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.256-259
    • /
    • 2019
  • 최근 대학교는 CQI(Continuous Quality Improvement) 등의 방대한 교육 관련 데이터를 수집하고 있고 이를 분석하여 교육 및 경영에 활용하고 있다. 핵심어는 텍스트의 내용을 간결하게 표현할 수 있는 단어이다. 그래서 CQI 보고서의 의미를 파악하기 위해서는 먼저 핵심어 추출이 필요하다. CQI 보고서에서 핵심어를 추출하면 이후 정보 검색, 인덱싱, 분류, 클러스터링, 필터링 등과 같은 많은 응용 작업을 용이하게 수행할 수 있다. 따라서 방대한 양의 CQI 보고서로부터 핵심어 추출을 자동화한다면 이후 요약 및 의미 파악에 많은 도움이 될 것이다. 이 논문에서는 CQI 보고서 요약을 위해 자동적으로 핵심어를 추출하는 방법을 제안한다.

An Efficient Text Location using Mean Shift Algorithm (Mean Shift 알고리즘을 이용한 효율적인 문자 추출)

  • Jung, Kee-Chul;Kim, Kwang-In;Han, Jung-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.123-126
    • /
    • 2001
  • 영상내의 문자 정보는 색인에 필요한 유용한 정보를 제공하므로, 이를 이용한 멀티미디어 데이터의 인덱싱기법이 최근 많이 연구되고 있다. 본 논문은 mean shift 알고리즘을 이용한 텍스춰 기반의 문자 영역 추출 방법을 제안한다. 다양한 크기와 모양의 문자에 적응성을 가지는 필터를 만들기 위해 신경망을 이용한다. 문자 영역의 위치와 크기는 문자 확률 영상상에서 mean shift 알고리즘을 이용하여, 국소 탐색만으로 별도의 후처리 과정 없이 기존의 문자 추출 방법보다 우수한 성능을 보인다.

  • PDF

Implementation of Retrieval System for Multi-Objects using Invariant Moments (불변 모멘트를 이용한 다중객체 검색시스템 구현)

  • Ahn, Kwang-Il;Song, Young-Jun;Han, Jae-Hyeck;Ahn, Jae-Hyeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.864-867
    • /
    • 2000
  • 영상과 같은 다양하고 복잡한 데이터 검색은 기존의 키워드를 이용한 검색이 아닌 내용 기반 검색 방법이 요구된다. 본 논문에서는 입력된 사용자 질의를 객체의 위치이동이나 회전, 크기변화에 민감하지 않은 불변모멘트(Invariant Moments)값을 이용하여 효율적으로 검색할 수 있는 시스템을 구현하였다. 영상내의 단일 객체 뿐만 아니라 다중 객체들도 효과적으로 검출하기 위해 레이블링(Labeling) 알고리즘을 적용해 각각의 객체를 따로 분리하여 불변모멘트를 적용하는 방법을 이용했다. 또한, 검색 시간 단축 및 영상의 효율적인 인덱싱(Indexing)을 위해 해싱을 응용한 기법을 적용하였다. 이로써, 기존의 전체 영상의 특징을 가지고 정확히 표현할 수 없는 객체들을 정확히 표현해 줌으로서 좀더 정확한 검색 결과를 얻을 수 있었다.

  • PDF

A Study Video using Image and Voice Search (음성과 이미지를 이용한 동영상 검색에 관한 연구)

  • Sin, In-Gyeong;Park, Sung-Hyun;Ahn, Hyo-Chang;Rhee, Sang-Burm
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.568-571
    • /
    • 2012
  • 정보화 사회의 정보 기반 구조로서, 고속 정보망의 구축, 개인용 컴퓨터의 급속한 보급, 멀티미디어 기술의 발전 등으로 인하여 정보 서비스의 새로운 장이 열리고 있다. 동영상 데이터는 텍스트만이 아니라 영상정보, 음성정보등 각종 의미있는 다양한 멀티미디어 정보를 포함하고 있다. 본 논문에서는 동영상에서 음성과 영상을 분리하여 음성을 이용하여 음성열을 분할 및 복원하여 음성을 텍스트로 변환하여 텍스트색인파일을 만들고 영상은 이미지를 분할 및 히스토그램을 사용하여 이미지 샷을 검출하여 두 색인파일을 이용하여 인덱싱을 하여 동영상 검색에 활용한다.

Linked Data Indexing System for Big Data Processing on the Cloud System (빅데이터 활용을 위한 클라우드 기반의 링크드 데이터 인덱싱 시스템)

  • Lee, Mina;Jung, Jinuk;Kim, Eung-hee;Kim, Hong-gee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1596-1598
    • /
    • 2013
  • 2000년대 초반 등장한 시맨틱 웹 기술은 최근 재조명을 받고 있다. 이는 초기에 구축된 시맨틱 데이터와 최근에 구축하는 시맨틱 데이터의 양적 비교를 통해서도 알 수 있다. 그러나 기존의 시맨틱웹 기술은 대용량 데이터를 처리하는데 어려움이 많아, 이를 처리하기 위한 기술이 중요한 문제로 대두되고 있다. 본 논문에서는 앞에서 말한 바와 같이, 기존 RDF Repository의 대안으로, 다양한 데이터 베이스를 복합적으로 사용하였다. RDF 데이터를 효율적으로 처리하기 위해, NoSQL DB와 메모리 기반 관계형 DB를 활용하여 시스템을 구성하였다. 또한, 사용자가 이에 대한 별도의 지식 없이 기존의 SPARQL 질의를 그대로 사용하여, 원하는 결과를 얻을 수 있는 시스템을 제안한다.

A New Keyword Search Algorithm for RDF/S and OWL Documents (RDF/S 및 OWL 문서에 대한 키워드 검색 알고리즘)

  • Kim, Hak Soo;Son, Jin Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.321-324
    • /
    • 2009
  • XML 또는 RDBMS 에서의 키워드 검색은 기존의 정보 검색처럼 데이터의 구조 또는 질의 언어에 대한 사전 지식 없이 질의 처리를 수행하는 연구 분야 중의 하나이다. 오늘날 키워드 검색을 효율적으로 처리하기 위해 제안된 연구들은 그래프 기반의 질의 처리에 기반한 기법들에 초점을 두고 있다. 이러한 접근들은 XML 또는 RDBMS 안에 존재하는 데이터를 그래프 구조에 기반한 데이터로 변환한 다음에 그래프 탐색을 통해서 모든 질의 키워드를 포함하는 결과들을 찾는다. 그러나 기존의 기법들을 RDF/S 또는 OWL 문서와 같은 복잡한 그래프 구조에 적용하기에는 질의 성능 측면에서 많은 문제점을 가지고 있다. 또한, 온톨로지 언어의 의미적 단위로서의 RDF 트리플을 고려하지 않기 때문에 질의 결과에 대한 신뢰성을 보장할 수 없다. 이러한 관점에서 본 논문은 RDF/S 또는 OWL 저장소에서 효율적이고 의미적인 키워드 검색을 위한 인덱싱 기법 및 알고리즘을 설계한다.

An Improved Indexing Method for Query Processing of Dataspaces (데이터스페이스의 질의 처리를 위한 향상된 인덱싱 기법)

  • Huang, Xuguang;Lee, Dong-Wook;Shin, Soong-Sun;Baek, Sung-Ha;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.317-320
    • /
    • 2009
  • Dataspaces are the collections of heterogeneous and partially unstructured data. It is difficult for the users to explore the data from varies data sources using a single schema. And the queries supposed should be allowed to specify varying degrees of structure, spanning keyword queries to more structure-aware queries. Utilizing give the model of heterogeneous data and the definitions of two mainly types of query on dataspaces, in this paper we propose an improved method which can suppose the flexibly query more efficiently.

Optimization of Luminance Area based Image Identifier (휘도 영역 기반 정지영상 인식자 최적화)

  • Kim, Sung-Min;Park, Je-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.407-409
    • /
    • 2011
  • 멀티미디어 데이터베이스에서 특정 정지영상의 연관성을 설정하기 위해 임의적인 인식자를 사용하는 것은 인식자의 분실 시 원래 사용하였던 값을 복구할 수 없다는 단점을 가지고 있다. 따라서, 정지영상의 내부 속성을 이용한 인식자를 데이터베이스의 인덱싱에 적용하여 이 문제를 해결할 수 있다. 정지영상 인식자 생성을 위해 정지영상 전체를 대상으로 알고리즘을 적용하면 정지영상의 크기에 따라 알고리즘의 수행 시간이 증가 하게 된다. 이를 최적화하기 위해서는 정지영상 전체 데이터를 필요로 하지 않고, 특징적인 부분만을 고려하는 알고리즘이 필요하다. 본 논문에서는 휘도 영역을 이용한 정지영상 인식자 생성 알고리즘을 최적화하고, 그에 따른 검증을 예시한다.

Performance Comparison and Analysis of Embedding methods based on Clustering Algorithms (클러스터링 알고리즘 기반의 임베딩 기법 성능 비교 및 분석)

  • Park, Jungmin;Park, Heemin;Yang, Seona;Sun, Yuxiang;Lee, Yongju
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.164-167
    • /
    • 2021
  • 최근 구글, 아마존, LOD 등을 중심으로 지식 그래프(Knowledge graph)와 같은 검색 고도화 연구가 활발히 수행되고 있다.그러나 대규모 지식 그래프 인덱싱 시스템에서 데이터가 어떻게 임베딩(embedding)되고, 딥러닝(deep learning) 되는지는 상대적으로 거의 연구가 되지 않고 있다. 이에 본 논문에서는 임베딩 모델에 대한 성능평가를 통해 데이터셋에 대해 어떤 모델이 가장 좋은 지식 임베딩 방법을 도출하는지 분석한다.

  • PDF