• 제목/요약/키워드: content retrieval

검색결과 800건 처리시간 0.035초

이용자 중심 정보시스템: STEM 분야 중심으로 (User-oriented Information System: Focusing on STEM Field)

  • 박민수
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.249-253
    • /
    • 2020
  • 과학기술(STEM: Science, Technology, Engineering, and Medicine) 정보를 효과적으로 제공하기 위해서는 정보이용자의 정보요구 분석 및 정보이용 행태에 대한 이해가 선행되어야 한다. 정보통신 기술과 환경의 급격한 변화와 발전으로 이용자의 정보이용 환경에도 많은 영향을 미치고 있다. 이용자의 정보이용 변화와 특성, 이들의 정보요구 분석을 토대로 적극적인 과학기술정보서비스시스템의 설계 및 개선이 필요하다. 본 연구를 위하여 과학기술정보 이용자를 대상으로 유의할당추출을 통해 4개의 주요 콘텐츠별 (논문, 보고서, 동향, 특허)로 204명씩, 총 816이 참여하였다. 각 콘텐츠별(논문, 보고서, 동향, 특허) 이용자를 대상으로 온라인 설문조사를 통한 정량적 방법을 활용하여 과학기술정보 이용 실태 파악을 위한 조사를 실시하였다. 분석 결과를 토대로 STEM 분야 정보시스템 개선사항을 위한 시사점을 도출하였다.

웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법 (Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web)

  • 김덕환;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.464-475
    • /
    • 2003
  • 웹상의 이미지 데이타베이스들은 자치성과 이질성이라는 두 가지 다른 특성을 갖고 있다. 즉 독립적으로 만들어지고 유지되며 질의 처리 방법이 서로 다르다. 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서, 메타 서버의 유사성 측정함수에 대하여 서로 다른 지역 유사성 측정 함수를 갖는 데이터베이스들로부터 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것은 중요하다. 현재까지, 동일한 유사성 측정 함수들을 사용하는 이미지 데이타베이스들을 선택하는 방법에 대하여 많은 연구가 진행되었으나 이미지 데이타베이스들이 다른 유사성 측정함수를 사용하는 경우에 대한 연구는 없었다. 본 논문에서는 웹상의 많은 이질적인 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 찾는 문제를 다룬다. 데이타베이스들의 순위는 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 구형 영역 질의에 대한 선택률을 추정하기 위하여 히스토그램 정보를 사용하며, 유사성 측정 함수의 차이로 인한 선택률 오차를 보정하기 위하여 표본 객체들을 이용한다. 많은 수의 이미지 데이타에 대한 상세한 실험은 제안된 방법이 이질적인 분산 환경에서 효율적임을 보여준다.

워드넷을 이용한 문서내에서 단어 사이의 의미적 유사도 측정 (Semantic Similarity Measures Between Words within a Document using WordNet)

  • 강석훈;박종민
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7718-7728
    • /
    • 2015
  • 단어 사이의 의미적 유사성은 많은 분야에 적용 될 수 있다. 예를 들면 컴퓨터 언어학, 인공지능, 정보처리 분야이다. 본 논문에서 우리는 단어 사이의 의미적 유사성을 측정하는 문서 내의 단어 가중치 적용 방법을 제시한다. 이 방법은 워드넷의 간선의 거리와 깊이를 고려한다. 그리고 문서 내의 정보를 기반으로 단어 사이의 의미적 유사성을 구한다. 문서 내의 정보는 단어의 빈도수와 단어의 의미 빈도수를 사용한다. 문서 내에서 단어 마다 단어 빈도수와 의미 빈도수를 통해 각 단어의 가중치를 구한다. 본 방법은 단어 사이의 거리, 깊이, 그리고 문서 내의 단어 가중치 3가지를 혼합한 유사도 측정 방법이다. 실험을 통하여 기존의 다른 방법과 성능을 비교하였다. 그 결과 기존 방법에 대비하여 성능의 향상을 가져왔다. 이를 통해 문서 내에서 단어의 가중치를 문서 마다 구할 수 있다. 단순한 최단거리 기반의 방법들과 깊이를 고려한 기존의 방법들은, 정보에 대한 특성을 제대로 표현하지 못했거나 다른 정보를 제대로 융합하지 못했다. 본 논문에서는 최단거리와 깊이 그리고 문서 내에서 단어의 정보량까지 고려하였고, 성능의 개선을 보였다.

XML 태그를 분류에 따른 가중치 결정 (An XML Tag Indexing Method Using on Lexical Similarity)

  • 정혜진;김용성
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.71-78
    • /
    • 2009
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

기저 함수의 대칭성을 이용한 저니키 모멘트의 효율적인 계산 방법 (An Efficient Computation Method of Zernike Moments Using Symmetric Properties of the Basis Function)

  • 황선규;김회율
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.563-569
    • /
    • 2004
  • 저니키 모멘트(Zernike moment)는 영상의 표현 능력이 뛰어나기 때문에 객체 인식 또는 내용기반 영상 검색 시스템에서 많이 사용되었으나, 정의식이 복잡하기 때문에 많은 연산량을 필요로 하는 단점이 있다. 저니키 모멘트를 빠르게 계산하는 기존의 방법들은 주로 1차원 실수 방사 다항식을 빠르게 계산하는 방법에 중점을 두었다. 본 논문에서는 저니키 복소 기저 함수의 대칭성을 유도하여 저니키 기저함수를 빠르게 계산하고 입력 영상으로부터 저니키 모멘트를 효율적으로 추출하는 방법을 제안한다. 제안하는 방법은 저니키 기저 함수 계산에 필요한 연산량을 기존 방법의 약 20%로 줄이고, 저니키 모멘트 추출에 필요한 곱셈 연산을 25%로 감소시킨다. 또한, 저니키 모멘트를 특징 벡터로 이용하는 시스템 구현 시 필요한 메모리 요구량도 기존 방법의 25%만을 필요로 한다. 제안하는 방법은 회전 모멘트, 의사 저니키 모멘트, ART(Angular Radial Transform) 등의 계산에도 같은 방식으로 적용될 수 있다.

의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계 (LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services)

  • 김준겸;서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • 현재 다양한 검색엔진들이 사용되고 있다. 검색엔진은 메타태그 정보를 기본으로 크롤링, 색인생성, 검색 결과 출력의 3단계를 거치며, 사용자가 원하는 자료의 검색을 도와준다. 그러나 키워드를 기반으로 검색해서 얻은 방대한 문서가 관련이 없거나 적은 문서일 경우도 많다. 이러한 문제점 때문에 검색 결과에서 내용을 파악하여 정확도를 분류를 해야 하는 번거로운 일이 발생하게 된다. 다양한 검색엔진을 통해 추출된 결과의 경우 검색엔진의 인덱스는 주기적으로 업데이트 되지만 가중치에 대한 기준과 업데이트 주기는 검색엔진마다 다르고 검색 순위 산정 기준이 서로 다르기 때문에 동일한 키워드를 검색어로 입력하고도 서로 다른 검색 순위를 보여주는 단점을 가지고 있다 따라서 본 논문에서는 기존 검색엔진 대신 사용자가 입력한 키워드와 문서의 연관성을 추출하여 사용자가 찾고자 하는 키워드를 입력했을 때 키워드와 문서의 연관성을 향상 시킬 수 있는 LSTM모델을 설계하고자 한다.

  • PDF

근대 한국기독교 자료의 디지털 아카이브 시스템 구축에 관한 연구 (A Study on Constructing a Digital Archive System of the Modern Korean Christian Collections)

  • 양지안
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.681-691
    • /
    • 2022
  • 본 연구는 우리나라 개화기 이후 해방될 때까지 근대 시기에 발행된 한국기독교 관련 자료를 다수 소장하고 있는 S대학교 한국기독교박물관의 자료목록을 분석하여 이를 대상으로 디지털 아카이브 시스템을 구축하는데 목적이 있다. 한국 근대 시기의 기독교자료에 관한 디지털 아카이브 시스템 구축을 위해 대상 자료에 대한 색인과 메타데이터를 형식에 맞게 작성하였다. 선별된 자료를 디지털화한 후, 메타데이터 정보를 이용하여 데이터베이스를 구축하였고, 실제 시스템은 웹 표준 기반의 관리시스템과 이용자서비스시스템으로 나누어 구축하였다. 디지털 아카이브의 원활한 이용을 위해 내용기반의 검색시스템을 구축하였으며, 한 글자 단위의 검색결과 매칭값을 제공하고 검색어 자동완성 기능을 구현함으로써 이용자의 편의성을 제고하였다. 이를 통해 원문접근이 어려운 박물관 자료를 손쉽게 이용할 수 있도록 디지털화하여 제공함으로써 인문학 콘텐츠의 장기적 발전의 토대를 마련하여 연구자 및 대중들의 자료 접근성 및 활용성을 제고할 수 있는 기반을 마련하였다.

교육용 비디오의 ToC 자동 생성 방법 (A Method of Generating Table-of-Contents for Educational Video)

  • 이광국;강정원;김재곤;김회율
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.28-41
    • /
    • 2006
  • 양방향 맞춤형 방송의 실현으로 인해 비디오의 내용을 자동으로 분석하여 그 구조를 기술하거나 요약을 생성하는 등의 내용 기반 비디오 분석 기술의 필요성이 요구되고 있다. 본 논문에서는 온라인에서 수요가 높고 특히 맞춤형 방송에 적합한 방송 콘텐츠인 교육용 비디오의 ToC를 자동으로 생성하기 위한 방법을 제안한다. 제안한 ToC 생성 방법은 씬 분할과 씬 서술의 두 단계로 이루어져 있다. 씬 분할 단계에서는 삿 분할을 수행한 후 샷 간의 연결관계 분석을 통해 입력 영상을 씬 단위로 분할하게 된다. 씬 서술 단계에서는 분할된 각 씬이 장면 분류, 자막 검출, 화자 인식 등에 의해 그 내용이 자동으로 서술된다. 제안된 방법을 통해 생성된 ToC는 씬과 샷의 계층 구조를 통해 비디오의 구성을 표현하고, 검출된 여러 특정을 이용해 각 씬과 샷의 내용을 서술함으로써 사용자가 비디오의 내용을 한눈에 알아볼 수 있고 원하는 내용에 손쉽게 접근할 수 있도록 도와줄 수 있다. 또 보다 상세한 ToC가 요구되는 경우에는 유용한 정보들이 포함되어 있는 초기 형태의 ToC로써 이용되어 수작업에 의한 ToC 생성에 필요한 시간을 효과적으로 줄이는 것이 가능하다. 실험을 통해 제안한 방법으로 여러 개의 교육용 비디오에서 ToC를 효과적으로 생성될 수 있음을 확인하였다.

이용자 관점에서 본 이미지 색인의 객관성에 대한 연구 (An Investigation of the Objectiveness of Image Indexing from Users' Perspectives)

  • 이지연
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.123-143
    • /
    • 2002
  • 이미지 색인은 이미지 정보로의 접근에 핵심적인 역할을 수행하는 부분으로 다양한 이미지 색인 방법 및 시스템이 이미지 정보의 종류에 따라 소개되어 왔다. 이미지 색인은 Panofsky의 정보의 단계별 색인에서 출발하여 시소러스, 분류체계, 이미지 기술요소, 범주화 방식 등을 이용하는 방식으로 발전하여 왔다. 이 연구는 Panofsky의 이미지 정보 중 이차 이미지 정보의 색인(iconographical analysis of image information)에 있어 이용자들을 대상으로 하여 그 객관성을 측정하고, 색인의 객관성과 관련된 이미지 기술요소들을 밝혀내고자 하였다. 이미지 속의 인물이나 물체 등 사실적이고 정형화된 일차 이미지 정보와는 대조적으로, 보다 주관적이고 해석적인 이차 이미지 정보의 예로 감정정보를 택하여 48명의 이용자들을 대상으로 2차에 걸친 실험을 하였다. 1차 실험에서는 같은 이미지 안에서 각각의 이용자들이 읽어내는 감정정보의 일치도를 측정하였고 2차 실험에서는 이용자들이 이미지 탐색 과정 중 검색된 이미지에 부여된 색인어에 대한 동의 정도를 통하여 색인의 객관성을 측정하였다. 1차와 2차 실험 결과는 이용자들이 같은 이미지에 대하여 다양한 해석을 내리고 있으며 주관적인 해석이나 개인차가 이차 이미지 정보의 색인에 영향을 미치는 요소로 작용하고 있음을 보여 주었다. 이 연구의 결과는 이차 이미지 정보에 대한 이용자들의 주관적인 반응을 수렴할 수 있는 색인 시스템이나 탐색기법에 대한 계속적인 연구 및 개발의 필요성을 강조하고 있다.

장면의 유사도 패턴 비교를 이용한 내용기반 동영상 분할 알고리즘 (Content based Video Segmentation Algorithm using Comparison of Pattern Similarity)

  • 원인수;조주희;나상일;진주경;정재협;정동석
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1252-1261
    • /
    • 2011
  • 본 논문은 내용기반 동영상 분할을 위한 장면의 유사도 패턴 비교 방법을 제안한다. 동영상 장면 전환의 종류는 크게 급진적 전환과 디졸브(dissolve), 페이드인(fade-in), 페이드아웃(fade-out), 와이프 전환(wipe transition)을 포함하는 점진적 전환 형태로 나눌 수 있다. 제안하는 방법은 모든 종류의 장면 전환 검출 문제를 단지 발생 유무의 문제로 간단 정의하고, 장면 전환 종류는 별도로 구분하지 않는다. 장면 전환을 검출하기 위해서는 프레임간의 유사도를 정의해야 한다. 본 논문에서는 장면 내 유사도(within similarity)와 장면 간 유사도(between similarity)를 정의하며 두 유사도의 통계적 패턴 비교를 통하여 최종적으로 장면 전환을 검출하게 된다. 장면 내 유사도와 장면 간 유사도의 비율을 구하는 방법을 통해 플래시라이트나영상 내 물체 움직임에 대한 거짓 양성 검출을 별도의 후처리 과정 없이도 방지할 수 있음을 확인하였다. 프레임의 특징 값으로는 컬러 히스토그램과 프레임 내 평균 화소값을 이용하였다. TREC-2001, TREC-2002 동영상 셋을 포함한 실험 셋에서 성능을 평가한 결과 제안하는 알고리즘의 경우 총 91.84%의 재현율(recall)과 86.43%의 정확도(precision)의 성능을 보임을 확인할 수 있었다.