• 제목/요약/키워드: content- based retrieval

검색결과 717건 처리시간 0.025초

워드넷을 이용한 문서내에서 단어 사이의 의미적 유사도 측정 (Semantic Similarity Measures Between Words within a Document using WordNet)

  • 강석훈;박종민
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7718-7728
    • /
    • 2015
  • 단어 사이의 의미적 유사성은 많은 분야에 적용 될 수 있다. 예를 들면 컴퓨터 언어학, 인공지능, 정보처리 분야이다. 본 논문에서 우리는 단어 사이의 의미적 유사성을 측정하는 문서 내의 단어 가중치 적용 방법을 제시한다. 이 방법은 워드넷의 간선의 거리와 깊이를 고려한다. 그리고 문서 내의 정보를 기반으로 단어 사이의 의미적 유사성을 구한다. 문서 내의 정보는 단어의 빈도수와 단어의 의미 빈도수를 사용한다. 문서 내에서 단어 마다 단어 빈도수와 의미 빈도수를 통해 각 단어의 가중치를 구한다. 본 방법은 단어 사이의 거리, 깊이, 그리고 문서 내의 단어 가중치 3가지를 혼합한 유사도 측정 방법이다. 실험을 통하여 기존의 다른 방법과 성능을 비교하였다. 그 결과 기존 방법에 대비하여 성능의 향상을 가져왔다. 이를 통해 문서 내에서 단어의 가중치를 문서 마다 구할 수 있다. 단순한 최단거리 기반의 방법들과 깊이를 고려한 기존의 방법들은, 정보에 대한 특성을 제대로 표현하지 못했거나 다른 정보를 제대로 융합하지 못했다. 본 논문에서는 최단거리와 깊이 그리고 문서 내에서 단어의 정보량까지 고려하였고, 성능의 개선을 보였다.

기저 함수의 대칭성을 이용한 저니키 모멘트의 효율적인 계산 방법 (An Efficient Computation Method of Zernike Moments Using Symmetric Properties of the Basis Function)

  • 황선규;김회율
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.563-569
    • /
    • 2004
  • 저니키 모멘트(Zernike moment)는 영상의 표현 능력이 뛰어나기 때문에 객체 인식 또는 내용기반 영상 검색 시스템에서 많이 사용되었으나, 정의식이 복잡하기 때문에 많은 연산량을 필요로 하는 단점이 있다. 저니키 모멘트를 빠르게 계산하는 기존의 방법들은 주로 1차원 실수 방사 다항식을 빠르게 계산하는 방법에 중점을 두었다. 본 논문에서는 저니키 복소 기저 함수의 대칭성을 유도하여 저니키 기저함수를 빠르게 계산하고 입력 영상으로부터 저니키 모멘트를 효율적으로 추출하는 방법을 제안한다. 제안하는 방법은 저니키 기저 함수 계산에 필요한 연산량을 기존 방법의 약 20%로 줄이고, 저니키 모멘트 추출에 필요한 곱셈 연산을 25%로 감소시킨다. 또한, 저니키 모멘트를 특징 벡터로 이용하는 시스템 구현 시 필요한 메모리 요구량도 기존 방법의 25%만을 필요로 한다. 제안하는 방법은 회전 모멘트, 의사 저니키 모멘트, ART(Angular Radial Transform) 등의 계산에도 같은 방식으로 적용될 수 있다.

의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계 (LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services)

  • 김준겸;서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • 현재 다양한 검색엔진들이 사용되고 있다. 검색엔진은 메타태그 정보를 기본으로 크롤링, 색인생성, 검색 결과 출력의 3단계를 거치며, 사용자가 원하는 자료의 검색을 도와준다. 그러나 키워드를 기반으로 검색해서 얻은 방대한 문서가 관련이 없거나 적은 문서일 경우도 많다. 이러한 문제점 때문에 검색 결과에서 내용을 파악하여 정확도를 분류를 해야 하는 번거로운 일이 발생하게 된다. 다양한 검색엔진을 통해 추출된 결과의 경우 검색엔진의 인덱스는 주기적으로 업데이트 되지만 가중치에 대한 기준과 업데이트 주기는 검색엔진마다 다르고 검색 순위 산정 기준이 서로 다르기 때문에 동일한 키워드를 검색어로 입력하고도 서로 다른 검색 순위를 보여주는 단점을 가지고 있다 따라서 본 논문에서는 기존 검색엔진 대신 사용자가 입력한 키워드와 문서의 연관성을 추출하여 사용자가 찾고자 하는 키워드를 입력했을 때 키워드와 문서의 연관성을 향상 시킬 수 있는 LSTM모델을 설계하고자 한다.

  • PDF

PoC Box 단말의 RTSP 운용을 위한 사용자 요구 중심의 효율적인 다중 수신 버퍼링 기법 및 패킷화 방법에 대한 성능 분석에 관한 연구 (A Study of Performance Analysis on Effective Multiple Buffering and Packetizing Method of Multimedia Data for User-Demand Oriented RTSP Based Transmissions Between the PoC Box and a Terminal)

  • 방지웅;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제14권1호
    • /
    • pp.54-75
    • /
    • 2011
  • PoC(Push-to-talk Over Cellular)는 그룹 음성 및 영상 통화와 인터넷, 멀티미디어 서비스를 통합한 단말 기술이다. PoC는 부재, 긴급 상황, 배터리 방전 등과 같은 다양한 이유로 인해 PoC 세션에 참여하지 못하는 사용자에게 종래 MMS 서비스에서의 MM Box와 비슷한 기능을 가진 PoC Box를 사용하는 기능을 제공하고 있다. PoC 표준안에서는 PoC Box에서 PoC 단말로 미디어 전송 시 RTSP (Real-Time Streaming Protocol)를 사용하도록 권장하고 있다. 기존의 RTSP를 적용한 VOD 서비스의 경우는 빠른 유선 네트워크 망을 고려하여 패킷의 크기를 크게 구현하는 반면 PoC 서비스는 무선 통신 환경이기 때문에 이러한 특성을 고려한 RTSP 전송 방법이 필요하다. 무선 통신 환경에서는 패킷의 손실률이 비교적 유선 통신 환경에서보다 다소 높기 때문에 PoC 단말 측에서 미디어 재생 시 화면 끊김 현상, 영상과 음성의 비동기화 발생, 버퍼링 대기 시간 등이 발생한다. 따라서 PoC 단말 측에서의 이러한 문제점은 사용자가 미디어 콘텐츠를 재생하는데 있어 자신이 원하는 정보를 빠르게 습득하기 어렵게 만든다. 본 논문에서는 RTSP를 이용하여 사용자가 미디어 검색 시 단시간 내에 전송되는 미디어에서 효과적으로 중요한 정보를 습득하고 재생 지연 현상을 줄일 수 있는 "교차 이중 수신 버퍼링 기법", "사전 분할 다중 수신 버퍼링 기법", "On-Demand 다중 수신 버퍼링 기법"과 전송 시 미디어 데이터의 패킷화 방법인 "동일 순위 패킷화 전송 방식", "우선 순위 패킷화 전송 방식"을 제안하였고 실험을 통해 그 성능의 적정성 및 우수성을 검증하였다. 실시된 시뮬레이션 성능 평가에서 사용자의 미디어 검색 성향에 따라 제안된 다중 수신 버퍼링 및 패킷화 방식이 기존 단일 수신 버퍼링 방식과 비교하여 효율성 및 우수성 평가에서 6-9점 이상 우수한 결과를 보였다. 그 중 On-Demand 다중 수신 버퍼링 기법은 동일순위 패킷화 방법과 사용될 때 타 기법과 비교하여 3-24점 사이의 우수성을 보임으로써 사용자의 다양한 미디어 검색 성향에 대해 빠르게 대응할 수 있었다. 또한 단시간 내에 사용자가 집중적으로 미디어 검색이 이루어지는 재생 시간대에 대해 많은 미디어 데이터를 수신 받기 때문에 단말 사용자에게 빠른 정보를 제공할 수 있었다.

필터링에 기반한 고차원 색인구조의 동시성 제어기법의 설계 및 구현 (Design and Implementation of High-dimensional Index Structure for the support of Concurrency Control)

  • 이용주;장재우;김학영;김명준
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.1-12
    • /
    • 2003
  • 최근 이미지, 비디오와 같은 멀티미디어 데이터에 대한 효율적인 검색을 위해 많은 다차원 및 고차원 색인 구조들에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 색인 구조의 연구 방향은 검색의 효율을 극대화 하는데 초점을 맞추어 왔으며 최근의 멀티미디어 데이터베이스나 데이터 마이닝 분야와 같은 다수 사용자 환경을 요구하는 환경에서는 부적합한 실정이다. 이에 본 논문에서는 기존의 제시된 차원이 증가하면서 급속하게 성능이 저하되는 문제를 특징 벡터의 시그니쳐를 구성하여 완화시킨 필터링에 기반한 고차원 색인 구조에 동시성 제어기법을 설계 및 구현하여 위스콘신 대학에서 개발한 지속성 객체 저장 시스템인 SHORE 하부저장 시스템과 밀결합 방식으로 통합하였다. 확장된 SHORE 하부저장 시스템은 고차원 데이터에 대한 효율적인 검색 뿐만 아니라 레코드 레벨의 색인 데이터에 대한 동시성 제어를 지원하며 시그니쳐 파일을 모두 메모리에 로딩하는 구조를 개선하여 페이지 레벨의 관리가 가능하다. 아울러 본 논문에서 제시한 확장된 SHOE 하부저장 시스템을 실제 응용 시스템에 적용하기 위해 플랫폼 독립적인 환경을 지원하는 자바 언어를 사용하여 미들웨어 구축 방안을 제시한다. 또한 구축된 미들웨어를 통해 쓰레드 별로 대표적인 내용기반 질의 형태인 포인트질의, 범위질의, k-최근접 질의에 대한 다수 사용자 환경에서의 성능 평가를 수행하였다.

사용자 기기에서 이용한 웹 데이터 분석을 통한 사용자 취향 분석 방법 (An Analysis Method of User Preference by using Web Usage Data in User Device)

  • 이승화;최형기;이은석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.189-199
    • /
    • 2009
  • 최근 인터넷 상에 정보가 방대해지면서 사용자의 요구에 맞는 정보 필터링과 개인화 서비스가 매우 중요해지고 있다. 특히 전자상거래 분야에서 상거래를 활성화시키고 정보 제공자에 대한 만족도와 충성도를 높이기 위해, 사용자의 취향을 기반으로 한 정보 추천은 필수적인 요소가 되었다. 기존 추천 시스템은 사용자의 관심 정보를 기술한 사용자 프로파일을 대부분 정보 제공자 측에서 각각 개별적으로 수집하고 이를 기초로 추천 서비스를 제공한다. 따라서 사용자의 정보는 각 정보 제공자 측에 분산되어 존재하며, 사용자 정보가 부족한 서버에서는 초기에 추천 전략을 세우기 어렵다는 문제가 있다. 또한 사용자정보를 가지고 있는 서버의 경우에도 사용자가 해당 서버를 주기적으로 방문하지 않았다면, 사용자의 동적인 취향 변화를 반영하기 어렵다. 따라서 본 논문에서는 사용자의 행동을 통합적이고, 지속적으로 관찰할 수 있는 사용자 기기에서, 사용자가 이용한 웹 문서 분석을 통해 사용자의 관심 분야를 추론하고, 이를 다른 정보 제공자가 이용하는 새로운 구조의 추천 시스템을 제안한다. 또한 제안 시스템은 보다 효율적인 프로파일 생성을 위해, 웹 페이지에서 식별된 정보 블록에서 관심 단어를 추출하고, 앵커 태그를 분석하여 사용자의 이동 경로를 추적하는 특징을 포함하고 있다. 이러한 제안 시스템의 특징을 통해, 사용자 정보가 부족한 상점에서도 초기에 개인화 서비스 제공이 가능해지며, 사용자가 평소에 이용하는 웹 문서로부터 프로파일을 생성함으로써, 사용자의 동적인 취향 변화를 반영할 수 있다. 또한 정보 블록에서 취향 정보를 추출하는 알고리즘을 통해 보다 빠르고 정확한 프로파일 생성이 가능해진다. 본 논문에서는 최근 구매 활동이 있었던 사용자들의 웹 검색 히스토리와 구매 데이터를 이용하여 제안 시스템의 추천 정확도와 프로파일 분석에 소요되는 시간 측면의 이득을 실험하였으며, 그 결과를 통해 시스템의 유효성을 확인하였다.

R-tree 계열의 인덱싱 구조에서의 효율적 질의 처리를 위한 VP 필터링 (VP Filtering for Efficient Query Processing in R-tree Variants Index Structures)

  • 김병곤;이재호;임해철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.453-463
    • /
    • 2002
  • 정보사회가 인터넷의 보급과 더불어 복잡해짐에 따라 데이타베이스의 흐름은 문자나 숫자와 같은 일차원적인 데이타가 아닌 지리정보, 멀티미디어 데이타와 같은 다차원의 데이타를 저장하고 이에 대한 질의를 처리할 수 있는 시스템을 요구하고 있다 따라서, 다차원적인 특성을 지니는 데이타에 대한 효율적 검색을 위한 다차원 인덱싱 구조에 대한 연구가 활발히 진행되어 왔으며, 그와 동시에 이러한 인덱싱 구조하에서 효율적인 질의 처리를 위한 연구도 병행되고 있다. 다차원 데이타는 그 다양한 응용분야에 따라 요구되는 질의의 형태가 각각 다르므로 이에 대응할 수 있는 알고리즘의 연구가 필요하다. 현재, 많은 다차원 데이타 처리 시스템이 R-트리계열의 인덱싱구조를 근간으로 구성되었으나, 현재까지의 질의처리 기법은 질의처리시에 필터링 특성을 지니지 않으므로, 객체들간의 다차원 거리계산으로 인하여 많은 질의처리 시간을 소요한다. 본 논문에서는 다차원 데이타를 처리하기 위한 R-트리 계열의 다차원 인덱싱 구조에서의 효율적인 질의처리를 위하여 질의처리 대상 객체를 줄이기 위한 필터링 기법을 소개하였다. 필터링을 수행하기 위하여 VP-트리와 MVP-트리에서 사용되었던 VP(Vantage Point)를 이용한다. 먼저, VP 필터링의 개념을 소개하고, VP 필터링을 영역질의와 포인트 질의의 일종인 추가객체요구질의에 각각 적용한 알고리즘을 제시하였다. VP 필터링을 적용하기 위하여 요구되는 삽입 객체와 VP간의 거리계산 시간은 객체의 삽입시 수행되며, 질의 처리를 수행할 때에는 다시 계산되지 않는다. 논문에서는 제안된 알고리즘의 효율성을 실험을 통하여 증명하였다.

나이브베이즈 분류모델과 협업필터링 기반 지능형 학술논문 추천시스템 연구 (A Study of Intelligent Recommendation System based on Naive Bayes Text Classification and Collaborative Filtering)

  • 이상기;이병섭;박병용;황혜경
    • 정보관리연구
    • /
    • 제41권4호
    • /
    • pp.227-249
    • /
    • 2010
  • 정보기술과 인터넷의 발달로 학술정보가 폭발적으로 증가하고 있다. 정보 과잉으로 인해 연구자들은 필요한 정보를 찾거나 필터링하는데 더 많은 시간과 노력을 투입하고 있다. 이용자들이 원하는 정보를 예측하여 관심 가질만한 정보를 선별하여 추천하는 시스템을 전문가시스템, 데이터마이닝, 정보검색 등 다양한 분야에서 오래 전부터 연구하여 왔다. 최근에는 콘텐츠기반추천시스템과 협업필터링을 결합하거나 다른 분야 모델을 접목한 하이브리드 추천시스템으로 발전하고 있다. 본 연구에서는 기존 추천시스템 문제를 해결하고 대규모 정보센터나 도서관에서 학술논문을 효율적이고 지능적으로 추천하기 위해 협업필터링과 나이브베이즈모델을 결합한 새로운 방식의 추천시스템을 제시하였다. 즉, 협업필터링 방식으로 과도한 특성화(Over-specialization) 문제를 해결하고, 나이브베이즈모델을 통해 평가정보나 이용정보가 부족한 신규콘텐츠 추천문제를 해소하였다. 본 모델을 검증하기 위해 한국과학기술정보연구원 NDSL에서 제공하는 식품과 전기 분야 학술논문에 적용하여 실험하였다. 현재 NDSL 이용자 4명에게 피드백을 받은 결과 추천논문에 상당히 만족하는 것으로 나타났다.

하남시 오수발생특성에 대한 연구 (A Study on Sewage Characteristics in Hanam City)

  • 최계운;현지환;이호선
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.1317-1322
    • /
    • 2005
  • 하수관거 설계시나 단지개발사업, 그리고 하수관거정비사업과 같이 오수처리시설의 적정 규모 결정을 위해서는 정확한 상수사용량 및 오수발생량 원단위가 요구되지만 국내의 경우 이러한 원단위에 대한 기초자료 부족과 자료의 신빙성 결여로 인해 적정 원단위를 결정하는데 어려움이 있다. 이러한 관점에서 단지개발이 이루어지는 도시에서는 도시의 규모, 입지조건, 기후조건, 생활양식 등 다양한 요인들이 고려된 오수발생패턴 및 발생량 조사가 필요하며, 조사된 원단위는 오수처리시설의 적정 규모 결정뿐 아니라 침입수/유입수 분석 및 하수관거정비에 대한 성과예측에도 활용될 수 있다. 본 연구에서는 현재 단지개발 및 하수관거정비사업이 진행중인 하남시의 표본이 될 수 있는 대표구역을 선정하고 그 지역에서 조사지역을 세부적으로 분류하여 각 지역별 오수발생특성을 분석하였다. 대상지역인 하남시는 총면적의 $97\%$가 자연녹지 및 생산녹지이며, 나머지 $3\%$는 일반주거지역 및 일반 상업지역으로 나뉜다. 그리고 도시계획상 공장지역으로 편성된 부분이 없어 앞으로도 하남시 대부분의 면적이 녹지와 주거/상업지역으로 구성될 것이다. 이러한 하남시의 특성을 고려하여 조사지역은 공장지역을 제외한 일반주거지역, 밀집주거지역, 영업지역으로 분류하였으며 이렇게 분류된 지역은 각각 오수발생패턴 및 오수농도에 대한 조사를 실시하여 오수발생특성을 분석하였고, 조사지역별 인구수 조사와 연계하여 원단위 자료를 추출하였다. 이렇게 조사된 자료들을 통해 침입수/유입수 분석에 요구되는 오수전환율, 야간생활하수량 비율을 산정하였으며, 차후 단지개발 및 관거정비 후에 발생하는 오수 발생특성과 비교분석을 통하여 하남시 지역의 오수발생특성에 대한 신뢰성 있는 자료로 활용될 것으로 기대된다. RMA2 모형을 이용하여 충주댐에서의 물의 흐름을 해석한 결과 옥순대교$\~$청풍대교 구간 사이에 댐 및 지형적 영향으로 인해 잘 발달된 와류가 하도 전체를 통하여 발생되고 있었고 이는 댐 부유물 정체현상이 나타나는 지점과 잘 일치하고 있었다.정함 후 감마분석에 의하여 구하였다. CF:CS 연령모델을 적용한 결과 깊이에 따른 supported $^{210}Pb$와 퇴적 속도는 0.91cm/year 인 것으로 산정 되었다.RS is a more advanced content-based image retrieval system than other systems which support only concepts or image features.방하는 것이 선계기준에 적합한 것으로 나타났다. 밸브 개폐에 따른 수압 변화를 모의한 결과 밸브 개폐도를 적절히 유지하여 필요수량의 확보 및 누수방지대책에 활용할 수 있을 것으로 판단된다.8R(mm)(r^2=0.84)$로 지수적으로 증가하는 경향을 나타내었다. 유거수량은 토성별로 양토를 1.0으로 기준할 때 사양토가 0.86으로 가장 작았고, 식양토 1.09, 식토 1.15로 평가되어 침투수에 비해 토성별 차이가 크게 나타났다. 이는 토성이 세립질일 수록 유거수의 저항이 작기 때문으로 생각된다. 경사에 따라서는 경사도가 증가할수록 증가하였으며 $10\% 경사일 때를 기준으로 $Ro(mm)=Ro_{10}{\times}0.797{\times}e^{-0.021s(\%)}$로 나타났다.천성 승모판 폐쇄 부전등을 초래하는 심각한 선천성 심질환이다. 그러나 진단 즉시 직접 좌관상동맥-대동맥 이식술로 수술적 교정을 해줌으로써 좋은 성적을 기대할 수 있음을 보여주

  • PDF

문헌정보학 연구논문의 이론체계 현황분석 연구 (Analyzing the status of theoretical framework by subfields in library and information science research articles)

  • 김성진;정동열
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.21-37
    • /
    • 2006
  • 학문의 지식체계를 형성하는데 있어서 하나의 일련과정으로 밀접하게 상호연관된 이론개발 및 이론활용 연구가 뒷받침되어야 한다는 전제 하에, 본 연구는 문헌정보학 연구논문의 이론개발 및 이론활용 사례의 양적/질적 측면을 조사함으로써 문헌정보학의 이론적 기반을 분석하고자 하였다. 특히, 본 연구는 세부주제영역에 따른 이론개발 및 이론활용 연구의 특성에 주목함으로써 문헌정보학의 이론적 기반 형성에 기여한 세부주제영역을 보다 구체적으로 파악하고자 하였다. 이를 위해 1984년부터 2003년에 출판된 1,661편의 연구논문을 대상으로 내용분석을 실시하였다. 분석결과, 22개의 세부주제영역 중에서 정보이용탐색, 정보검색, 도서관경영, 학술커뮤니케이션 영역이 이론개발과 이론활용의 모든 측면에 가장 큰 기여를 한것으로 나타났다. 또한 주제영역별로 생산된 논문 수에 따른 이론적 연구의 비율을 살펴보았을 때, 계량정보학과 전문직 영역에 대한 연구가 매우 이론적인 특성을 보였다. 이 외에 각 세부주제영역별로 사용된 이론을 분석하였을 때, 일부 세부주제영역 간에 유사한 이론적 기반을 공유하고 있는 것으로 나타났다.