• Title/Summary/Keyword: Information Retrieval System

Search Result 1,850, Processing Time 0.034 seconds

온라인 문서 군집화에서 군집 수 결정 방법 (Determining the number of Clusters in On-Line Document Clustering Algorithm)

  • 지태창;이현진;이일병
    • 정보처리학회논문지B
    • /
    • 제14B권7호
    • /
    • pp.513-522
    • /
    • 2007
  • 군집화는 주어진 데이터를 분할하여 데이터 속에 숨겨져 있는 의미를 자동으로 발견하는 방법으로, 사람이 일일이 살펴보기 어려운 데이터를 분석해서 비슷한 성향을 가진 데이터들끼리 모은 여러 개의 군집들을 만들어 낸다. 온라인 문서 군집화는 검색 엔진을 통해 검색된 문서들을 대상으로 군집화를 실행하여 유사한 특성의 문서들을 묶어서 보여줌으로써 사용자의 검색 환경의 편의성을 증진시키는 것이 목적이다. 문서군집화는 사람의 개입이 없이 자동으로 이루어져야 하고, 군집화 결과에 영향을 미치는 군집의 개수 선정도 자동으로 이루어져야 한다. 또한, 온라인 시스템에서는 빠른 응답 시간을 보장하는 것이 중요하다. 본 논문에서는 기하학적인 정보를 이용하여 군집의 수를 결정하는 방법을 제안한다. 제안하는 방법은 군집의 중심을 저차원 평면에 사상하는 것과 사상된 군집 중심의 거리 정보를 이용하여 군집들을 병합하는 두 단계로 이루어져 있다. 제안하는 방법을 실데이터에 적용하여 실험한 결과 군집화 성능이 향상되고, 처리 시간도 온라인 환경에 적합한 것을 확인 할 수 있었다.

공간 네트워크 상의 이동객체를 위한 시그니처 기반의 궤적 색인구조 (Trajectory Index Structure based on Signatures for Moving Objects on a Spatial Network)

  • 김영진;김영창;장재우;심춘보
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권3호
    • /
    • pp.1-18
    • /
    • 2008
  • 공간 네트워크 상을 움직이는 많은 이동객체들의 궤적 분석을 통해서 많은 정보를 얻을 수 있다. 이를 위해서, 궤적을 효과적으로 검색 할 수 있는 궤적 기반 색인 구조가 필요하다. 하지만 도로와 같은 공간 네트워크상의 궤적 기반 색인 구조에 대한 연구는 FNR-트리나 MON-트리를 제외하고는 연구가 많이 부족한 실정이다. 또한, FNR-트리나 MON-트리는 에지를 지난 이동객체의 이동정보인 세그먼트만을 저장할 뿐 전체 궤적을 유지하지 못하며, 궤적 질의에 대해 비효율적이다. 따라서 본 논문에서는 공간 네트워크상의 이동객체를 위한 시그니처 기반의 궤적 색인 구조인 SigMO-트리를 제안한다. 이를 위해, 이동객체를 공간과 시간 특성으로 분류하고, 전체 궤적을 유지함으로써 영역질의와 궤적질의를 동시에 처리할 수 있는 색인 구조를 설계한다. 아울러, 사용자 질의를 시공간영역 내 궤적 질의, 시간영역 내 유사궤적 질의로 분류하고, 이들을 처리 하기 위한 질의 처리 알고리즘을 제안한다. 각 질의처리 알고리즘은 효율적인 검색을 위하여 시그니처 파일 기법을 이용하여 궤적을 검색한다. 마지막으로 성능평가를 통해 본 논문에서 제안한 궤적 기반 색인 구조가 기존의 색인구조인 FNR-트리, MON-트리보다 성능이 우수함을 보인다.

  • PDF

분산 모바일 멀티에이전트 플랫폼을 이용한 사용자 기반 디지털 라이브러리 구축 (A Personal Digital Library on a Distributed Mobile Multiagents Platform)

  • 조영임
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권12호
    • /
    • pp.1637-1648
    • /
    • 2004
  • 분산 환경에서 디지털 라이브러리 구축시 기존의 단일 에이전트를 이용한 클라이언트/서버 방식으로 시스템을 구축할 경우, 일차원적인 자료검색으로 인해 검색결과의 관련성이 없고, 검색 견과에 대한 사용자의 성향이 반영되지 않으며, 클라이언트가 서버에 접속할 때마다 인증을 받아야 하므로 다수의 서버 접근시 문서 처리 효율이 낮고 사용하기 불편하다는 문제점을 갖는다. 따라서 본 논문에서는 이의 해결을 위해 기존의 멀티 에이전트 플랫폼인 DECAF와 표준안으로 제시되는 모바일 ORB인 Voyager를 응용해 새로운 모바일 환경에 적합한 멀티 에이전트 플랫폼을 개발 제안하였고, 이를 이용한 사용자 기반의 디지털 라이브러리 시스템(PDS)을 구축하였다. 이러한 접근방법은 국내외적으로 처음 시도되는 연구이다. 새로운 플렛폼은 관련정보의 검색문제를 위해 신경회로망을 이용한 문서분류를 통해 관련 문서의 검색을 세분화시킴으로써 검색결과의 관련성을 높였고. 사용자 성향을 반영하기 위해 모듈화된 클라이언트를 구성하여 신경회로망을 이용함으로써 사용자의 성장과 탐색 결과를 최적화 시켰으며, 네트워크 문제를 위해 멀티에이전트 플랫폼과 모바일 클래스를 이용한 모바일 기능을 개발하였다. 또한 모바일 시스템과 멀티에이전트 시스템을 적절히 결합하고 멀티 에이전트 사이의 협상 알고리즘과 스케줄링 방법을 개발함으로써 제안한 플랫폼이 효율적으로 동작하도록 구성하였다. 시뮬레이션한 결과, 분산환경에서 모바일 서버의 개수와 에이전트의 개수가 늘어날수록 PDS는 기존의 디지털 라이브러리보다는 탐색시간이 훨씬 줄어들었고 결과에 대한 사용자 만족도도 기존 C/S 방식에 비해 약 4배정도 향상됨을 알 수 있었다

안드로이드 기반의 모바일 방송 EPG 연구 (Android-based mobile broadcast EPG study)

  • 방진숙;채정식;진두석;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.609-611
    • /
    • 2010
  • IPTV(Internet Protocol Television)가 상용화되고 있는 시점에서 수많은 채널과 방송 콘텐츠가 기하급수적으로 늘어나고 있고, 많은 사람들이 이동 단말기를 통해 IPTV를 언제 어디서나 사용하려는 요구가 증가할 것이다. 수많은 채널의 정보를 수집하기 위한 EPG(Electronic Program Guide) 서비스를 IP(Internet Protoco) 통신을 이용하여 방송 콘텐츠의 빠른 검색을 위한 EPG 서비스를 활용하는 시점에 있다. 현재 유선망을 이용한 IPTV를 안드로이드 기반의 모바일 환경에서도 EPG 서비스를 활용할 수 있는 환경을 제공하기 위한 연구가 진행되고 있고, 국내 디지털 방송의 표준이 유럽의 DVB-MHP 표준안을 따르고 있는 만큼 EPG 서비스도 그에 따른 연구 및 개발이 필요하다. 본 연구에서는 기존의 유선망을 이용한 IPTV의 채널 EPG 서비스 정보를 모바일 환경에서 사용자 중심의 채널 EPG 서비스 정보를 최대한 제공하여 사용자가 콘텐츠에 손쉽고 빠르게 검색할 수 있는 환경을 제공하고자 하며, 안드로이드 기반의 모바일 환경에서 IPTV의 채널 EPG 서비스를 활용하기 위해 방송 채널을 사용자 입장에서 EPG 서비스 정보를 수집하는 검색 시스템을 제안한다.

  • PDF

필터링에 기반한 고차원 색인구조의 동시성 제어기법의 설계 및 구현 (Design and Implementation of High-dimensional Index Structure for the support of Concurrency Control)

  • 이용주;장재우;김학영;김명준
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.1-12
    • /
    • 2003
  • 최근 이미지, 비디오와 같은 멀티미디어 데이터에 대한 효율적인 검색을 위해 많은 다차원 및 고차원 색인 구조들에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 색인 구조의 연구 방향은 검색의 효율을 극대화 하는데 초점을 맞추어 왔으며 최근의 멀티미디어 데이터베이스나 데이터 마이닝 분야와 같은 다수 사용자 환경을 요구하는 환경에서는 부적합한 실정이다. 이에 본 논문에서는 기존의 제시된 차원이 증가하면서 급속하게 성능이 저하되는 문제를 특징 벡터의 시그니쳐를 구성하여 완화시킨 필터링에 기반한 고차원 색인 구조에 동시성 제어기법을 설계 및 구현하여 위스콘신 대학에서 개발한 지속성 객체 저장 시스템인 SHORE 하부저장 시스템과 밀결합 방식으로 통합하였다. 확장된 SHORE 하부저장 시스템은 고차원 데이터에 대한 효율적인 검색 뿐만 아니라 레코드 레벨의 색인 데이터에 대한 동시성 제어를 지원하며 시그니쳐 파일을 모두 메모리에 로딩하는 구조를 개선하여 페이지 레벨의 관리가 가능하다. 아울러 본 논문에서 제시한 확장된 SHOE 하부저장 시스템을 실제 응용 시스템에 적용하기 위해 플랫폼 독립적인 환경을 지원하는 자바 언어를 사용하여 미들웨어 구축 방안을 제시한다. 또한 구축된 미들웨어를 통해 쓰레드 별로 대표적인 내용기반 질의 형태인 포인트질의, 범위질의, k-최근접 질의에 대한 다수 사용자 환경에서의 성능 평가를 수행하였다.

기업정보 기반 지능형 밸류체인 네트워크 시스템에 관한 연구 (A Study on Intelligent Value Chain Network System based on Firms' Information)

  • 성태응;김강회;문영수;이호신
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.67-88
    • /
    • 2018
  • 최근까지도 중소기업의 지속성장 및 경쟁력 확보에 대한 중요함을 인식함에 따라, 정부 차원에서의 유형 자원(R&D 인력, 자금 등)에 대한 지원이 주로 투입되어 왔다. 그러나 사업지원의 적절성이나 효과성, 효율성 면에서 서로 상충되는 정책부분이 존재하여 과소 지원이나 중복 지원 등 지원체계의 비효율성 문제가 제기되어온 것도 사실이다. 정부나 기업 관점에서는 중소기업의 한정된 자원으로 인해, 외부와의 협력을 통한 기술개발 및 역량강화가 기업의 경쟁우위를 창출하는 근간이라 보고 있으며, 이를 위한 가치창출 활동을 강조하고 있다. 기업 레벨에서의 지식생태계 구축을 통해 일련의 가치사슬로부터 기업거래 관계를 분석하고 결과를 가시화할 수 있는 밸류체인 네트워크 분석이 필요한 것도 이 때문이다. 특허/제품/기업명 검색을 통해 관련 제품의 정보나 특허 보유 기업의 기술(제품) 현황 정보를 제공하는 기술기회발굴시스템(Technology Opportunity Discovery system), 기업(재무)정보와 신용정보을 열람하게 해주는 CRETOP이나 KISLINE 등은 존재하고 있으나 밸류체인 네트워크 분석기반으로 유사(경쟁)기업의 리스트나 향후 거래 가능한 잠재 거래처 정보를 제공해주는 시스템은 부재한 실정이다. 따라서, 본 고에서는 KISTI에서 개발 운영중인 기업 비즈니스 전략수립 지원 파트너인 '밸류체인 네트워크 시스템(Value Chain Network System : VCNS)'을 중심으로, 탑재된 네트워크 기반 분석모듈의 유형, 이를 지원하는 참조정보 및 데이터베이스(D/B)의 구성 로직과 시스템 활용방안을 고찰하며, 산업구조를 이해하고 기업의 신제품 개발을 위한 핵심정보가 되고 있는 지능형 밸류체인 분석 시스템의 네트워크 가시화 기능을 살펴보기로 한다. 한 기업이 다른 기업 대비 경쟁우위를 확보하기 위해서는 보유 특허 또는 현재 생산하고 있는 제품에 대한 경쟁자 식별이 필요하며, 세부 업종별 유사(경쟁)기업을 탐색하는 일은 대상기업의 사업화 경쟁력 확보에 핵심이 된다. 또한 기업간 비즈니스 활동인 거래정보는 유사 분야로 진출할 경우 잠재 거래처 정보를 제공하는 중요한 역할을 수행한다. 이러한 기업간 판매정보를 기반으로 구축된 네트워크 맵을 활용하여 기업 또는 업종 수준의 경쟁자를 식별하는 일은 밸류체인 분석의 핵심모듈로 탑재될 수 있다. 밸류체인 네트워크 시스템(VCNS)은 단순 수집된 종래의 기업정보에 밸류체인(value chain) 및 산업구조 분석개념을 접목하여 개별 기업의 시장경쟁 상황은 물론 특정 산업의 가치사슬 관계를 파악할 수 있다. 특히 업종구조 파악, 경쟁사 동향 파악, 경쟁사 분석, 판매처 및 구매처 발굴, 품목별 산업동향, 유망 품목 발굴, 신규 진입기업 발굴, VC별 핵심기업 및 품목 도출, 해당 기업별 보유 특허 파악 등 기업 레벨에서의 유용한 정보분석 툴로 활용 가능하다. 또한, 거래처 정보 및 재무데이터로부터 분석된 결과의 객관성 및 신뢰성을 기반으로, 현재 국내에서 이용 중인 15,000여개 회원기업과 연구개발서비스업 종사자, 출연(연) 및 공공기관 등에서 사업평가 정보지원, R&D 의사결정 지원 및 중 단기 수요예측 전망 등 다양한 목적(용도)에 밸류체인 네트워크 시스템을 활용할 수 있을 것으로 기대된다. 기업의 사업경쟁력 강화를 위해 정부기관 및 민간 연구개발서비스 기업을 중심으로 기술(특허) 및 시장정보가 제공되어 왔으며, 이는 특허분석(등급, 계량분석 위주) 또는 시장분석(시장보고서 기반 시장규모 및 수요예측 위주)의 형태로 지원되어 왔다. 그러나 기업이 사업화진출 단계에서 겪게 되는 애로요인의 하나인 정보부족을 해결하는데 한계가 있었으며, 특히 경쟁기업 및 거래가능 기업 후보군에 대한 탐색정보는 입수하기 어려웠다. 본 연구를 통해 제안된 네트워크맵 및 보유 데이터 기반의 실시간 밸류체인 가시화 서비스모듈이 중견 중소기업이 당면한 신규시장 진출시 경쟁기업 대비 예상점유율, (예상)매출액 수준, 어느 기업을 컨택하여 유통망(원자재/부품에 대한 공급처, 완제품/모듈에 대한 수요처)을 확보할 지에 대한 핵심정보를 제공할 수 있을 것으로 기대된다. 향후 연구에서는 대체기업(또는 대체품목) 경쟁지표의 개발과 연구주체의 참여를 통한 경쟁요인별 지표의 고도화 연구, VCNS의 성능향상을 위한 데이터마이닝 기술 및 알고리즘을 추가 반영하도록 수행하고자 한다.

위성 및 CFD모델 자료의 융합을 통한 도시지역에서의 고해상도 지표 순복사 산출 (Retrieval of High Resolution Surface Net Radiation for Urban Area Using Satellite and CFD Model Data Fusion)

  • 김홍희;이다래;최성원;진동현;허모랑;김재진;홍진규;홍제우;이근민;한경수
    • 대한원격탐사학회지
    • /
    • 제34권2_1호
    • /
    • pp.295-300
    • /
    • 2018
  • 순복사는 지구 에너지 순환의 열원으로 사용되는 총 복사에너지의 총량으로써, 지표면에서는 수문학, 기후 연구 및 농업과 같은 분야에서 중요한 요소이다. 원격탐사를 통해 순복사를 모니터링 함으로써 열섬 현상과 도시화 경향을 파악할 수 있어 매우 중요하지만, 원격 탐사 자료만을 이용한 순복사 추정은 일반적으로 구름의 유무에따라정확도차이가발생한다.따라서본논문에서는천리안위성(Communication, Ocean and Meteorological Satellite, COMS) 및 Landsat-8위성 기반의 자료와 건물 높이 차이를 반영한 전산유체역학(Computational Fluid Dynamics, CFD)모델 자료를 이용하여 도시화가 진행 중인 은평구 뉴타운 지역에서의 고해상도 순복사를 1시간 간격으로 산출 및 모니터링을 수행하였다. 은평구 플럭스 타워에서 관측된 순복사와 비교한 결과, RMSE $54.29Wm^{-2}$, Bias $27.42Wm^{-2}$의 정확도를 보였으며, 전체적으로 지점 관측 자료와의 유사한 경향을 보였다. 또한 산출된 순복사는 강수와 같은 기상상태를 잘 나타냈으며, 공간적 분포에서 식생 및 인공물 지역에 대한 순복사의 특징을 잘 나타냈다.

GK2A AMI를 이용한 한반도 식생건강지수 산출 (Retrieval of Vegetation Health Index for the Korean Peninsula Using GK2A AMI)

  • 이수진;조재일;류재현;김나리;김광진;손은하;박기홍;장재철;이양원
    • 대한원격탐사학회지
    • /
    • 제38권2호
    • /
    • pp.179-188
    • /
    • 2022
  • 지구온난화는 기후변화를 야기하며 전지구적으로 이상기상 현상을 유발하고 있다. 우리나라에서도 폭염, 가뭄과 같은 이상기상 현상이 증가하고 있는 상황이다. 이상기상 감시를 위하여 지표면온도(Land Surface Temperature, LST), 온도상태지수(Temperature Condition Index, TCI), 식생활력지수(Normalized Difference Vegetation Index, NDVI), 식생상태지수(Vegetation Condition Index, VCI), 식생건강지수(Vegetation Health Index, VHI) 등의 위성자료가 활용되고 있다. TCI와 VCI를 이용하여 계산되는 VHI는 온도, 강수와 같은 기상 요인에 의한 식생 스트레스를 나타내며, 기후변화 상황에서 가뭄 평가에 주로 활용되고 있다. TCI, VCI는 날짜 및 장소에 따른 LST, NDVI의 과거 평년치를 참조해서 산출되기 때문에, 아직 2년여의 자료밖에 없는 천리안위성 2A호(GK2A) AMI (Advanced Meteorological Imager) 자료로부터 TCI, VCI, VHI를 산출하는 것은 현재로서는 쉽지 않은 일이다. 본 연구에서는 대안적인 방법으로 VIIRS (Visible Infrared Imaging Radiometer Suite) 센서의 LST, NDVI를 이용하여 GK2A의 VHI 산출 가능성을 모색하였다. GK2A와 VIIRS의 LST, NDVI는 상당히 높은 상관성을 보이기 때문에, GK2A에 존재하지 않는 과거 평년치를 VIIRS 자료로 대체하는 방식을 택하였다. 8일 간격으로 GK2A 격자에 해당하는 LST, NDVI의 최소·최대값 조견표를 구축하여 TCI, VCI, VHI를 산출하였고, 최근 우리나라 이상기상 현상에 대한 해석을 수행하였다. GK2A VHI는 2020년 3월과 6월의 폭염, 4월과 7월의 저온, 8월의 폭우 등으로 인한 식생 스트레스의 변화를 잘 표현하는 것으로 나타났지만, 미국 해양대기청(National Oceanic and Atmospheric Administration, NOAA)의 VHI 산출물은 그렇지 않았다. 본 연구에서 제시한 GK2A VHI는 향후 LST, NDVI의 과거 평년치에 대한 통계적으로 엄밀한 보완을 거친다면 폭염, 가뭄으로 인한 식생 스트레스 감시에 활용될 수 있을 것으로 사료된다.

소셜 네트워크에서 관계 랭킹 모델 (A Model for Ranking Semantic Associations in a Social Network)

  • 오선주
    • 한국전자거래학회지
    • /
    • 제18권3호
    • /
    • pp.93-105
    • /
    • 2013
  • 실생활에서 소셜 네트워크 서비스의 사용은 활성화되고 있으나 이를 비즈니스 차원에서 활용하기 위한 이론적이며 실증적인 연구가 부족한 상황이다. 기존의 다양한 데이터로부터 소셜 네트워크를 구축하고, 구축된 소셜 네트워크에서 잠재적 관계를 도출하거나 찾는 등의 유용한 활용 방법에 대한 연구가 요구된다. 본 연구는 소셜 네트워크에서 잠재되어 있는 관계를 인식하여 유용한 관계를 찾기 위한 방안으로서 소셜 네트워크에서 구성원간 관계를 검색하기 위한 랭킹 방법을 제안한다. 본 연구에서는 온톨로지를 기반으로 개체간 의미적 관계를 유추하여 확장하고 이를 바탕으로 다양한 랭킹 기준을 융통성 있게 조합하여 검색하고자 하는 관계를 효율적으로 찾기 위한 랭킹 모델을 제시하였다. 또한 제안한 연구 방법이 유의미한 것을 보이기 위하여 기업과 대학 간 사회적 네트워크에서 임의의 관계를 검색하고 강도를 측정하는 데 연구 모델을 적용하여 보았다. 본 연구에서 제안하는 시맨틱 웹기반 소셜 네트워크에서 임의의 관계를 검색하여 랭킹하는 방법은 빅데이터 시대에 유용한 관계 정보를 편리하게 검색할 수 있는 효과적인 방법으로 활용이 기대된다.

한글 외곽선 폰트의 자소 분할 (Hangul Component Decomposition in Outline Fonts)

  • 구상옥;정순기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-21
    • /
    • 2011
  • 본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.