• 제목/요약/키워드: Retrieval Model

검색결과 815건 처리시간 0.027초

메타데이타 인터페이스를 이용한 분산된 반구조적 문서 검색을 위한 질의처리 알고리즘 설계 및 구현 (Design and frnplernentation of a Query Processing Algorithm for Dtstributed Semistructlred Documents Retrieval with Metadata hterface)

  • 최귀자;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.554-569
    • /
    • 2005
  • 반구조적 분산 문서에서는 구조 정보가 제공되지 않고, 자료 구조에 대한 엄격한 형식이 없기 때문에 질의 처리 시스템을 정형화하고 구현하기 어렴다. 이질적이고 이구조적인 반구조적 문서의 요소를 정확하게 검색하기 위해서는 한 요소가 1:1, 1:N, W:1과 같이 서로 다른 매핑 형태를 취하면서 동시에 여러 요소에 매핑되는 다중 매핑을 처리할 수 있어야 하며, 지역문서의 태그를 파싱하여 구조적인 정보를 얻고 경로 트리를 생성해야 한다. 본 논문에서는 분산된 시스템에 존재하는 이질적인 반구조적 자료나 문서에 대한 동시 다중 매핑을 완벽히 지원하고, 문서 자체를 파싱하여 구조적 정보를 얻을 수 있도록 통합 질의와 검색을 수행하기 위한 추상적인 질의 처리 알고리즘을 설계하고 메타데이타 인터페이스를 이용하여 구현하였다. 이 알고리즘은 전역질의를 기반으로 지역질의를 생성하기 위해서 메타데이타 정보를 이용하여 노드들 사이의 매핑, 매핑 종류에 따른 데이타의 변환, 경로교체 및 노드 사이의 이질성을 해결하기 위한 알고리즘으로 제시하였다. 전역스키마와 지역스키마에 대한 매핑과 함수에 의한 데이타의 변환 및 경로교체는 사용자에 의해 구축된 메타데이타 인터페이스인 DDXMI(for Distributed Documents XML Metadata Interface)를 기반으로 하여 구현되었으며, 같은 이름을 갖지만 다른 의미를 갖는 자료나 노드에 대한 검색은 노드를 구분할수 있는 노드가 가지고 있는 자식정보를 이용하여 노드 구분 조건절을 생성하여 구현하였다. XML 질의언어로 Quilt를 사용하였으며, OEM 모델로 제시한 세 개의 서로 다른 반구조적 레스토랑 안내 문서에서구현한 결과를 보였다. 프로토타입 시스템은 윈도우즈 환경에서 Java와 JavaCC 컴파일러를 이용하여 개발하였다.

비정형 패션 이미지 검색을 위한 MASK R-CNN 선형처리 기반 CNN 분류 학습모델 구현 (Implementation of CNN-based Classification Training Model for Unstructured Fashion Image Retrieval using Preprocessing with MASK R-CNN)

  • 조승아;이하영;장혜림;김규리;이현지;손봉기;이재호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.13-23
    • /
    • 2022
  • 본 논문에서는 패션 분야의 비정형 데이터 검색을 위한 패션 아이템별 세부 컨포넌트 이미지 분류 알고리즘을 제안한다. 코로나-19 환경으로 인하여 최근 AI 기반 쇼핑몰이 증가하는 추세이다. 하지만 기존의 키워드 검색과 사용자 서핑 행위 기반 개인 맞춤형 스타일 추천으로는 정확한 비정형 데이터 검색에는 한계가 있다. 본 연구는 다양한 온라인 쇼핑 사이트에서 크롤링한 이미지를 사용하여 Mask R-CNN을 활용한 전처리를 진행한 후, CNN을 통해 패션 아이템별 컴포넌트에 대한 분류를 진행하였다. 셔츠의 카라 및 패턴과 청바지의 핏, 워싱 및 컬러에 대한 분류를 진행하였으며, 다양한 전이학습 모델을 비교 분석한 후 가장 높은 정확도가 나온 Densenet121모델을 사용하여 셔츠의 카라는 93.28%, 셔츠의 패턴은 98.10%의 정확도를 도달하였으며, 청바지의 핏은 Notched, Spread, Straight 3가지의 클래스의 경우 91.73%, Regular 핏을 추가한 4가지의 클래스의 경우 81.59%, 청바지의 색상은 93.91%, 청바지의 Washing은 91.20%, 청바지의 Demgae는 92.96%의 정확도를 도출하였다.

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

모델, 데이터, 대화 관점에서의 BlendorBot 2.0 오류 분석 연구 (Empirical study on BlenderBot 2.0's errors analysis in terms of model, data and dialogue)

  • 이정섭;손수현;심미단;김유진;박찬준;소아람;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권12호
    • /
    • pp.93-106
    • /
    • 2021
  • 블렌더봇 2.0 대화모델은 인터넷 검색 모듈과 멀티 세션의 도입을 통해 실시간 정보를 반영하고, 사용자에 대한 정보를 장기적으로 기억할 수 있도록 함으로써 오픈 도메인 챗봇을 대표하는 대화모델로 평가받고 있다. 그럼에도 불구하고 해당 모델은 아직 개선점이 많이 존재한다. 이에 본 논문은 블렌더봇 2.0의 여러 가지 한계점 및 오류들을 모델, 데이터, 대화의 세 가지 관점으로 분석하였다. 모델 관점에서 검색엔진의 구조적 문제점, 서비스 시 모델 응답 지연시간에 대한 오류를 주로 분석하였다. 데이터 관점에서 크라우드 소싱 과정에서 워커에게 제공된 가이드라인이 명확하지 않았으며, 수집된 데이터의 증오 언설을 정제하고 인터넷 기반의 정보가 정확한지 검증하는 과정이 부족한 오류를 지적하였다. 마지막으로, 대화 관점에서 모델과 대화하는 과정에서 발견한 아홉 가지 유형의 문제점을 면밀히 분석하였고 이에 대한 원인을 분석하였다. 더 나아가 각 관점에 대하여 실질적인 개선방안을 제안하였으며 오픈 도메인 챗봇이 나아가야 할 방향성에 대한 분석을 진행하였다.

효율적 공간 형상화 및 건물성능분석을 위한 스케치 정보 기반 BIM 모델 자동생성 프레임워크 개발 (A Framework Development for Sketched Data-Driven Building Information Model Creation to Support Efficient Space Configuration and Building Performance Analysis)

  • 공병찬;정운성
    • 한국건설관리학회논문집
    • /
    • 제25권1호
    • /
    • pp.50-61
    • /
    • 2024
  • 사용자의 공간 요구사항 중심의 평면계획에 대한 수요가 증가함에 따라 소형 주택시장이 지속적으로 성장하고 있다. 하지만 건축주는 공간 구성이나 비용 견적과 같은 근거를 기반으로 평면요구사항을 개진하는데 매우 제한적인 수단을 활용하고 있어 건축가와 같은 전문가들과의 소통에 많은 어려움을 겪고 있다. 본 연구의 목적은 스케치 정보 기반의 공간 요구사항을 BIM 모델의 3D 건물구성요소로 자동 변환하여 사용자의 공간에 대한 이해를 돕고, 초기 설계단계에서 예산 산정을 지원하기 위한 건물성능분석 정보를 제공할 수 있는 프레임워크 개발에 있다. 본 연구의 방법론은 프로세스 모델 개발, 프레임워크 구현 및 검증단계로 구성되었다. 프로세스 모델 개발은 프레임워크의 데이터 흐름을 묘사하고 프레임워크에 필요한 기능을 정의하는 단계이며, 프레임워크 구현은 프로세스 모델을 기반으로 시스템 인터페이스와 사용자 인터페이스를 개발하고, 이종 시스템 간의 연동 방식을 정의하는 단계이다. 검증단계는 개발된 프레임워크가 스케치 정보로 표현된 공간 요구사항을 BIM 모델의 벽, 바닥, 지붕과 같은 건물 구성요소 객체들로 자동 변환할 수 있는가를 검증하였다. 또한 프레임워크가 BIM 모델을 기반으로 재료 및 에너지 비용을 자동으로 산출할 수 있는가를 검증하였다. 프레임워크를 통해 사용자는 스케치 정보를 기반으로 3D 건물 구성요소를 효율적으로 생성할 수 있으며, 생성된 BIM 모델을 통해 공간을 이해하고 건물성능분석 정보를 제공받을 수 있다.

한국문헌정보학 교과과정 운영모형 및 표준교과목 개발에 관한 연구 (A Study of the Curriculum Operating Model and Standard Courses for Library & Information Science in Korea)

  • 노영희;안인자;최상기
    • 한국문헌정보학회지
    • /
    • 제46권2호
    • /
    • pp.55-82
    • /
    • 2012
  • 본 연구에서는 국내외 문헌정보학과의 교과과정 운영모형을 조사하여 국내 현실에 맞는 운영모형을 제안하고자 하며, 운영모형에 기반하여 한국문헌정보학 표준교과목도 제안하고자 한다. 이를 위해 국외 교과과정 분석결과, 국내 교과과정 분석결과, 국내 현장사서를 대상으로 한 설문조사 결과, 그리고 현장사서를 대상으로 한 관종별 직무분석결과를 종합적으로 분석하여 문헌정보학 필수교과목, 핵심교과목, 그리고 선택교과목을 선정하여 제시하였다. 최종 제안된 문헌정보학 필수과목은 6개 과목으로서, 문헌정보학개론, 정보조직학, 정보서비스론, 도서관경영론, 정보검색론, 사서실습이다. 핵심과목은 6개 과목으로서, 정보자료분류목록실습, 주제별정보원(참고정보원), 장서개발론, 디지털도서관론, 서지학개론, 기록관리학개론이다. 선택과목은 총 20개 과목으로서, 문헌정보학 영역 4개 과목(도서및도서관사, 지식정보사회와 도서관, 도서관과저작권, 문헌정보학연구방법론), 정보조직학 영역 2개 과목(메타데이터의 이해, 한국문헌자동화목록실습), 정보조사제공학 영역 3개 과목(정보활용교육론, 독서지도론, 정보이용자연구), 도서관 정보센터경영학 영역 4개 과목(도서관협력론, 관종별도서관운영론, 도서관마케팅, 비도서자료관리론), 정보학 영역 6개 과목(데이터베이스운영론, 색인초록론, 정보학개론, 정보시스템론, 도서관시스템자동화, 도서관정보네트워크), 기록관리학 영역 1개 과목(기록보존론)이다.

자료동화 토양수분 데이터를 활용한 동아시아지역 수동형 위성 토양수분 데이터 보정: SMOS (MIRAS), GCOM-W1 (AMSR2) 위성 및 GLDAS 데이터 활용 (Revising Passive Satellite-based Soil Moisture Retrievals over East Asia Using SMOS (MIRAS) and GCOM-W1 (AMSR2) Satellite and GLDAS Dataset)

  • 김형록;김성균;정재환;신인철;신진호;최민하
    • 한국습지학회지
    • /
    • 제18권2호
    • /
    • pp.132-147
    • /
    • 2016
  • 동아시아 지역의 위성 토양수분 데이터 활용을 위해 Soil Moisture Ocean Salinity (SMOS) 위성에 탑재된 Microwave Imaging Radiometer using Aperture Synthesis (MIRAS) 센서와 Global Change Observation Mission-Water (GCOM-W1) 위성에 탑재된 Advanced Microwave Scanning Radiometer 2 (AMSR2) 센서 기반 토양수분 데이터를 자료동화 데이터인 Global Land Data Assimilation System (GLDAS)를 기준 값으로 Cumulative Distribution Function (CDF) 기법과 회귀식을 활용하여 보정하는 연구를 수행하였다. 동아시아 지역에서 발생하는 전파간섭의 영향을 고려하여 토양수분 산출에 적합하다고 판단되는 Radio Frequency Interference (RFI), Data Quality indeX (DQX) 한계값과, 합성일수를 제시하였다. 보완된 위성 토양수분 데이터를 지점 토양수분 데이터와 비교한 결과 상관계수가 평균 27%, 11% 증가하였고, Root Mean Square Deviation (RMSD, 평균제곱근 편차)는 평균 61%, 57% 감소하였다. 추가적으로, 보정된 위성데이터를 GLDAS 토양수분 데이터와 비교했을 때, 보정된 MIRAS 및 AMSR2 데이터는 한반도의 80% 및 90%의 지역에서 상관계수가 증가하였으며, 한반도 전역에서 RMSD가 감소하였다. 본 연구를 통해 향후 MIRAS 및 AMSR2 위성 데이터를 융합하여 각 위성의 토양수분 데이터를 보완 할 수 있는 가능성을 제시하였다.

SKYNET 관측 자료를 이용한 동아시아 영역에서의 MODIS 에어로솔 광학 두께 산출물 검증 (Validation of MODIS-derived Aerosol Optical Thickness Using SKYNET Measurements over East Asia)

  • 장현성;송환진;전형욱;손병주;타카무라 타미오
    • 한국지구과학회지
    • /
    • 제32권1호
    • /
    • pp.21-32
    • /
    • 2011
  • 본 연구는 동아시아 영역에 속해있는 5개 SKYNET 관측소(서울, 지바, 엣추 지마, 후쿠에 지마, 헤도 미사키)에서 6년 간 관측한 AOT 자료를 활용하여 MODIS에서 산출된 AOT를 검증하였고, 아울러 에어로솔 기후장 분석도 함께 수행하였다. 검증연구를 위해 관측소 25 km 이내의 MODIS AOT를 평균하였고, MODIS 관측시각 30분 전후 SKYNET AOT를 평균하여 시공간 일치 자료를 생산하였다. 시공간 일치 자료의 비교 결과 MODIS AOT의 정확도는 에어로솔 종류에 크게 영향을 받지 않았으나, MODIS AOT 산출과정 중 거대 입자 모형의 사용비율이 높아질수록 SKYNET AOT에 비해서 비교적 큰 값을 산출하는 경향을 보였다. 또한 AOT가 낮은 대기에서 MODIS AOT는 과대 추정하는 경향을 보였고 그 경향성은 AOT가 높아질수록 줄어들었다. MODIS-SKYNET AOT간의 회귀분석 결과 기울기는 0.86, Y절편은 0.16으로 나타났고 결정계수($R^2$)는 0.61로 나타났다. 이러한 통계적 결과로 미루어 볼 때 동아시아 영역에서 산출된 MODIS AOT는 지상 관측에 견줄 만큼 정확하다고 볼 수 있다.

다른 원격탐사 센서로 추출한 강우자료의 이질성과 이에 의한 비선형유출반응에 미치는 영향 (Investigating Remotely Sensed Precipitation from Different Sources and Their Nonlinear Responses in a Physically Based Hydrologic Model)

  • 오남선;이길하;김상준
    • 한국수자원학회논문집
    • /
    • 제39권10호
    • /
    • pp.823-832
    • /
    • 2006
  • 강우는 물과 에너지 순환에서 가장 중요한 역할을 한다. 이 연구에서는 두개의 다른 원격탐사 센서를 이용하여 추출한 강우자료의 불확실성 (uncertainty)에 대하여 검토해 보았으며, 이에 의한 오차가 비선형 수치수문모형에서 수문인자(유출)를 모의할 때 어떻게 영향을 미치는가를 살펴보았다. 지상에서 관측된 강우 관측을 이용하여 WSR-88D (NEXRAD)에 의해 추출한 레이더 강우, 그리고 IR (Infrared) 밴드를 기반으로 하는 인공위성 강우관측을 비교 검토하였으며, 세 가지의 서로 다른 강우와 현장에서 측정된 기상자료를 입력 자료로 사용하여, 오프라인 CLM (Community Land Model) 수문모형으로 유출량을 모의하였다. 이 연구에서 물리적 이론을 기반으로 하는 CLM수문 모형의 매개변수는 지표면-대기의 수문반응 (land-atmosphere interaction)을 적절하게 묘사하도록 정의되었다고 가정한다. 다른 원격탐사 센서를 이용하여 추출한 강우자료는 시공간적으로 다른 양상을 보여 주며, 수치모형의 실험 결과는 강우입력의 불확실성이 수문반응의 결과에 어떻게 영향을 미치는지를 보여준다. 이 연구는 앞으로 우리나라에서 개발 및 활용가능성이 있는 레이더 강우와 인공위성 강우에 대한 사전 지식을 제공하고, 동시에 수치 수문모형을 수행할 때 수문반응의 불확실성에 대한 정보를 제공해 주며, 결국은 기후 변화에 따른 수자원의 재분배를 이해하는데 이바지할 것이다.

단일 밴드 중적외선 영상으로부터 표면온도 추정을 위한 기초연구 (A Basic Study for the Retrieval of Surface Temperature from Single Channel Middle-infrared Images)

  • 박욱;이윤경;원중선;이승근;김종민
    • 대한원격탐사학회지
    • /
    • 제24권2호
    • /
    • pp.189-194
    • /
    • 2008
  • [ $3{\sim}5{\mu}m$ ] 파장대의 중적외선 영상은 화산 활동이나 산불과 같이 고온 현상을 관측하는데 효과적이다. 그러나 중적외선 영역은 지표의 복사율과 대기의 영향으로 인한 변화가 매우 심하고, 특히 낮 영상의 경우 태양 복사량에 의한 영향도 고려해야 하는 어려움이 있다. 따라서 단일밴드인 중적외선 영상을 이용하여 표면온도를 얻기 위해서는 영상이 취득된 시간과 장소에서 관측된 태양 복사량 및 여러 가지 대기 변수가 필요하다. 이 연구는 기존의 다중밴드 기반의 중적외선 영상 활용방법과 달리 단일 밴드 중적외선 영상을 이용하여 표면온도 측정을 위한 기초연구에 그 목적이 있다. 이를 위하여 MODIS 영상을 대상으로 MODTRAN을 사용하여 중적외선 영역의 대기보정 기법을 적용 한 뒤 복사전달 모델을 이용하여 지표의 온도를 측정하였다. 획득된 온도 영상의 정밀도를 측정하기 위해 기존의 온도 알고리즘인 MODIS Sea Surface Temperature 알고리즘에 의해 얻어진 해수온도와 비교를 통하여 오차 원인에 대해 분석을 실시하였다. 두 결과의 온도차는 낮 영상의 경우 $0.89{\pm}0.54^{\circ}C$ 밤 영상의 경우 $1.25{\pm}0.41^{\circ}C$로 비교적 긍정적인 결과를 보였다. 그러나 낮 영상의 육지의 경우 대기에 의한 영향보다 태양빛의 반사가 주된 오차의 원인이 되며 이는 지표 복사율에 의한 영향이 매우 크게 작용하고 있음을 추정할 수 있다. 이 연구는 현재까지 해수에 대한 적용에 국한된 것으로 육상의 경우 복사율 변화가 매우 크기 때문에 중적외선 단일밴드에 의한 온도추정이 매우 어려울 것으로 예상된다.