• 제목/요약/키워드: 키워드검색기법

검색결과 254건 처리시간 0.027초

지식 데이타베이스를 적용한 효율적인 세균 의료영상 검색 시스템의 구현 (Implementation of an Efficient Microbial Medical Image Retrieval System Applying Knowledge Databases)

  • 신용원;구봉오
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.93-100
    • /
    • 2005
  • 본 연구는 신규 임상병리사로 하여금 보다 정확한 의사결정과 효율적인 교육에 이용할 수 있는 지식 및 내용 기반 의료 세균화상 검색 시스템을 설계 및 구현하는 것이다. 이를 위해, 먼저 알고리듬방식의 검색 이전에 경험적 지식을 바탕으로 세균동정단계 중 가장 빠른 경로를 탐색하여 원인균 동정에 소요되는 시간을 줄일 수 있도록 룰 베이스를 근거로 유연성 있는 탐색경로를 설정하여 전체적인 추론을 수행한다. 다음으로, 색상 모델 중에서 HSV 컬러 모델을 이용하여 세균화상 중에서도 특히 세균화상으로부터 시각정보의 색상 특징 벡터를 추출할 수 있는 색상 특징 추출방법을 제안한다. 아울러 대용량 세균화상 데이터베이스를 기반으로 보다 빠른 검색 성능을 위해, 배지, 검체, 부서, 세균명과 같은 단순속성들에 대해서는 B+-트리, 세균화상에 대한 부가적인 설명 정보로부터 추출한 키워드들에 대해서는 역화일기법, 그리고 화상으로부터 추출한 고차원 색상 특징벡터에 대해서는 스캔-기반 필터링(Scan-Based Filtering:SBF) 기법을 결합한 통합 색인기법을 기술한다. 마지막으로 구현된 시스템은 시각적인 내용 자체의 정보와 지식을 이용하여 효과적으로 복잡한 세균화상을 검색 및 관리할 수 있는 가능성을 보인다. 아울러 구현한 지식 및 내-용기반 세균화상 검색 시스템을 통해 임상분야의 지식을 잘 구조화함으로써 초보적인 임상병리사의 학습기간을 현저히 단축시킬 수 있을 것으로 기대된다.

  • PDF

설명 가능한 인공지능과 CNN을 활용한 암호화폐 가격 등락 예측모형 (The Prediction of Cryptocurrency Prices Using eXplainable Artificial Intelligence based on Deep Learning)

  • 홍태호;원종관;김은미;김민수
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.129-148
    • /
    • 2023
  • 블록체인 기술이 적용되어 있는 암호화폐는 높은 가격 변동성을 가지며 투자자 및 일반 대중으로부터 큰 관심을 받아왔다. 이러한 관심을 바탕으로 암호화폐를 비롯한 투자상품의 미래가치를 예측하기 위한 연구가 이루어지고 있으나 예측모형에 대한 설명력 및 해석 가능성이 낮아 실무에서 활용하기 어렵다는 비판을 받아왔다. 본 연구에서는 암호화폐 가격 예측모형의 성과를 향상시키기 위해 금융투자상품의 가치평가에 활용되는 기술적 지표들과 함께 투자자의 사회적 관심도를 반영할 수 있는 구글 키워드 검색량 데이터를 사용하고 설명 가능한 인공지능을 적용하여 모형에 대한 해석을 제공하고자 한다. 최근 금융 시계열 분야에서 예측성과의 우수성을 인정받고 있는 LSTM(Long Short Term Memory)과 CNN(Convolutional Neural Networks)을 활용하고, 'bitcoin'을 검색어로 하는 구글 검색량 데이터를 적용해 일주일 후의 가격 등락 예측모형을 구축하였다. LSTM과 CNN을 활용해 구축한 모형들이 높은 예측성능을 보였으며 구글 검색량을 반영한 모형에서 더 높은 예측성과를 확인할 수 있었다. 딥러닝 모형의 해석 가능성 및 설명력을 위해 XAI의 SHAP 기법을 적용한 결과, 구글 검색량과 함께 과매수, 과매도 정도를 파악할 수 있는 지표들이 모형의 의사결정에 가장 큰 영향들을 미치고 있음을 파악할 수 있었다. 본 연구는 암호화폐 가격 등락 예측에 있어 전통적으로 시계열 예측에 우수한 성과를 인정받고 있는 LSTM뿐만 아니라 이미지 분류에서 높은 예측성과를 보이는 딥러닝 기법인 CNN 또한 우수한 예측성능을 보일 수 있음을 확인하였으며, XAI를 통해 예측모형에 대한 해석을 제공하고, 대중의 심리를 반영하는 정보 중 하나인 구글 검색량을 활용해 예측성과를 향상시킬 수 있다는 것을 확인했다는 점에서 의의가 있다.

효율적인 이미지 분할을 위한 RGB 채널 선택 기법 (RGB Channel Selection Technique for Efficient Image Segmentation)

  • 김현종;박영배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1332-1344
    • /
    • 2004
  • 최근 초고속 통신망 및 멀티미디어 관련기술의 발달로 인해 멀티미디어 데이타를 좀 더 효율적으로 전송하고 저장, 검색하는 기술이 요구되고 있다. 그 중에서 의미 기반 영상 검색은 색상, 질감, 모양 정보 등의 저 차원 특징 정보와 이미지 데이타에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키 워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 두 번째 문제점으로 내용 기반이미지 검색시스템에서 검색 성능이 떨어지며, 복잡한 배경을 가진 이미지에서 객체를 분리하기가 어렵고, 그리고 영역의 과잉 분할로 인하여 영역 추출이 어렵다. 그리고 복잡한 다중 객체를 가진 이미지에서 객체들을 분리하기 어렵다는 것이다. 이러한 문제점들을 해결하기 위해서, 본 논문에서는 총 다섯 가지 단계로 처리할 수 있는 내용 기반 검색 시스템을 구축한다. 다섯 단계 중에서 가장 중요한 부분은 RGB 이미지들 중에서 배경이 가장 큰 것과 가장 작은 것을 추출한다. 특히, 배경이 가장 큰 이미지를 이용하여 피사체와 배경을 추출하는 방법을 제안한다. 두 번째 문제점을 해결하기 위해서, RGB 채널 분할 기법을 이용하여 객체를 분리하고, Watermerge의 임계값을 이용하여 영역의 과잉분할을 최적화하며, RGB 채널 선택 기법을 이용하여 다중객체를 분리하는 방법을 제안한다. 실험을 통하여 기존에 검색하기 어려웠던 복잡한 객체들을 검색하는 방법들을 대체할 수 있도록, 제안한 기법이 기존의 방법보다 검색 성능이 우수함을 입증한다.과 황산이온의 농도에 따르는 것으로 생각된다. 이상과 같이, 에트린자이트는 콘크리트 내에서 다양한 내외부적인 화학작용 따라 특징적인 산출 양상을 보이며, 주변 환경 조건에 따라 다른 광물로 전이되는 나타내었다. 이러한 연구결과, 에트린자이트의 생성에 따른 콘크리트의 성능저하는 그 광물학적 특성과 분포양상에 관련성을 가지는 것으로 나타났다.인 상관관계를 보이지 않는 것으로 나타난다. 이에 비해서 팽윤도는 벤토나이트의 광물조성, 표면전하 특성, 입도 및 형상 등의 물리화학적 성향을 포괄하는 체표면적 수치와 대략적으로 반비례적인 관계를 보인다 따라서 벤토나이트 현탁액에서의 유변학적 특성은 몬모릴로나이트의 표면전하 특성, 형태, 입도 및 조직 등의 차이에 의해서 달라지는 점토 입자들의 응집특성 및 취합결정체의 형상에 주로 규제되고, 제올라이트와 같은 미세한 불순 광물성분들의 영향도 부수적으로 관여되는 복합적인 성향인 것으로 해석된다.18.88%이상 향상시키는 것으로 나타났다. 3. 유지방 함량 23.80%인 control 치즈의 cholesterol 함량은 81.47mg/100g이었고, 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 2%를 첨가한 cheese에서는 cholesterol 함량이 20.15mg/100g으로 cholesterol 제거율이 75.27%로 가장 높게 나타났다. 4. Meltability는 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 1과 2%로 처리한

빅데이터환경에서 텍스트마이닝 기법을 활용한 한국의 석면 트렌드 (1918년~2027년) (Asbestos Trend in Korea from 1918 to 2027 Using Text Mining Techniques in a Big Data Environment)

  • 노열;정현이;박병노;김채원;김유미;서민아;신행수;김현욱;성예지
    • 자원환경지질
    • /
    • 제56권4호
    • /
    • pp.457-473
    • /
    • 2023
  • 석면은 악성중피종과 폐암 등 치명적인 질병을 유발하기 때문에 국내에서 2009년부터 그 사용이 전반적으로 금지되었다. 그러나 국내에서 지난 수십년 간 석면이 생산 및 수입되어 다양한 산업에서 사용되어 왔기 때문에 우리 주변에는 여전히 석면함유물질이 많이 존재하고 있어 안전한 관리가 절실하다. 이 연구는 지난 32년(1991년 ~ 2022년)동안의 빅데이터를 바탕으로 석면관련 주요키워드를 이용하여 석면관련 트렌드 변화를 살펴보고자 한다. 또한 국내 과거(1990년 이전)의 석면의 생산, 수입, 사용 실태와 더불어 현재(2023년~2027년)의 석면관련 정책 동향을 살펴보고자 하였다. 1991~2000년에는 국내 석면의 생산과 수입 그리고 이용으로 인하여 석면에 대한 발암성이 부각되는 시기로 연구, 근로자, 발암물질, 환경등과 관련된 키워드가 주를 이루었다. 2001~2010년에는 석면의 발암성과 관련하여 미국, 일본 등에서 소송이 시작되었던 시기로 폐암, 소송, 발암물질, 노출, 기업 등의 키워드가 주를 이루었다. 2011~2020년에는 국내에서도 석면문제의 심각성을 인지하는 키워드인 발암물질, 야구장, 학교, 슬레이트, 건축물, 폐석면광산 등이 지속적으로 상위권 키워드로 검색되었다. 2021년부터는 주로 검색되는 키워드는 학교, 슬레이트, 건축물 등과 조경석, 환경영향평가, 아파트, 시멘트 등의 키워드가 나타났다.

웹 탐색 성능 향상을 위한 강화학습 이용과 기준 페이지 선택 기법 (The Use of Reinforcement Learning and The Reference Page Selection Method to improve Web Spidering Performance)

  • 이기철;이선애
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.331-340
    • /
    • 2002
  • 웹의 세계는 하루가 다르게 확장되고 있다. 이에 따라, 지능형 정보추출 기능이 없다면 우리는 넘쳐나는 데이터 앞에서 더욱 무기력해 질 수밖에 없다. 범용 탐색 엔진을 위한 기존의 웹 검색 기법은 특정 영역이나 특정 키워드에만 집중해야하는 특정 검색 엔진에는 너무 느린 경향이 있다. 본 논문에서는 웹 검색 능력을 개선하는 새 모델을 제시하고 실험하였다. 특정 영역과 관련된 초기의 관련 웹 페이지 집합에서 적절한 웹 페이지들을 선택하는 문제는 웹 검색 속도를 향상시키기 위해 매우 중요할 수 있다. 기준 웹 페이지 선택 기법 DOPS는 선택된 웹 페이지들이 가능한 한 직교성을 갖도록 동적으로 웹 페이지를 선택한다. 또한 새로 정의된 메져를 이용하여 적합한 기준 페이지들의 수도 결정해줄 수 있다. 매우 특화된 영역에 대한 실험을 통해서도, 본 방법은 거의 전문가 수준에 가까이 동작하였다. 전문가들이 초대형 초기 페이지 집합에 대해 일할 수 없다는 점과 그들도 기준 페이지 수의 최적치를 결정하기에 어려움을 느낀 다는 점을 고려하면, 본 방법은 매우 유망하다 할 수 있다. 또한 웹 환경에 강화학습도 적용하도록 하였고, DOPS에 기반을 둔 강화학습 실험을 통해 본 방법이 하이퍼링크 수나 시간 면에서 매우 양호한 결과를 보임을 알 수 있었다.

  • PDF

질의응답 시스템을 위한 백과사전 기반 지식베이스와 온톨로지 (Encyclopedia-Based Knowledge Base and Ontology for Question Answering System)

  • 최호섭;옥철영;김창환;왕지현;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.177-183
    • /
    • 2003
  • 기존의 정보검색시스템이 사용자의 질의에 의해 키워드가 포함된 의미 있는 문서를 제공하는 시스템이라면, 질의응답시스템은 사용자 질의에 맞는 정답을 적절한 언어처리 기법을 통해 텍스트로부터 추출하여 제공하는 시스템이다. 이러한 언어처리 기법을 이용한 질의응답 시스템에서 시스템의 성능 향상에 도움을 줄 수 있는 것이, 실세계의 지식을 저장하고 있는 지식베이스라 할 수 있다. 지식베이스가 가지고 있는 실세계의 지식을 어떻게 효율적으로 활용하느냐에 따라 질의 처리 분석과 정답 확률을 향상시킬 수 있는 것이다. 본 논문에서는 실세계의 지식을 어느 정도 체계적 의미적으로 반영하고 있는 것을 백과사전으로 판단하여, 백과사전의 '인물' 범주(category)를 중심으로 백과사전 지식베이스의 틀을 마련하고자 하였다. 또한 어휘의 계층적 구조를 중심으로 한 온톨로지를 백과사전 지식베이스와 유기적으로 연결시킴으로써 보다 의미 있는 지식베이스를 형성하는 방안을 모색하고자 하였다.

  • PDF

트위터 관련 연구에 대한 계량정보학적 분석 (A Bibliometric Analysis on Twitter Research)

  • 강범일;이재윤
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.293-311
    • /
    • 2014
  • 이 연구에서는 계량정보학적 기법을 사용하여 국내 트위터 관련 연구의 동향을 분석하고자 하였다. 이를 위해 KCI에서 검색된 2009년부터 2014년 4월까지의 트위터 관련 논문 539편에서 제목, 초록, 키워드를 추출하여 분석 자료로 삼았다. 프로파일링 기법을 이용해 트위터 관련 연구가 수행된 학문 분야와 저널을 분석하였고, 동시출현단어 분석을 통해 트위터 관련 연구의 세부 주제 영역을 파악하였다. 그 결과, 국내 트위터 관련 연구는 53개 학문분야에서 다양하게 다루어지고 있으며 핵심 분야는 신문방송학, 경영학, 컴퓨터학 분야로 나타났다. 세부 주제로는 선거를 비롯한 정치 관련 이슈가 가장 많이 다루어졌으며, 기업/구매 관련 이슈도 활발히 연구되었음을 확인할 수 있었다.

우편주소정보 추출모듈 개발 및 평가 (Development and Evaluation of Information Extraction Module for Postal Address Information)

  • 신현경;김현석
    • 창의정보문화연구
    • /
    • 제5권2호
    • /
    • pp.145-156
    • /
    • 2019
  • 본 연구에서는 명명된 실체 인식 기법에 기초한 정보 추출 모듈을 개발하고 평가하였다. 본 논문의 제시된 목적을 위해, 모듈은 사전 지식 없이 임의의 문서에서 우편 주소 정보를 추출하는 문제에 적용하도록 설계되었다. 정보 기술 실무의 관점에서, 우리의 접근방식은 유니그램 기반 키워드 매칭과 비교하여 일반화된 기법인 확률론적 n-gram(바이오그램 또는 트리그램) 방법이라고 말할 수 있다. 모델을 순차적으로 적용하지 않고 문장검출, 토큰화, POS 태그를 재귀적으로 적용하는 것이 우리의 접근법과 자연어 처리에 채택된 전통적인 방법 사이의 주요한 차이점이다. 이 논문에서는 약 2천 개의 문서를 포함한 시험 결과를 제시한다.

멀티미디어 정보관리 데이터베이스 시스템에서 자연어를 사용한 정보 검색 (Information Retrieval Using Natural Language for Multimedia Information Management Database System)

  • 이현창;배상현
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.1035-1041
    • /
    • 2004
  • 오늘날 사용자가 요구하는 데이터 타입은 주로 멀티미디어 데이터 타입들이다. 이들 멀티미디어데이터 타입의 특성은 기존의 데이터에 비하여 데이터의 크기가 크다는데 있다. 멀티미디어 데이터는 크기가 크기 때문에 멀티미디어 데이터 탐색 연산시 한번에 여러 데이터를 주기억 장치에 가져올 수 없으며, 이것은 많은 입출력 발생과 멀티미디어 데이터 시스템의 성능을 저하시키는 요인이 된다. 그러므로 본 논문에서는 보다 신속한 멀티미디어 데이터 접근을 이루기 위해 인덱스 방법에 관해 살펴보며, 이 기술을 이용하여 멀티미디어 데이터 접근을 많이 요구하는 응용프로그램에 적절하게 대처할 수 있으며, 사용자는 자연어를 사용하여 검색을 수행할 수 있다. 뿐만 아니라 정확한 매칭을 요구하는 키워드 매칭 인덱스 기법보다 자연어를 이용함으로써 사용자의 편리성과 신속한 결과 얻을 수 있도록 성능을 향상 시켰다.

정보검색 기법을 이용한 효율적인 자동 키워드 태깅 (An Efficient Method of IR-based Automated Keyword Tagging)

  • 김진숙;최호섭;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.24-27
    • /
    • 2008
  • 위키피디아의 백과사전에서 보여주는 바와 같이 주요한 용어에 대한 링크를 통한 태깅은 문서의 가독성을 크게 향상시킨다. 웹 2.0에서도 사회적 태깅(Social Tagging)의 중요성이 부각되고 있으며 시멘틱웹의 태그클라우드(Tag Cloud) 형태로 발전하고 있다. 본 논문에서는 대용량 통제어 사전에 등재된 주요 용어를 대상문서에 태깅하는 방법에 대해 연구결과를 제시한다. 기본적으로 사전에 있는 모든 용어(항목수 N)를 주어진 문서(길이 m)에서의 출현 여부를 문자열탐색을 통해 비교하여 태깅하는 방식은 O(mN)의 계산복잡도를 가진다. 그러나 본 논문에서 제시하는 바와 같이 정보검색을 이용할 경우에는 계산복잡도를 O(mlogN)으로 줄일 수 있었다. 정보검색을 활용하면 단순문자열 탐색에 비해서 평균 17.8배, 빠른 문자열탐색 알고리즘에 비해서도 평균 5.6배 이상 태깅 속도가 향상되었다.

  • PDF