• 제목/요약/키워드: 검색키워드

검색결과 1,014건 처리시간 0.026초

한국어 정보처리를 위한 명사 및 키워드 추출 (Noun and Keyword Extraction for Information Processing of Korean)

  • 신성윤;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.51-56
    • /
    • 2009
  • 언어에서 명사 및 키워드 추출은 정보처리에서 매우 필수적인 요소이다. 하지만, 한국어 정보처리에서 명사 추출과 키워드 추출은 아직도 많은 문제점을 안고 있다. 본 논문에서는 명사의 등장 특성을 고려한 효율적인 명사 추출 방법에 대해서 제시하였다. 제시한 방법은 대량의 문서를 빠르게 처리해야 하는 정보 검색과 같은 분야에서 유용하게 쓰일 수 있다. 또한 대량의 문제를 자동으로 분류하기 위하여 비감독 학습 기법에 의해 카테고리별 키워드를 구성하기 위한 방법을 제안하였다. 제안된 방법은 감독 학습 기법의 키워드 추출기법 중에서 우수하다고 알려진 X2기법과 DF 기법보다 우수한 분류 성능을 보였다.

메타버스를 이용한 비대면 교육환경의 확산 현황 분석 (Analysis of the Spread of Non-face-to-face Educational Environment using Metaverse)

  • 황의철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.163-164
    • /
    • 2022
  • 본 연구는 최근 2년(2019.12.1.~2021. 11.30)간 빅카인즈를 이용하여 '메타버스 AND 비대면 교육' 키워드가 포함된 뉴스 검색 결과 1148건을 바탕으로 관계도 분석, 연관어 키워드 빈도수 및 연관어 가중치 분석을 하였다. 첫째, 관계도 분석에서 가중치 '5'로 적용한 12개의 키워드 가중치로 코로나19(64), 아바타(43), 코로나(22), 유니버스(21), 게더타운(15), 패러다임(12), 신입사원(12), 로블록스(7)로 나타났다. 둘째, 연관어 키워드 월간 빈도수로는 2019.12~ 2020.9(0건), 2020.10(1건), 2021.3(19건), 2021.4(34건), 2021.6(72건), 2021.9 (196건), 2021.11애는 233건으로 급격하게 증가하였다. 셋째 키워드와의 연관성(가중치/키워드 빈도수)으로 코로나19(113.96/515), 가상세계(67.75/ 344), 메타버스(58.36/103), 메타(49.8/5730), 가상공간(45.57/380) 순이었다. 이 분석 결과에서 위드코로나 시대의 비대면 교육으로 메타버스에 기반을 둔 가상공간 활용 교육은 더욱 증가될 것으로 예상된다.

  • PDF

그레이스케일 히스토그램을 이용한 에지의 수평 정보획득 영상검색 (Gray scale image histogram using the horizontal edge information search)

  • 정일회;박종안
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.151-154
    • /
    • 2008
  • 본 논문은 현 검색시스템의 단순한 키워드 입력 방식에서 발생하는 오차를 줄이기 위해 이미지의 그레이스케일 히스토그램과 에지정보를 이용하는 검색 시스템 구현을 하였다. 검색알고리즘은 질의 이미지의 특징을 추출하는 단계, 이미지 정제 및 에지정보 추출단계, 추출된 특징을 분석하는 단계, 분석된 특징들로부터 필요한 정보를 확보하는 단계, 확보된 정보를 데이터베이스로부터 검색하는 단계, 검색된 데이터베이스에서 이미지를 비교 추출단계로 이루어진다. 제안한 검색시스템은 빠른 검색과 고 정확도를 목적으로 실현되며 시뮬레이션을 통해 이를 검증하고자 하였다.

  • PDF

의문의 초점을 고려한 자연어 기반의 정보검색 시스템 (Natural language based Information Retrieval System considering the focus of the question)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

오디세우스/parallel-OOSQL: 오디세우스 객체 관계형 데이터베이스 관리 시스템을 사용한 병렬 정보 검색 시스템 (ODYSSEUS/Parallel-OOSQL: A Parallel Information Retrieval System Using the Odysseus Object-Relational Database Management System)

  • 류재준;이재길;이민재;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2002
  • 인터넷의 성장과 함께 전자적인 형태로 표현되는 정보의 양이 급격하게 증가함에 따라, 문서를 병렬적으로 검색하는 병렬 정보 검색이 많은 양의 문서에 대한 빠른 검색을 지원하는 것에 있어 더욱 중요한 역활을 하고 있다. 병렬 정보 검색 시스템을 구현하기 위해서는 역 색인을 분활하고 분활된 역 색인을 병렬적으로 검색하는 것이 필요하다 역 색인을 분활하는 방법으로는 다음과 같은 두 가지 방법이 있다: 1) 문서 식별자를 기반으로 하는 분활 방법과 2) 키워드 식별자를 기반으로 하는 분활 방법. 그러나 각 방법은 단점들을 가지고 있다. 본 논문에서는 정보 검색 기능이 밀결합된 데이터베이스 관리 시스템인 오디세우스를 사용하여 병렬 정보 검색 시스템을 설계하고 구현한다. 첫째로, 기존의 역 색인 분할 방법을 분석하고 각 분말 방법의 단점들을 보완할 수 있는 혼합 분활 방법을 제안한다. 둘째로, 많은 양의 문서에 대해 성능 저하의 원인이 되는 대형 포스팅을 분할 하는 방법을 제안한다. 마지막으로 제안된 시스템의 유용성을 보이기 위해 실험을 수행한다. 예제 데이터베이스로서는 이백만 건의 웹 페이지를 사용한다. 실험 결과, 질의 저리 시간이 역 색인 분말의 블록의 개수에 근사하게 비례하여 줄어들고 시스템이 좋은 확장성을 가짐을 보인다.

  • PDF

동사사전를 이용한 의미 기반 정보 검색 시스템의 설계 (Design of An Information Retrieval System using Verb Dictionary)

  • 이용훈;이상범
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.177-180
    • /
    • 2009
  • 본 논문에서는 문장에서 동사를 파악하여 명사간의 의미를 부여하는 자동학습 온톨로지 기반 정보 검색 시스템을 제안한다. 정보의 양이 무한히 증가하고 있으며 웹의 발전에 따라 적합한 정보를 찾아내야 하는 효율적인 정보 검색 시스템의 필요성이 증대되고 있다. 단순히 키워드의 가중치에 따른 검색의 순위화는 사용자의 의미를 이해하지 못한 검색 결과로서 사용자로 하여금 결과를 다시 한번 직접 검색해야 하는 불편함을 제공하고 있다. 이러한 문제점을 해결하기 위해서 문장에서 동사를 파악하여 명사 간의 의미를 부여하고 문서 내에서 단어 간의 의미를 파악하여 검색의 질을 개선하는 방법을 논의한다. 또한, 문서에서 단어의 관계를 스스로 학습 가능하여 구축되는 자동학습 온톨로지 기반의 정보 검색 시스템을 제안한다.

  • PDF

감성기반 영상검색을 위한 대화형 유전자 알고리즘의 적용 (Application of Interactive Genetic Algorithm to Image Retrieval based on Emotion)

  • 이주영;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권3호
    • /
    • pp.422-430
    • /
    • 1999
  • 멀티미디어 영상검색 중 영상의 내용을 기반으로 한 검색방법에 관한 연구가 활발히 진행되고 있다. 이는 기존의 키워드기반 영상검색 방법에 비해 효율적인 관리와 검색 방법을 제공하고 있다. 그러나 대부분의 방법이 단순한 공학적 방법에 치우쳐 사람의 감성과는 무관한 검색 결과를 제공한다. 이러한 문제점을 해결하기 위해 본 논문에서는 대화형 유전자 알고리즘을 도입하여 검색과정에 사람의 감성을 반영할 수 있는 방법을 제안한다. 이 방법은 구체적으로 표현될 수 있는 영상 뿐 아니라 우울한 느낌의 영상, 즐거운 느낌의 영상과 같은 추상적인 느낌의 영상을 검색할수 있도록 한다. 2000개의 영상으로 이루어진 데이터베이스로 실험한 결과 , 제안한 방법이 유용함을 알 수 있었다.

시맨틱 웹 기반의 협업적 교육을 위한 문제은행 시스템

  • 오경진;김흥남;배인경;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.270-276
    • /
    • 2006
  • 문제은행 시스템은 학습 평가를 위한 문제를 DB로 구성한 다음, 추후에 인터넷으로 검색하여 재 사용하게 하는 시스템이므로 교사 업무의 효율성 및 비용이 절감되며, 사용자에게 제공할 문제 정보들을 체계적으로 관리, 저장, 검색할 수 있는 환경을 제공한다. 하지만 기존에 구축되어 있는 문제 은행 시스템들의 데이터들은 컴퓨터가 그 의미를 처리할 수 없기 때문에 동의어, 유의어들에 대한 정확한 검색이 어렵고, 단순한 키워드 검색으로 인하여 학생들과 교사들은 수많은 불필요한 검색 결과 속에서 원하는 정보를 다시 재 검색해야 하는 시간 낭비를 초래하고 있다. 이러한 문제를 극복하기 위해 본 논문에서는 시맨틱 웹 기반 기술인 OWL을 사용해서 문제은행 시스템의 온톨로지를 구성하고 개념 정의, 구조 및 관계를 명시한다. 그리고 온톨로지 기반위에 OWL 개체를 생성하고, SWRL에 정의된 규칙과 함께 추론 통해 시맨틱 검색을 가능하도록 하였다. 그 결과 데이터의 관계 및 의미 분석을 통한 향상된 검색 결과와 학습자와 교사가 다양하게 문제를 공유하고 재 사용함으로써 협업적 학습에 대한 효과를 기대할 수 있다.

  • PDF

XML 데이터베이스 기반의 영상정보 검색시스템 설계 (A Design of Image Information Retrieval System based on XML Database)

  • 곽길신;주경수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.139-141
    • /
    • 2005
  • 최근 인터넷의 발달에 따라 XML 문서의 사용과 각종 영상정보의 양이 크게 증가되었다. 이에 따라 XML 문서를 관리하기 위한 XML 데이터베이스의 필요성과 메타데이터 표준화에 대한 중요성이 증가되고 있다. XML 데이터베이스는 XML 문서의 특성을 고려하여 그 특성을 효율적으로 지원할 수 있다. 또한 국내에서는 교육정보분야 메타데이터 표준인 KEM 2.0이 제정 되었고 국외에서는 멀티미디어 데이터에 대한 표준으로 MPEG-7이 제정이 되었다. 이에 따라 본 논문에서는 MPEG-7을 기반으로 KEM 2.0을 이용한 영상정보 XML 스키마를 생성하고 이를 이용한 영상정보 검색시스템을 XML 데이터베이스 기반으로 설계하고자 한다. 본 논문에서 설계하는 XML 데이터베이스 기반의 영상정보 검색시스템은 XML 문서에 대한 빠른 저장과 검색이 가능할 것이다. 또한 검색 기능에 있어서는 키워드 기반의 의미기반 검색과 유사 이미지를 통한 내용기반 검색, 그리고 이를 내용기반과 의미기반을 통합한 검색 기능을 제공할 것이며 XML 문서에 대한 강력한 질의 수단인 XQuery 질의를 포함하게 될 것이다.

  • PDF

MPEG-7 기반의 멀티미디어 데이터 검색 시스템 설계 (Design of Multimedia data Retrieval System based on MPEG-7)

  • 김경수
    • 융합보안논문지
    • /
    • 제8권4호
    • /
    • pp.91-96
    • /
    • 2008
  • 멀티미디어 데이터의 급격한 양적 팽창은 원하는 데이터를 빠르고 정확하게 검색해야 한다는 새로운 과제를 안겨주었다. 이러한 효율적 검색을 위해 가장 중요한 기반이 되는 것이 바로 데이터의 적절한 표준화이다. 2001년 국제 표준으로 제정된 MPEG-7은 바로 이러한 이유로 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 본 논문에서 설계한 시스템은 MPEG-7에서 요구하는 내용기반 검색 방법인 하위 레벨 메타데이터들을 이용한 유사성 검색과 상의 레벨 메타데이터들을 이용한 키워드 검색 기능을 제공할 것이다. 또한, 상위 레벨 메타데이터와 하위 레벨 메타데이터들을 통합하여 검색하는 기능을 제공하여 사용자가 원하는 멀티미디어 정보를 보다 효율적으로 검색할 수 있도록 할 것이다.

  • PDF