• 제목/요약/키워드: 검색어 추출

검색결과 328건 처리시간 0.246초

비감독 학습 기법에 의한 키워드 추출 (Keyword Extraction Using Unsupervised Learning Method)

  • 신성윤;백정욱;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.165-166
    • /
    • 2010
  • 명사 추출이란 문서 내에 존재하는 모든 명사를 찾아내는 작업으로서, 한국어 정보검색에서는 문서를 대표하는 색인어 또는 키워드로서 명사를 사용한다. 본 논문에서는 기 구축된 사전을 이용하여 키워드를 추출하는 방법을 제시한다. 이 방법은 불필요한 연산을 줄여서 수행 시간을 단축시켰다. 그리고 대용량의 문서에서도 정확도에 크게 영향을 미치지 않으면서 명사를 추출할 수 있다. 본 논문에서는 명사의 출현 특성을 이용한 명사 추출 방법 및 비감독 학습 기법에 의한 키워드 추출 방법을 제시한다.

  • PDF

KNetIRS : 키워드망을 이용한 정보검색 시스템 (KNetIRS : Information Retrieval System using Keyword Network)

  • 우선미;유춘식;이종득;김용성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2185-2196
    • /
    • 1997
  • 기존의 정보검색 시스템들은 질의가 정확하지 않더라도 원하는 정보를 검색할 수 있도록 하기 위해 시소리스 (thesaurus)를 사용했다. 그러나 시소러스를 구축하고 유지하는데 드는 비용이 매우 높고 검색에 있어서도 완전하다고 볼 수 없다. 그래서 본 논문에서는 이러한 문제점들을 해결하기 위하여 키워드망을 이용한 정보검색 시스템인 KNetIRS를 설계 및 구현한다. 키워드망은 문서로부터 직접 추출한 키워드들로 구성된다. KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 키워드망 브라우저(Keyword Network Browser)를 사용하여 질의를 확장하고, 분할 연산(spilt function)을 정의하여 "정보 검색", "정보", 그리고 "검색"과 같은 복합어에 관한 처리를 한다.

  • PDF

IFC 속성 데이터기반의 질의어 개발을 통한 모델 정보 검색 및 재생성 방안 (IFC Model Data Retrieval and Regeneration Method through Property Set-based Query Language)

  • 이상호;박상일;장영훈;최규원
    • 한국산학기술학회논문지
    • /
    • 제18권2호
    • /
    • pp.38-46
    • /
    • 2017
  • 본 연구에서는 Industry Foundation Classes (IFC)를 기반으로 토목 시설물 정보 모델을 생성하는 경우에 발생할 수 있는 정보 검색 및 모델 재생성의 어려운 점을 보완할 수 있는 질의어를 개발하였다. 이를 위하여 첫번째로, IFC에서 구조물을 나타내기 위한 요소와 속성을 다루는 부분, 그리고 이들을 연결해주는 요소의 관계를 분석하고 이에 따른 흐름을 분석하였다. 이를 통해 최종 사용자의 입장에서 IFC 파일 내에서의 속성, 객체 및 그에 따르는 연결에 대한 접근 및 파악이 매우 힘들 수 있음을 확인하였다. 둘째, 기존 Building Information Model Query Language (BimQL)의 방법을 참고하여 IfcPropertySet 중심의 질의 방식을 제시하고 이를 적용할 수 있는 독립 모듈을 개발하였다. 마지막으로 제시한 방법을 철도의 궤도 및 침목에 적용하여 사용자가 의도한 대로 효과적인 정보 추출 및 모델 재생성이 가능함을 확인하였다. 이러한 접근방법의 장점은 IFC 파일만을 대상으로 효과적인 정보의 검색이 가능하다는 점으로, 정보의 상호운용성의 이점을 극대화할 수 있다.

간호사의 직무 스트레스와 자기효능감 관련 연구에 대한 융합적 고찰 (Convergence Study of Relation between Job Stress and Self-efficacy of Nurses)

  • 문혜경;정미란;노원정
    • 융합정보논문지
    • /
    • 제9권3호
    • /
    • pp.146-151
    • /
    • 2019
  • 본 연구는 간호사의 직무 스트레스와 자기효능감과의 관계를 규명하기 위하여 관련 연구의 동향을 고찰하고 텍스트 네트워크 분석을 시행하였다. 선행문헌고찰을 위하여 국내 3곳, 국외 1곳의 데이터베이스를 이용하여 '간호사', '스트레스', '자기효능감', 'nurse', 'stress', 'self-efficacy'를 주요 검색어로 검색하였다. 총 18편의 논문이 대상 문헌으로 선정되었다. 이중 9편의 연구에서 간호사의 직무 스트레스와 자기효능감 간에 통계적으로 유의한 음의 상관관계가 있음을 보고하였다. 그러나 도구의 선택에 있어 번안자에 따라 문항을 선택적으로 사용하여 상이한 결과가 도출되어 동일한 도구를 사용한 다른 논문들과의 비교 분석이 어려웠다. 또한, 18편 논문의 초록에서 키워드를 추출하여 텍스트 네트워크 분석을 시행하였다. 출현 빈도수가 가장 높은 단어는 직무스트레스였고, 이를 기준으로 관계를 분석하였을 때 출현 빈도수가 높은 주요어는 자기효능감, 의료기관, 상관성이었다. 해당 주요어간의 관계를 명확하게 하기 위해 한국형 도구 개발을 통한 영향요인 탐색 연구 수행을 제언한다.

텍스트 영역에 대한 단어 단위 분할 시스템 (A System for the Decomposition of Text Block into Words)

  • 정창부;곽희규;정선화;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.293-296
    • /
    • 2000
  • 본 논문에서는 주제어 인식에 기반한 문서영상의 검색 및 색인 시스템에 적용하기 위한 단어 단위 분한 시스템을 제안한다. 제안 시스템은 영상 전처리, 문서 구조 분석을 통해 추출된 텍스트 영역을 입력으로 단어 단위 분할을 수행하는데, 텍스트 영역에 대해 텍스트 라인을 분할하고 분할된 텍스트 라인을 단어 단위로 분할하는 계층적 접근 방법을 사용한다. 텍스트라인 분할은 수평 방향 투영 프로파일을 적용하여 분할 지점을 구한다. 그리고 단어 분할은 연결요소들을 추출한 후 연결요소간의 gap 정보를 구하고, gap 군집화 기법을 사용하여 단어 단위 분한 지점을 구한다. 이때 단어 단위 분할의 성능을 저하시키는 특수기호에 대해서는 휴리스틱 정보를 이용하여 검출한다. 제안 시스템의 성능 평가는 50개의 텍스트 영역에 적용하여 99.83%의 정확도를 얻을 수 있었다.

  • PDF

국가R&D정보를 활용한 기업 대표 키워드 DB 구축 방법 (Enterprise Representative Keyword Database Construction from National R&D Information Collection)

  • 한희준;김병정;최희석;김재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.279-280
    • /
    • 2014
  • 기업이 원하는 R&D정보를 추출하기 위해서는 R&D정보 검색에 활용할 질의어가 있어야 한다. 먼저 구축되어야 한다. 기업마다 관심있는 제품과 기술 키워드가 각각 다르다. 기업에 적합한 R&D정보를 생성하기 위해 질어어로 사용될 기업을 대표하는 키워드 군을 생성하고자 한다. 본 논문에서는 2002년부터 기업이 수행한 국가 R&D과제정보와 과제에서 도출된 논문, 특허, 연구보고서 등 성과정보로 부터 기업을 대표하는 키워드를 추출하고 이를 웹에서 크롤링한 기업정보와 비교하여 기업 대표 키워드 데이터베이스를 구축하는 방안에 대해 논한다.

  • PDF

설계 의미를 사용한 설계내역의 검색 방법 (Retrieval Method of Software Contents using Design Semantics)

  • 배명남;최완;양재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.525-527
    • /
    • 1999
  • 사용자가 저장소내의 특정 내역을 파악하기 위해서는 내역에 대해 다양한 형식과 의미 표현이 필요하다. 이를 위해, 사용자가 사용할 수 있는 기본 연산인 추출 및 관계 함수들을 제공하고 있다. 그러나, 사용자가 부품 저장소내에 내역의 저장 구조를 파악하고, 복잡하게 형식화 되어 있는 내역간의 관계에 대한 요구를 추출 및 관계 함수들의 조합으로 명세하는 것은 매우 어렵다. 따라서, 본 논문에서는 설계 정보 자체와 그들간의 의미 정보들에 대해, 추상화된 인식 모델을 제공하고, 이 모델위에서 내역의 의미 표현에 적합하고, 사용자에게 친숙한 질의어를 제안한다.

  • PDF

심미적 인상을 이용한 이미지 검색에 관한 실험적 연구 (An Exploratory Study of Image Retrieval Using Aesthetic Impressions)

  • 유소영;문성빈
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.187-208
    • /
    • 2004
  • 이 연구에서는 심미적 인상을 이미지 검색의 고수준 자질로 이용하였다. '심미적'이라는 용어는 심리학, 예술, 문학 등에서 연구되어 왔다. 이 용어는 시각적 지각과 감정의 무의식적이고 즉각적인 측면을 의미한다. 심미적 인상과 관련된 문헌 연구를 통해 4 가지 종류의 심미적 인상을 조작적으로 정의하였다: 강한 인상, 부드러운 인상, 중후한 인상, 세련된 인상. 66개의 회화 이미지 파일을 1,000개의 회화 이미지 중에서 무작위로 추출하였으며 시지각 색상 모형을 이용하여 이 이미지 파일들로부터 저수준 색상 자질을 추출하였다. 이미지의 고수준 자질인 4가지 종류의 심미적 인상은 4명의 평가자가 리커트 7점 척도로 평가한 것을 평균내었다. 검색 실험에서 2명의 피험자는 심미적 인상이나 주제어에 대한 예제 이미지 질의를 이용해서 이미지 검색을 수행하였다. 피험자들은 심미적 인상 기반 이미지 검색 시스템에 대해서 보통 정도의 수준으로 만족했다. 그리고 색상 자질과 심미적 인상 자질을 모두 이용한 이미지 검색의 R-정확률이 색상 자질만을 이용한 이미지 검색의 R-정확률보다 높았다. 그러나 이 연구결과의 일반화를 위해서는 큰 실험 집단을 대상으로 보다 많은 검색 질의를 통한 추후 연구들이 필요할 것으로 생각된다.

사용자 영화평의 감정어휘 분석을 통한 영화검색시스템 (Movie Retrieval System by Analyzing Sentimental Keyword from User's Movie Reviews)

  • 오성호;강신재
    • 한국산학기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.1422-1427
    • /
    • 2013
  • 본 논문에서는 사용자가 작성한 영화평으로부터 추출한 감정어휘에 기반한 영화검색시스템을 제안한다. 먼저, 사용자의 영화평을 형태소분석하고 수작업으로 감정어휘사전을 구축한다. 그 다음, 검색의 대상이 되는 영화별로 감정어휘사전에 포함되어 있는 감정어휘들의 가중치를 TF-IDF를 이용하여 계산한다. 이러한 결과를 이용하여 제안 시스템은 영화의 감정 분류를 결정하고, 랭킹하여 사용자에게 보여주게 된다. 사용자들은 영화평을 읽지 않고도, 감정 어휘로 구성된 질의어를 입력하여 원하는 영화를 찾을 수 있게 된다.

빅데이터를 활용한 여수관광 활성화 방안 (Methods to Propel Tourism of Yeosu City Using Big Data)

  • 임양의;김강철
    • 한국전자통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.739-746
    • /
    • 2020
  • 2016년 세계 경제포럼에서 처음 소개된 4차 산업혁명은 빅데이터 분석, 사물인터넷, 인공 지능 등의 핵심 정보통신 기술의 변화뿐만 아니라 관광 업계에도 엄청난 파급 효과를 가져 오고 있다. 본 연구는 빅데이터 분석과 설문조사를 통하여 여수시의 관광활성화 방안을 제시한다. 소셜 메트릭스를 사용하여 여수 관광에 대하여 감성어와 긍부정 추이를 추출하고, 네이버 데이터랩을 사용하여 여수 관광에 관련된 키워드를 추출하여 R 언어로 시각화하였다. 그리고 여수지역을 방문하는 493명의 여행객의 설문조사를 바탕으로 SPSS를 사용하여 빈도, 요인, 차이, 상관관계 및 회귀분석을 수행하였다. 여수 여행과 해양 케이블카의 감성어 분석에서는 긍정이 부정보다 월등히 많았다. 설문조사 분석에서 여수지역이 여수 관광 만족도와 활성화에 유의미하고, 연령별로 선호하는 관광지와 검색 기기가 다르다는 것을 확인하였다. 빅데이터 분석과 설문조사에서 관광객들은 함께 즐기면서 힐링 할 수 있는 해양공원 같은 소프트 컨텐츠가 있는 관광지를 선호한다는 것을 보여주었다.