• 제목/요약/키워드: 키워드 추출 방법

검색결과 355건 처리시간 0.034초

자연영상에서 한글 자소 구조 및 유형 특징을 이용한 문자 영역 검출 (Character Region Detection Using Hangul Character Structure and Class Feature in Natural Images)

  • 박종천;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 춘계학술논문집 1부
    • /
    • pp.396-399
    • /
    • 2011
  • 모바일 기기의 보급이 확대됨으로서 모바일 기기에 내장된 카메라로 획득한 영상을 처리하는 다양한 종류의 응용프로그램이 개발되어 사용되고 있다. 대표적인 응용프로그램은 카메라로 찍은 영상의 사물 검색결과를 인터넷 검색엔진과 연계함으로서 키워드 입력 없이 검색할 수 있도록 하는 것이다. 본 연구는 그 중에서 한글 문자가 포함된 영상을 대상으로 영상검색 수행하는 연구로서 영상에서 한글 문자 영역을 검출하는 방법을 제안하였다. 한글 문자 구조 특징으로 한글 자소를 병합하여 후보 문자 영역을 추출하고 병합된 후보 문자 영역을 한글 6가지 문자 유형 특징을 기반으로 문자 영역을 여부를 판별함으로서 최종적인 문자 영역을 검출한다. 실험결과 문자영역 재현률이 향상됨을 알 수 있었다.

  • PDF

XML 기반 교수-학생 학습지도 시스템 (Lesson Plan System for Teacher-Student Based on XML)

  • 최문경;김지영;김행곤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.406-408
    • /
    • 2002
  • 컴퓨터 기술의 발전과 네트워크의 급속한 확산으로 사회전반에 걸쳐 특허, 기업뿐 아니라 교육 현장의 효율화를 지원하기 위한 분야에서도 웹이 응용되고 있다. 교육 현장에서 작성되어지고 있는 문서 중 학습 지도안 작성은 교육 정보의 체계적인 제공이 미흡하고, 많은 시간과 노력이 요구되는 활동이므로 교수 개인이 모든 교수 활동에 필요한 지도안을 작성하는데는 어려움이 있다. 이를 위해, 웹에서 정보를 공유하여 문서의 재사용성을 높일 수 있는 시스템이 필요하게 되었다. 웹에서 표준화된 XML을 이용하여 문서의 생성과 검색, 그리고 재사용이 가능하도록 제공함으로써 교수자의 다양한 요구사항을 융통성 있게 수용할 수 있다. 본 논문에서는 학습지도안 시스템을 분석하여 공통DTD(Document Type Definition)를 생성하고 공통 DTD를 통해 표준화된 XML 문서를 제공한다. 좀더 효율적인 수업을 위해 학습지도안 작성이 용이하도록 학습지도안 작성용 에디터를 제공하며, 또한 XML DOM(Document Object Model)을 이용하여 검색기에서는 구조기반, 패싯, 키워드 검색 방법을 제시하고, 등록기에서는 DOM을 이용하여 해당 데이터를 추출하고 DB에 등록한다. 이는 문서의 재사용성을 높일 수 있다. 따라서, XML을 학교 현장에서 이용함으로써 웹에서 정보의 공유를 원활히 하고, 문서 작성의 효율성을 높이고자 한다.

  • PDF

단백질 상호작용 관계의 상동성 기반 검증 (A Homology-Based Verification of Protein Interaction Relationships)

  • 최재훈;박종민;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2005
  • 본 논문에서는 생물학적 실험에 의해 추출된 특정 종의 단백질 상호작용 관계를 다른 여러 종에서 이미 밝혀진 단백질 상호작용 관계들을 통해 검증할 수 있는 방법을 제안한다. 이 검증을 위해 기본적으로 요구되는 이종간 단백질들 사이의 상동성 관계는 Swiss Prot 데이터베이스의 모든 단백질들에 대해 이름 패턴, 키워드, 서열 비교를 통해 구축된다. 즉, 특정 종에 대한 단백질 상호작용 관계를 여러 종의 단백질 상호작용 관계들로 상동화하고, 이 상동화된 관계들이 각각의 종에 어떠한 형태로 존재하는지의 여부를 판단함으로써 검증된다.

  • PDF

빅 데이터의 분석을 통한 정보 자동 요약 시스템 (Automatic Information Summary System using by Big Data Analysis)

  • 윤다영;이현화;송재오;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.415-416
    • /
    • 2014
  • 오늘날 인터넷상에서는 무수히 많은 디지털 데이터가 생성되고 있으며, 그 디지털 데이터는 기존의 소프트웨어로는 처리할 수 없을 정도로 그 양이 방대해지고 있다. 이러한 데이터들을 사용자의 검색의도에 따라 문장 분석, 키워드 추출, 요약문 생성 등의 방법을 통하여, 사용자에게 개인화된 정보를 제공하기 위한 빅 데이터의 분석을 이용한 정보 자동 요약 시스템을 제안한다.

  • PDF

하이퍼미디어를 이용한 통합OPAC구현에 관한 연구 (A Study on Development of Intergrated OPAC Using Hypermedia)

  • 안태경;김현희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1995년도 제2회 학술대회 논문집
    • /
    • pp.51-54
    • /
    • 1995
  • 본 연구에서 구축하고자 하는 통합OPAC은 특정 주제의 문헌정보원, 전문가정보원, 통계정보원을 제시해 주는 참고봉사 전문가 시스템, 온라인 열람목록(OPAC), 이용 안내, 외부데이타베이스의 검색 모듈이 결합된 시스템이다. 지식베이스는 문헌정보원 지식베이스, 전문가정보원 지식베이스, 통계정보원 지식베이스로 구성된다. 지시베이스의 추론방법은 전진추론(forword chining) 방식을 채택하였다. 시스템의 구현 환경은 먼저 하드웨어는 IBM 호완기종의 개인용 컴퓨터들(IBM386-DX33이상)을 사용하고 시스템 개발도구로는 전문가시스템과 하이퍼텍스트가 결합된 쉘(shell)인 KPWin++를 이용하였고 문헌정보원, 전문가정보원, 통계정보원에서의 키워드추출 등 정보처리 작업은 터보C를 사용하였다.

  • PDF

정보검색기반 질의응답 시스템 설계 (Design of a QA System based on Information Retrieval)

  • 김민경;안혁주;김학수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.816-818
    • /
    • 2015
  • 본 논문에서는 질의유형을 통한 검색기반 질의응답 시스템을 구현하기 위한 설계방법을 제안한다. 이를 위해 위키피디아 문서의 링크 데이터를 이용하여 색인 대상문서와 데이터베이스를 구축하는 색인 모델과 2-포아송 모델을 이용하여 얻은 문서들을 색인 데이터베이스를 통해 필터링하여 정답 후보문장을 추출하는 검색모델, 키워드 패턴 매칭 기반 질의유형 분류 모델을 설계하였다.

Jsoup를 이용한 조선왕조실록의 빅 데이터 분석 (Big Data Analysis of the Annals of the Joseon Dynasty Using Jsoup)

  • 변영일;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.131-133
    • /
    • 2021
  • 조선왕조실록은 UNESCO에 등재된 중요한 기록물이다. 본 논문은 한글로 번역된 조선왕조 실록에서 단어의 빈도수를 조사하여 빅데이터를 분석하는 방법을 제안한다. 조선왕조 실록을 인터넷 사이트에서 액세스하여 단어의 빈도수를 조사하려 할 때, 그 페이지에 포함된 소스를 직접 액세스하면 HTML 문법에 필요한 키워드가 포함되어 있어 필요한 본문에서 단어 빈도수에 의한 빅데이터 분석을 하는 것이 어렵다. 본 논문에서는 Java의 Jsoup를 활용한 크롤링 기능을 사용하여 조선왕조 실록의 본문을 분석하는 방법을 제안한다. 실험에서는 조선왕조실록의 태조부분만을 추출하여 본 방법의 유효성을 검증하였다.

  • PDF

위치기반 소셜 미디어 데이터의 텍스트 마이닝 기반 공간적 클러스터링 분석 연구 (Spatial Clustering Analysis based on Text Mining of Location-Based Social Media Data)

  • 박우진;유기윤
    • 대한공간정보학회지
    • /
    • 제23권2호
    • /
    • pp.89-96
    • /
    • 2015
  • 위치기반 소셜 미디어 데이터는 빅데이터, 위치기반서비스 등 다양한 분야에서 활용가능성이 매우 큰 데이터이다. 본 연구에서는 위치기반 소셜 미디어 데이터의 텍스트 정보를 분석하여 주요한 키워드들이 공간적으로 어떻게 분포하고 있는지를 파악할 수 있는 일련의 분석방법론을 적용해보았다. 이를 위해, 위치태그를 지닌 트윗 데이터를 서울시 강남지역과 그 주변지역에 대하여 2013년 8월 한달 간 수집하였으며, 이 데이터를 대상으로 하여 텍스트 마이닝을 통해 주요 키워드들을 도출하였다. 이러한 키워드들 중 음식, 엔터테인먼트, 업무 및 공부의 세 카테고리에 해당하는 키워드들만 추출, 분류하였으며 각 카테고리에 해당하는 트윗 데이터들에 대해서 공간적 클러스터링을 실시하였다. 도출된 각 카테고리별 클러스터들을 실제 그 지역의 건물 또는 벤치마크 POI들과 비교한 결과, 음식 카테고리 클러스터는 대규모 상업지역들과 일치도가 높았고 엔터테인먼트 카테고리의 클러스터는 공연장, 극장, 잠실운동장 등과 일치하였다. 업무 및 공부 카테고리 클러스터들은 학원 밀집지역 및 사무용 빌딩 밀집지역과 높은 일치도를 나타내었다.

블로그 마이닝을 활용한 행복주택의 인식 분석 (Analysis of Perception on Happy Housing Using Blog Mining Technique)

  • 황지현
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.211-223
    • /
    • 2022
  • 본 연구는 주거정책 분야에서 여론을 수렴하기 위해 블로그의 활용 가능성을 고찰하고자 한다. 이를 위해 '행복주택'을 키워드로 관련 게시글을 수집하고 주요 키워드를 추출하여 키워드 분석과 단어 군집 분석을 통해 대중들의 인식을 파악하였다. 행복주택에 대한 사회적 논의가 확산된 2013년 5월부터 2021년 8월까지 블로그 게시글 137,002개를 분석 자료로 활용하였으며, 주요 정책과 자료 수집량을 고려하여 수집 기간을 3단계로 나누어 도출된 단어를 분석한 결과는 다음과 같다. 키워드 분석에서 전반적으로 행복주택의 위치, 세대수, 단지 및 주택 규모, 입주 가능 조건 등과 관련된 단어의 중요도가 높았다. 1단계에서는 정부 정책 시행, 2단계에서는 행복주택 신청 절차, 3단계에서는 모집공고, 입주 자격, 임대조건에 중요도가 각각 높은 것으로 나타났다. 군집 분석에서는 모든 단계에서 사업 진행, 신청 절차, 사업지역이 주요 주제로 도출되었다. 특히, 1단계에서는 정책 시행 및 추진방안, 2단계는 입주 자격 및 금융 지원, 3단계에서는 정책 시행 및 입주 자격이 주요한 주제로 도출되었다. 이러한 결과는 블로그를 통해 정책 관련 정보 공유 및 사회적 이슈 반영, 정책 전달 여부 평가, 대중의 정책 참여도 유추가 가능하며, 블로그를 여론 수렴 방법으로 활용할 가능성을 제시한 데에 의의가 있다.

아동의 작업 연구주제어의 사회연결망 분석 (Social Network Analysis on Research Keywords of Child-Occupation Studies)

  • 하성규;박강현
    • 재활치료과학
    • /
    • 제12권4호
    • /
    • pp.39-51
    • /
    • 2023
  • 목적 : 본 연구는 국내 학술지를 대상으로 아동의 작업과 관련된 연구주제어의 사회연결망 분석을 통해 아동의 작업과 관련된 연구들의 지적 구조를 규명하고자 한다. 연구방법 : 2003년 8월부터 2023년 8월까지 한국학술지인용색인(Korean Citation Index)에 "아동 and 작업" 키워드를 가진 270편의 연구에서 3,364개의 키워드를 추출하여 분석하였다. 분석도구는 넷마이너(NetMiner) 프로그램을 활용하였다. 결과 : 연구 시기별 아동의 작업 관련 연구주제어의 변화는 없었으며 다만 과거 10년에는 97편의 연구가 있었고 최근 10년에는 173편의 연구가 게재되어 양적 변화가 있었다. 아동의 작업 관련 주제어에서 가장 높은 연결 중심성(degree centrality)을 가진 단어는 Task (0.055), Group therapy (0.040), Working memory (0.037), Intervention (0.033), Performance (0.030), Language (0.026), Ability (0.026), Skill (0.024), Program (0.023) 순이었다. 단어동시 발생 네트워크(Word network)에서 가장 가중치가 높은 단어는 Evaluation-Tool (30), School-Student (15), Activity-Participation (15)이었고, topic modeling에서 각 주제들의 첫 번째 키워드는 Activity (0.295), Disability (0.604), Education (0.356), Skill (0.478), School (0.317), Function (0.462), Disorder (0.324), Language (0.310), Comprehension (0.412), Training (0.511)으로 나타났다. 결론 : 본 연구는 국내 아동의 작업 관련 연구 분야의 경향을 설명했다. 따라서 국외와 국내 연구 흐름을 비교하는 후속 연구가 뒤따라야 할 것이며, 이러한 노력은 국내 연구와 국외 연구의 격차를 해명함으로써 국내 아동의 작업관련 연구 분야에 대한 귀중한 통찰력을 제공할 것이다.