• 제목/요약/키워드: 키워드검색기법

검색결과 254건 처리시간 0.027초

효과적인 e-learning 콘텐츠 생성 및 관리기법에 관한 연구 (A Study on an Efficient e-learning Content Creation and Maintenance Method)

  • 조수현;김영학;김명환
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.15-25
    • /
    • 2008
  • 최근에 e-learning의 사용이 증대되면서 교수자들은 다양한 콘텐츠를 사용하여 새로운 온라인 강의 코스를 개발하고 그 결과를 자신의 컴퓨터에 저장한다. 이러한 콘텐츠들은 시간이 지나감에 따라 새로운 정보로 갱신되어야하고, 또한 새로운 콘텐츠가 이들 콘텐츠를 재 사용하여 제작될 수 있다. 그러나 교수자들이 자신의 컴퓨터에서 여기저기에 저장된 콘텐츠를 찾고 편집하고 관리하는 일은 많은 시간을 요구한다. 현재 PC환경에서 이러한 기능을 효과적으로 수행하는 e-learning 콘텐츠 관리 도구의 개발은 아주 미흡한 실정이다. 따라서 본 논문에서는 교수자의 컴퓨터에 분산되어 저장된 다양한 콘텐츠들을 효과적으로 관리하고 새로운 강의 코스를 쉽게 개발할 수 있는 e-learning콘텐츠 생성 및 관리 시스템을 제안하였다. 제안된 시스템은 PC환경을 기반으로 하는 교수자들의 콘텐츠 개발에 널리 사용될 수 있다. 본 논문에서는 성능 평가를 위해 콘텐츠 키워드의 검색 시간에 따라 본 시스템을 이전 시스템과 비교하였으며, 실험 결과 이전 시스템보다 훨씬 더 좋은 결과를 보였다.

  • PDF

비정형 Security Intelligence Report의 정형 정보 자동 추출 (An Automatically Extracting Formal Information from Unstructured Security Intelligence Report)

  • 허윤아;이찬희;김경민;조재춘;임희석
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.233-240
    • /
    • 2019
  • 사이버 공격을 예측하고 대응하기 위해서 수많은 보안 기업 회사에서는 공격기법의 특성, 수법 유형을 빠르게 파악하고, 이에 대한 Security Intelligence Report(SIR)들을 배포한다. 하지만 각 기업에서 배포하는 SIR들은 방대하며, 형식이 맞춰져 있지 않다. 본 논문은 대량의 비정형한 SIR들에서 정보를 추출하는데 소요되는 시간을 줄이고 효율적으로 파악하기 위해 SIR들에 대해 정형화하고 주요 정보를 추출하기 위해 5가지 분석기술이 적용된 프레임워크를 제안한다. SIR들의 데이터는 정답 라벨이 없기 때문에 비지도 학습방식을 통해 키워드 추출, 토픽 모델링, 문서 요약, 유사문서 검색 총 4가지 분석기술을 제안한다. 마지막으로 SIR들에서 위협 정보 추출하기 위해 데이터를 구축하였으며, 개체명 인식 기술에 적용하여 IP, Domain/URL, Hash, Malware에 속하는 단어를 인식하고 그 단어가 어떤 유형에 속하는지 판단하는 분석기술을 포함한 총 5가지 분석기술이 적용된 프레임워크를 제안한다.

텍스트 마이닝을 활용한 '가상관광'의 코로나19 전후 트렌드 분석 및 방향성 제언 (A Suggestion and an analysis on Changes on trend of the 'Virtual Tourism' before and after the Covid 19 Crisis using Textmining Method)

  • 성윤아
    • 한국융합학회논문지
    • /
    • 제13권4호
    • /
    • pp.155-161
    • /
    • 2022
  • 코로나19의 확산으로 '가상관광'이 주목받고 있다. 포털 뉴스를 대상으로 '가상관광'을 키워드로 검색하여 데이터 마이닝 기법인 로그오즈비 분석, 명사 빈도분석, 의미망 분석을 통해 추이와 방향성을 고찰하였다. 그 결과, 코로나19 이전부터 '체험'과 '기술'기반의 '가상관광'에 주목하고 있었으며, '콘텐츠의 다양성 확보'에서 코로나19 이후 '지역 경제의 회복을 위한 사업'으로 바뀌었다는 점과 '온라인' 기반의 '상호작용'이 가능한 '가상현실' '확장현실' 등의 정보통신기술 의존성이 커졌다는 점을 명확히 할 수 있었다. 메타버스 등 '가상공간'에 대한 수요가 확대되고 있으므로 정부는 조사결과에 기초한 지원계획과 정책을 수립하고, 지자체와 기업은 AISAS(Attension, Interest, Search, Action, Share)에 주목하여 차별적 콘텐츠를 기획·제작하며, 대학과 연구기관은 콘텐츠에 맞는 기술을 개발하여 적용, 평가, 실용화함으로써 경제적, 체계적, 순환적 구조가 이루어질 수 있도록 해야 한다.

의료 산업에 있어 현대인의 비대면 의학 상담에 대한 관심도 분석 기법 (Analysis of interest in non-face-to-face medical counseling of modern people in the medical industry)

  • 강유성;박종훈;오하영;이세욱
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1571-1576
    • /
    • 2022
  • 코로나 바이러스의 발병 이후, 의료 산업은 침체기에 들어섰으며, 이에 대한 대응책으로 정부는 일시적으로 비대면 진료를 허용한 상태이다. 본 연구에서는, 이런 시대 흐름에 맞추어 의료 산업에 있어 현대인의 비대면 의학상담에 대한 관심도를 분석하고자 한다. 전문가에게 의학상담을 받을 수 있는 플랫폼인 지식인과, 유튜브 두가지 소셜 플랫폼에서 빅데이터를 수집해 연구를 진행했다. 전화 상담 상위 5개 키워드인 "내과", "일반의", "산경과", "정신건강의학과", "소아청소년과"와 더불어, "전문의", "의학상담", "건강정보" 총 8개의 검색어를 가지고 각 플랫폼으로부터 데이터 세트를 구축했다. 이후 크롤링 된 데이터를 바탕으로 형태소 분류, 질병 추출, 정규화 등 전처리 과정을 거쳤다. 단어 빈도수를 기준으로 한 워드 클라우드, 꺾은선 그래프, 분기별 그래프, 질병 등장 빈도별 막대 그래프 등으로 데이터 시각화를 하였다. 유튜브 데이터에 한해 감성 분류 모델을 구축하였고, GRU와 BERT 기반 모델의 성능을 비교하였다.

텍스트마이닝을 활용한 국내외 기록서비스 연구동향 분석 (Analysis of Research Trends on Archival Information Services Using Text Mining)

  • 박서희;이혜은
    • 한국기록관리학회지
    • /
    • 제24권1호
    • /
    • pp.89-109
    • /
    • 2024
  • 본 연구는 국내외 기록정보서비스의 연구 동향을 분석한 것으로 2003년부터 2022년까지 한국학술지인용색인(KCI)에 수록된 학술논문 136편과 LISTA(Library, Information Science & Technology Abstracts)에 수록된 학술논문 74편을 대상으로 연도별, 연구 유형별, 연구자 유형별, 연구 대상별, 연구목적별 현황을 살펴보았다. 또한 텍스트마이닝 기법을 적용하여 빈도분석, 동시출현 빈도분석, 중심성분석, 토픽모델링을 진행하였다. 연구의 결과 국내 논문은 특정 기관이나 기록물에 집중되었고 이용자 중심의 만족도조사 연구, 콘텐츠 중심의 연구 등이 진행되었다. 국외논문은 아키비스트와 이용자 간의 관계를 연구하는 흐름과 함께 평가 중심의 연구, 자료·자원·컬렉션 등의 정보제공 연구가 다수 진행되었음을 확인하였다. 정보자원의 관리는 국내외 논문 공통의 토픽으로 확인되었으나 국내는 정보자원의 품질 유지를, 국외는 정보의 저장과 검색에 집중된 연구 흐름을 파악할 수 있었다.

비정형 빅데이터의 실시간 복합 이벤트 탐지를 위한 기법 (The Method for Real-time Complex Event Detection of Unstructured Big data)

  • 이준희;백성하;이순조;배해영
    • Spatial Information Research
    • /
    • 제20권5호
    • /
    • pp.99-109
    • /
    • 2012
  • 최근 소셜 미디어의 발달과 스마트폰의 확산으로 SNS(Social Network Service)가 활성화가 되면서 데이터양이 폭발적으로 증가하였다. 이에 맞춰 빅데이터 개념이 새롭게 대두되었으며, 빅데이터를 활용하기 위한 많은 방안이 연구되고 있다. 여러 기업이 보유한 빅데이터의 가치창출을 극대화하기 위해 기존 데이터와의 융합이 필요하며, 물리적, 논리적 저장구조가 다른 이기종 데이터 소스를 통합하고 관리하기 위한 시스템이 필요하다. 빅데이터를 처리하기 위한 시스템인 맵리듀스는 분산처리를 활용하여 빠른게 데이터를 처리한다는 이점이 있으나 모든 키워드에 대해 시스템을 구축하여 저장 및 검색 등의 과정을 거치므로 실시간 처리에 어려움이 따른다. 또한, 이기종 데이터를 처리하는 구조가 없어 복합 이벤트를 처리하는데 추가 비용이 발생할 수 있다. 이를 해결하는 방안으로 기존에 연구된 복합 이벤트 처리 시스템을 활용하여 실시간 복합 이벤트 탐지를 위한 기법을 제안하고자 한다. 복합 이벤트 처리 시스템은 서로 다른 이기종 데이터 소스로부터 각각의 데이터들을 통합하고 이벤트들의 조합이 가능하며 스트림 데이터를 즉시 처리할 수 있어 실시간 처리에 유용하다. 그러나 SNS, 인터넷 기사 등 텍스트 기반의 비정형 데이터를 텍스트형으로 관리하고 있어 빅데이터에 대한 질의가 요청될 때마다 문자열 비교를 해야 하므로 성능저하가 발생할 여지가 있다. 따라서 복합 이벤트 처리 시스템에서 비정형 데이터를 관리하고 질의처리가 가능하도록 문자열의 논리적 스키마를 부여하고 데이터 통합 기능을 제안한다. 그리고 키워드 셋을 이용한 필터링 기능으로 문자열의 키워드를 정수형으로 변환함으로써 반복적인 비교 연산을 줄인다. 또한, 복합 이벤트 처리 시스템을 활용하면 인 메모리(In-memory)에서 실시간 스트림 데이터를 처리함으로써 디스크에 저장하고 불러들이는 시간을 줄여 성능 향상을 가져온다.

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)

  • 감미아;송민
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.53-77
    • /
    • 2012
  • 본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.

문서분류를 위한 의미적 주제선정방법 (Semantic Topic Selection Method of Document for Classification)

  • 고광섭;김판구;이창훈;황명권
    • 한국정보통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.163-172
    • /
    • 2007
  • 웹은 전세계 규모의 네트워크로써 문자, 화상, 음성 등의 미디어 정보들을 페이지 단위로 관리되며, 링크를 이용하여 분산된 정보들을 연결하고 있다. 이러한 웹의 지속적인 발전으로 무수한 정보들을 축적하고 있으며, 그 중 텍스트로 구성된 문서들이 주를 이룬다. 사용자는 이렇게 많은 정보들 중에서 자신이 원하는 특정 정보를 찾기 위해 웹을 사용한다. 그래서 웹은 사용자 요구에 적합한 정보를 검색해 주기 위해 계속적인 시도와 많은 연구들로 발전되고 있다. 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등 기존의 방법들은 문서의 의미적인 주제나 특징을 정확하게 처리 할 수 없어 사용자는 재검색을 해야 하는 문제점을 갖는다. 특히, 국내 문서 분류를 위한 연구는 많이 이루어지지 않아 검색에 더욱 어렵다. 이러한 문제점을 보완하기 위해 본 논문에서는 국내문서의 효율적이고 의미적인 분류를 위해 출현 개념의 TF(Term Frequency)와 주변 개념들과의 관계된 정도(RV : Relation Value)를 추출한다. 그리고 추출된 키워드들을 국내 어휘 사전인 U-WIN에 매핑하여 문서의 주제를 선택하고 본문에서 제 시하는 분류방법에 의해 웹 문서를 분류한다. 이는 문서 내 개념들의 관계를 이용하여 문서의 주제를 선정하고 문서의 의미적인 분류를 가능하게 한다.

허혈성 뇌졸중에서 심혈관 질환과 심방세동을 위한 혈청 바이오마커: 체계적 문헌 고찰과 메타분석 (Serum Biomarkers for Cardiovascular Disease and Atrial Fibrillation in Ischemic Stroke: A Systematic Review and Meta-Analysis)

  • 우명수;문소라;이지영
    • 대한임상검사과학회지
    • /
    • 제54권4호
    • /
    • pp.256-264
    • /
    • 2022
  • 허혈성 뇌졸중은 뇌동맥의 혈전이나 색전에 의해 폐색되어 산소가 포함된 혈액이 뇌에 도달하는 것을 방지하고, 신경 세포의 괴사를 유발하는 것이다. 본 연구의 목적은 지금까지 연구된 허혈성 뇌졸중의 조기 진단을 가능하게 하는 심혈관 질환 및 심방세동 질환과 관련된 혈청 후보 마커를 정리하고, 각 마커의 OR을 비교 분석하는 것이다. 본 연구에서는 메타분석 기법을 이용하여 혈청 후보 마커의 효과 크기를 분석하고자 하였다. '심혈관질환', '심방세동', '허혈성 뇌졸중', '혈청 표지자'를 키워드로 포함하는 논문에 대한 학술 Database 검색에서 추출된 데이터는 모두 허혈성 뇌졸중 환자에 대한 결과로 제한하였다. 이 연구에서 가장 많이 검색된 마커는 NT-proBNP, D-dimer, CRP 및 GFAP 등으로 나타났다. 결론적으로, NT-proBNP는 허혈성 뇌졸중의 조기 진단에 매우 유용한 것으로 보이며, 특히 심방세동(AF)의 표지자로 알려져 있으며, 앞으로 더 많은 심방세동 표지자가 발굴되어 연구되어야 할 것이다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.