• 제목/요약/키워드: 유사 키워드

검색결과 311건 처리시간 0.025초

TF-IDF와 KoBERT 모델을 이용한 인터넷 뉴스 신뢰도 판별 (Identification of Internet news reliability using TF-IDF and KoBERT models)

  • 김나현;서익원;김정현;손채영;유동영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.353-354
    • /
    • 2023
  • 디지털 환경이 진화함에 따라 가짜뉴스가 늘어나고 있다. 이를 판별하기 위해 법적 규제에 대한 논의가 있으나, 가짜뉴스에 대한 범위와 정의가 명확하지 않아 규제가 쉽지 않다. 본 논문에서는 이에 대한 대안으로 TF-IDF 기법과 KoBERT 모델을 이용한 키워드 추출 및 문장 유사도 분석을 통해 YouTube 플랫폼을 대상으로 한 가짜뉴스 판별을 위한 모델을 제안한다.

한국학 연구 논문의 텍스트 구조 기반 메타데이터 검색 시스템 개발 연구 (A Study on Developing a Metadata Search System Based on the Text Structure of Korean Studies Research Articles)

  • 송민선;고영만;이승준
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.155-176
    • /
    • 2016
  • 본 연구는 한국학 연구 논문 텍스트의 의미 구조를 기반으로 하는 메타데이터를 적용한 학술정보시스템을 구축하여 기존 유사 시스템과의 비교를 통해, 텍스트 구조 기반 메타데이터의 활용 가능성을 확인해 보고자 하는 것을 목적으로 한다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)에서 일정 기준을 충족하는 한국학 분야 연구 논문 데이터를 대상으로 의미 구조 메타데이터 항목을 적용한 시범적 검색 시스템(Korean Studies Metadata Database, KMD)을 구축하였으며, 동일한 검색 키워드를 적용하여 기존의 KCI 시스템과 비교했을 때 어떤 특징과 차이점을 갖는지 비교해 보았다. 연구 결과, KMD 시스템이 KCI에 비해 이용자의 검색 의도에 맞는 결과를 보다 효율적으로 보여주는 것으로 확인되었다. 즉 검색하고자 하는 키워드의 조합이나 조건식이 기존 시스템과 동일하더라도 검색 결과를 통해 최종적으로 연구 진행과 관련해 찾고자 하는 연구 목적, 연구의 대상 데이터나 시공간적 배경 등에 따른 검색 결과를 다양하게 보여줄 수 있는 것으로 나타났다.

검색 편의성 향상을 위한 패턴 분석 기반 질의어 확장 (Pattern Analysis-Based Query Expansion for Enhancing Search Convenience)

  • 전서인;박건우;남광우;류근호
    • 한국산업정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.65-72
    • /
    • 2012
  • 21세기 정보화시대에 정보자원의 양은 증대되고 있으며 필요한 정보를 손쉽게 취득하게 해주는 정보검색 시스템의 역할이 중요해지고 있다. 일반적으로 사용자가 원활한 검색을 하기 위해서는 검색하고자 하는 정보에 대한 충분한 사전 파악이 필요하며, 키워드를 식별하는 능력 또한 뛰어나야 한다. 하지만 대부분의 사용자들이 충분한 지식을 갖추고 검색을 수행하지 않으며 질의어에 적합한 효율적인 키워드를 연상하는데 많은 시간을 소비한다. 또한 여러 검색엔진에서 연관검색어 서비스를 제공하고 있지만 이는 검색어와 유사한 의미 내용이 대부분이며 사용자에게 맞는 확장/연관검색어를 제공하여 주지 못한다. 본 논문은 질의어 패턴 분석 기반의 사용자 확장 검색어 추출 및 추천을 통해 사용자의 검색 편의성을 제공하기 위한 시스템을 제안한다.

키 프레임의 주석과 비교 영역 학습을 이용한 비디오 검색 시스템의 구현 (Implementation of a Video Retrieval System Using Annotation and Comparison Area Learning of Key-Frames)

  • 이근왕;김희숙;이종희
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.269-278
    • /
    • 2005
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 본 논문에서는 사용자의 키워드 학습과 비교 영역 학습을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화된 비디오 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 색상 히스토그램 비교기법과 제안하는 비교 영역 학습 기법을 통해 가장 유사한 키 프레임을 검색한다. 설계하고 구현한 시스템은 실험을 통한 성능평가에서 $93\%$ 이상의 높은 정확도를 보였다.

  • PDF

특허 데이터 분석을 통한 헬스케어 기술 트렌드 연구 (A Study On the Healthcare Technology Trends through Patent Data Analysis)

  • 한정현;현영근;채우리;이기현;이주연
    • 디지털융복합연구
    • /
    • 제18권3호
    • /
    • pp.179-187
    • /
    • 2020
  • 지속적인 인구 증가율 하락에도 불구하고 평균 수명 상승에 따라 인구 고령화가 빠르게 진행되고 있는 사회환경에서 기술의 진화 및 소득 수준의 상승을 기반으로 건강과 삶의 질에 대한 관심이 증가하며 헬스케어 서비스 시장은 급속히 성장하고 있는 현실이다. 이에 본 연구에서는 2000년부터 2019년 10월까지 특허정보넷(KIPRIS)에 게재된 헬스케어 관련 한국과 미국의 특허데이터를 대상으로 Keyword를 추출한 후 빈도 분석, 시계열 분석, Keyword Network 분석을 수행하였으며, 이를 통하여 헬스케어 분야의 핵심 Keyword가 전통적인 의료 관련 Keyword에서 ICT관련 Keyword로 변화하고 있는 기술 트렌드가 파악되었다. 또한 미국과 비교하여 핵심 Keyword들이 55% 유사한 분포를 보이지만 특허생산량 면에서 절대적인 격차를 확인하였다. 향후에는 핵심 Keyword에 대하여 국내외 연구동향 등 다양한 자료를 분석하여 글로벌 시장에서 유의미한 시사점을 얻을 수 있는 연구를 진행하고자 한다.

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

텍스트마이닝을 활용한 "잊힐 권리"의 토픽 분석 (Topic Analysis of the "Right to be Forgotten" Using Text Mining)

  • 이소현;구본진
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.275-298
    • /
    • 2022
  • 본 연구는 잊힐 권리와 관련한 뉴스 기사와 학술지 게재 논문을 대상으로 텍스트마이닝 분석을 활용해 각 문서 내에 나타난 논점과 특성을 살펴보았다. 분석을 위해 '잊힐 권리'와 '잊혀질 권리' 키워드를 검색어로 하여 2010년부터 2020년까지의 데이터를 수집하였다. 수집된 데이터를 대상으로 키워드 분석과 토픽모델링 분석을 수행한 결과, 지난 10년간 뉴스 기사와 학술지 논문에서 다루어진 쟁점은 크게 다르지 않으며, 접근방법 또한 유사한 것으로 나타났다. 다만 뉴스 기사와 학술지 논문 간 비교를 통해 이들 간 공통적으로 나타나는 쟁점과 부분적인 쟁점의 차이가 있음을 확인하였다. 따라서 본 연구에서 도출된 쟁점을 중심으로 기록관리학 분야에서도 적극적인 논의가 이루어져야 할 필요가 있으며, 공통적인 쟁점들을 우선적으로 고려하되, 쟁점상 이견이 존재하는 경우, 이를 다각적으로 논의하는 것이 필요하다고 볼 수 있다. 본 연구는 국내 기록관리학계에서 잊힐 권리와 관련된 논의가 이루어지고 있지 않은 현재의 상황에서 기록관리학 분야에서 잊힐 권리의 의미와 향후 발생할 수 있는 이슈를 도출해볼 수 있었다는데 의의가 있으며, 본 연구의 결과를 중심으로 기록관리학 분야에서 잊힐 권리에 대한 다양한 논의가 이루어지기를 기대한다.

한국과 중국의 블렌디드 러닝 분야의 연구동향 비교 (Comparison of Research Trends in Blended Learning in Korea and China)

  • 현진용;박한우
    • 한국콘텐츠학회논문지
    • /
    • 제22권9호
    • /
    • pp.339-348
    • /
    • 2022
  • 블렌디드 러닝은 능동적 학습을 촉진하고 학생의 학습 효과를 향상하기 위해 교육에서 가장 많이 사용되는 방법의 하나로 꼽히며 대학이 학습자를 유치하는 가장 효과적인 방법의 하나로 간주한다. 이 논문은 문화차원 이론을 바탕으로 문화적으로 유사하면서도 차이점을 보유하고 있는 한중 양국에서 블렌디드 러닝이 이루어지는 연구 동향을 분석한다. 연구 방법은 키워드 분석 및 시각화를 이용하였고 데이터는 WoS, KISS, CNKI에서 1990년부터 2022년 6월까지 게재된 블렌디드 러닝 관련 논문을 수집하여 분석을 진행했다. 연구 결과에 따르면, 보편화된 연구주제였던 블렌디드 러닝이 코로나 발생 이후부터 다양한 연구 분야 클러스터가 형성되어 세분되고 있다. 한국과 중국도 글로벌 연구 동향과 흡사하면서 각자 색다른 연구 동향이 보인다. 문화차원이론으로 분석하면 특히 절제와 장기지향적인 공통된 패턴이 보인다. 이 연구의 기대효과는 국가 문화가 교육과 연구의 패턴을 형성하는데 어떤 역할을 하는지에 대해 파악할 수 있다는 것이다. 또한 다문화 교육환경 속에서 효과적인 학습효과를 지닌 블렌디드 러닝을 개발하는데 유의미한 시사점을 제시할 수 있다.

ITS를 위한 개인화 학습코스 추천 모델 개발 (Development of Personalized Learning Course Recommendation Model for ITS)

  • 한지원;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.21-28
    • /
    • 2018
  • 학습코스 선정에 많은 어려움과 시행착오를 겪고 있는 사용자들에게 수준별 학습코스를 제공하기 위해, ITS(Intelligence Tutoring System)를 위한 동적인 학습자 맞춤형 학습코스 추천 모델을 개발하였다. 이를 위해, 개인화 학습코스 추천모델에서는 먼저 학습자 프로파일을 분석하고, 단어별 가중치를 계산하여 핵심 키워드를 추출한다. 추출된 단어는 Cosine Similarity 기법을 통해 유사도를 측정하고, 최종적으로 유사도가 높은 상위 3개 과정이 학습자에게 추천된다. 추천모델의 효과를 분석하기 위해, 경기도 소재 교육기관에 추천모델을 적용하였고, 만족도 조사를 통하여 설문 항목별 평균, 표준편차, 왜도, 첨도 값을 계산하였다. 실험결과, 정확성, 새로움, 자기참조, 유용성에서 높은 만족도를 보였으며, 추천모델의 실효성을 검증했다. 본 연구는 그동안 국내 외에서 충분히 다뤄지지 않았던 기계학습 중심의 맞춤형 학습코스를 추천했다는 점에서 의미가 있다.

블로그 검색에서의 태그 계층구조를 이용한 포스트 군집화 (Post Clustering Method using Tag Hierarchy for Blog Search)

  • 이기준;김경민;이명진;김우주;홍준석
    • 한국전자거래학회지
    • /
    • 제16권4호
    • /
    • pp.301-319
    • /
    • 2011
  • 웹 3.0으로 진화중인 웹 환경 하에서 블로그는 사용자 주도적인 웹의 특성을 가장 잘 표현하는 집합체 중 하나로, 기존의 웹 정보자원과 구분되는 새로운 형태의 지식베이스로써의 역할을 담당하고 있다. 기존의 웹 정보자원들이 사이트 단위로 광범위한 주제를 다루었던 것에 반해, 블로그의 정보자원은 사용자의 관심사에 따라 특정 정보들이 블로그 단위로 밀집되어 있으며 또한 사용자 태깅에 의해 게시된 정보자원에 대한 분류기준을 가지고 있다. 본 연구에서는 이러한 블로그의 특징들을 이용하여 보다 좀 더 효과적인 정보검색에 활용하기 위하여 블로그의 제목 키워드나 태그를 활용하여 태그 계층구조를 만들고 그 계층구조를 적용한 포스트군집화 방법론을 개발하여 기존의 블로그 검색과는 다른 특성을 가진 검색결과를 제시하였다. 이를 위하여 블로그 태그간의 관계성이 반영된 태그 계층구조를 생성하고 태그 유사도에 따른 태그군집화 방법을 개발하였다. 본 논문은 제안된 방법론을 구현한 프로토타입 시스템을 통해 실제사례에서의 연구의 적용 가능성을 판단하였으며, 군집 유사도 평가기준인 CSIM(Cluster SIMilarity)을 사용하여 골든 스탠다드의 유사도 비교를 통해 개발된 방법론과 시스템의 성과를 평가하였다.