• Title/Summary/Keyword: 유사 키워드

Search Result 312, Processing Time 0.027 seconds

딥러닝을 이용한 강좌 추천시스템 (Course recommendation system using deep learning)

  • 임민아;황승연;신동진;오재곤;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.193-198
    • /
    • 2023
  • 딥러닝을 이용한 학습자 맞춤 강의 추천 프로젝트를 연구한다. 추천시스템은 웹과 앱에서 쉽게 발견할 수 있으며 이 특성을 이용한 예제는 사용자 클릭으로 특성 영상 추천과 SNS에서 평소 사용자가 관심 있던 분야의 아이템을 광고하는 것이 있다. 본 연구에서는 문장 유사도인 Word2Vec를 주로 이용하여 2번의 필터링을 거쳤으며 Surprise 라이브러리를 통해 강좌 추천을 하였다. 이러한 시스템으로 사용자에게 간편하고 편리하게 원하는 분류의 강좌 데이터를 제공한다. Surprise 라이브러리는 Python scikit-learn 기반의 라이브러리이며 추천시스템에 편리하게 사용된다. 데이터를 분석하여 시스템을 빠른 속도로 구현하고 딥러닝을 사용하여 강좌 단계를 거쳐 보다 더 정밀한 결과를 구현해낸다. 사용자가 관심 있는 키워드를 입력하면 해당 키워드와 강좌 제목과의 유사도를 실행하고 추출된 영상 데이터로 또 음성 텍스트와의 유사도를 실행하여 추출된 데이터로 Surprise 라이브러리를 통해 가장 높은 순위의 영상 데이터를 추천한다.

유사어 사전을 이용한 자동범주화 모델 개발 (Automatic Text Categorization Model by Synonym Dictionary)

  • 김규환;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.167-172
    • /
    • 2004
  • 기존의 문서분류는 학습문서에 출현하는 자질에 대해 가중치를 계산하여 그 순위에 따라 상위 자질로 구성된 지식베이스를 사용하였다. 그리고 새로운 문서가 들어왔을 때 자질 지식베이스를 근거로 새 문서를 색인하였다. 결국 자질 지식베이스와 정확히 일치하지 않는 키워드는 색인대상에서 제외되는 문제가 있었다. 본 고에서는 이 문제를 해결하기 위하여 분류될 문서의 특징을 나타내는 범주별 자질과 유사한의미를 가지나 형태가 변형되어 기술된 단어에 대하여 유사어 사전을 구축하였으며 이를 통해 새로운 문서가 범주에 할당될 가능성을 높여 자동 문서 범주화 시스템의 성능을 향상시키고자 한다.

  • PDF

FastMap을 이용한 웹 문서 시각화 시스템의 설계 및 구현 (Design and Implementation of web Document Visualization System using FastMap)

  • 문진석;손기락;김차성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.33-35
    • /
    • 1999
  • 인터넷의 발달과 더불어 매일같이 제공되는 수많은 정보로부터 자신에게 필요한 정보만을 추출하는데는 많은 시간과 노력이 소모된다. 이러한 정보수집의 어려움에서 정보를 쉽고 효율적으로 찾기 위해서 웹 문서 시각화 시스템을 구현하였다. 웹 문서 시각화 시스템은 사용자가 검색하는 정보는 과거에 검색했던 웹 문서를 다시 방문하는 경험에서 착안하였다. 이를 위해 인터넷 익스플로러를 통해서 방문 중인 웹 문서의 URL, 키워드, 문서간의 유사성을 추출하여 시각화 한다. 시각화 알고리즘으로 FastMap을 사용하였다. 본 논문에서 FastMap은 웹문서간의 유사성, 즉 상대적인 거리 객체 형태를 2-차원 공간으로 표현하는 알고리즘이다. 2차원 공간으로 매핑된 주변에 있는 웹 문서 객체들을 확대하면 방문중인 웹 문서와 유사성이 있는 문서를 쉽게 찾을 수 있다.

  • PDF

시맨틱 기술을 활용한 OpenAPI 조합 가능 서비스 검색에 관한 연구 (A Survey of Mashup Capable Services' Retrieval Methods for OpenAPI using Semantic Technology)

  • 최영호;차승준;이규철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1234-1237
    • /
    • 2011
  • 본 논문은 시맨틱 기술을 활용한 OpenAPI 조합가능 서비스 검색 기법 개발을 위해 관련 연구들을 분석하여 적용방안을 도출하였다. OpenAPI 조합가능 서비스 검색이란 선택된 서비스의 출력과 매칭이 되는 입력을 가진 서비스나 선택된 서비스의 입력과 매칭되는 출력을 가진 서비스를 찾는 것이다. 본 논문에서는 기존의 키워드 기반의 조합 가능 서비스 검색 기법의 한계를 시맨틱 기술을 활용하여 해결하기 위한 관련연구로 SAWSDL-MX2와 LOG4SWS.KOM에 관한 논문들을 분석했다. SAWSDL-MX2에서는 세가지 매칭 기법과 이에 따른 유사도 분석 기법을 제시하였고, LOG4SWS.KOM에서는 두가지 매칭 기법과 이에 따른 유사도 분석 방법을 제시하였다. 관련 연구들에서 분석된 내용을 바탕으로 OpenAPI 조합 가능 서비스에 대한 매칭 기법의 정의, 유사도 분석 기법의 정의가 추후 진행되어야 한다.

빅데이터를 통한 2016년의 다이어트 실태 분석 (Analysis of dieting practices in 2016 using big data)

  • 정은진;장은재;조경애
    • 한국식품과학회지
    • /
    • 제51권2호
    • /
    • pp.176-181
    • /
    • 2019
  • 인터넷과 대중매체의 발전은 새로운 다이어트에 대한 사람들의 접근을 용이하게 만들었다. 그러나 사람들의 관심은 시시각각으로 변화하기 때문에 이슈가 되는 다이어트는 매년 달라지고 있다. 따라서 본 연구에서는 2016년의 다이어트에 대한 경향을 알아보고 분석하기 위해서 빅데이터 분석 방법을 이용하였고, 포털 사이트 네이버를 통해 2016년 1월 1일부터 2016년 12월 31일 까지 1년간 다이어트 키워드가 포함된 문장을 수집하고 분석하여 단순빈도 분석, N-gram 분석, 키워드 네트워크 분석, 계절성 분석을 시행하였다. 단순빈도분석을 통해 가장 많이 출현한 키워드는 '운동'으로(191,032개)나타났고, 그 다음으로 '식단'이(102,631개)로 나타났으며, 키워드 간의 연관빈도를 분석한 N-gram 분석결과 상위 결과로 다이어트-식단, 다이어트-시작, 다이어트-성공으로 나타났고, 다이어트-도시락이 새롭게 나타나 다이어트 시장의 새로운 변화를 확인할 수 있었다. 또한 다이어트 키워드와 연관된 키워드를 유사한 성격들끼리 그룹화한 키워드 네트워크 분석을 통해 식이그룹, 운동 그룹, 상업적 다이어트 식품, 상업적 다이어트 프로그램 그룹으로 총 4개의 그룹으로 세분화되었다. 계절성 분석을 통해 2월부터 7월까지 꾸준한 상승을 보였으나, 10월에 다이어트 출현빈도 수치가 급격히 상승하였고, 대중매체를 통해 소개된 고지방 다이어트의 월별 출현빈도도 10월에 급격한 상승이 있었다. 따라서 대중매체의 영향이나 새로운 다이어트의 유행이 사람들에게 큰 영향을 미치는 것을 확인할 수 있었다. 이상의 결과를 바탕으로 다이어트의 패턴은 1년을 기준으로 일정한 양상을 띠고 있으나, 새롭게 유행하는 다이어트의 출현을 통해 사람들의 관심이 변화하여 다이어트의 패턴에도 영향을 미치는 것을 확인하였다. 결국 시시각각 변화하는 다이어트를 빠르게 파악하기 위해서는 주기적이기 보다는 지속적인 모니터링과 분석이 필요하다고 판단되어진다.

키워드 분석 기반 사물인터넷 연구 도메인 구조 분석 (A Study on the Structure of Research Domain for Internet of Things Based on Keyword Analysis)

  • 남수현
    • 경영과정보연구
    • /
    • 제36권1호
    • /
    • pp.273-290
    • /
    • 2017
  • 사물인터넷은 인터넷이 비즈니스 프로세스를 근본적으로 변화시킨 이후의 기술로 간주되고 있다. 그러나 사물인터넷의 영역이 하드웨어적인 센서 기술로부터 애플리케이션을 통한 서비스까지 광범위하여 아직까지 연구도메인에 대한 구조가 명확하지 않다. 본 연구에서는 기업에 가치를 제공하기 위해서 사물인터넷의 성숙도를 측정하기 위하여 Porter 등 (2014)이 제안한 기술스택 모델을 적용할 것을 제안한다. 스택모델을 이용하여 사회과학, 복합학, 공학 분야에서 발간되는 논문을 대상으로, "사물인터넷(IoT)"을 키워드로 포함하고 있는 논문의 저자들이 제공한 키워드 분석을 실시하여 사물인터넷 연구의 일반적인 동향을 살펴본다. 결과에 의하면, 클라우드와 빅데이터 분석 기반의 IoT 활용은 활발하지 못하고 결과적으로 IoT로부터의 가치가 충분히 실현되지 못하는 것으로 나타났다. 또한 가치 도출에 중요한 클라우드 프로세스를 적용하는 연구 논문 사례를 발췌하여 사물인터넷의 응용 수준을 측정하였다. 본 연구에서 IT의 가치사슬모형 적용과 유사하게, IoT의 가치를 높이기 위해 스택모델 적용을 제안한 것도 의미가 있다 할 수 있다.

  • PDF

키워드 네트워크 분석을 활용한 생태자산 연구 경향 분석 (Recent Ecological Asset Research Trends using Keyword Network Analysis)

  • 김벼리;이재혁;권혁수
    • 환경영향평가
    • /
    • 제26권5호
    • /
    • pp.303-314
    • /
    • 2017
  • 이 연구의 목적은 국내 외 생태자산 관련 연구 경향을 파악하는 것이다. 생태자산과 의미가 유사한 12개 키워드와 연관 있는 분야 및 영역들을 확인하면서 연구흐름을 이해하고자 하였다. 우리는 키워드 네트워크 분석을 이용하여 방대하게 이루어지고 있는 국내외 연구들을 분석하였다. 키워드 네트워크 분석은 정보의 구조적 흐름을 이해하고 방향성을 파악하는데 유용하다. 국외 연구들은 지속가능성을 중심으로 보전, 경제적 평가, 관리, 정책 분야로 연결되는 것을 보았다. 국내연구 분석은 문헌자료가 적어 다양한 흐름들을 확인하기 어려웠으나 지역의 활성화를 위해 경제적인 가치를 확인하고자 하는 연구들이 있었다. 이 연구는 향후 국내 생태자산 관련 연구 방향들에 설정하는데 활용할 수 있다.

시맨틱 RDF 데이터에 대한 효과적인 키워드 검색 (Effective Keyword Search on Semantic RDF Data)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.209-220
    • /
    • 2017
  • 최근 지식 베이스, 시맨틱 웹 등 여러 응용 분야에서 시맨틱 데이터의 활용이 증가함에 따라 대규모 RDF 데이터에 대한 효과적인 검색 방법의 필요성이 커지고 있다. 기존의 개별 루트 시맨틱에 기반한 키워드 검색 방법들은 서로 다른 루트 노드를 갖는 결과 트리들의 집합만을 검색함에 따라, 의미적으로 유사하거나 연관성이 낮은 결과 트리들이 함께 검색되고, 동일한 루트 노드를 공유하되 의미적으로 다르고 질의 연관도가 높은 결과들은 함께 검색될 수 없는 문제점이 있다. 이를 개선하기 위해 본 논문에서는 결과 트리들의 루트 노드의 중복을 제한적으로 허용하여 질의 연관도가 높으면서 다양한 결과들을 함께 검색하는 방법을 제안한다. 이를 위해 결과 트리 집합의 루트 중복도 척도를 정의하고, 주어진 키워드 질의와 최대 루트 중복도에 따라 제한적인 루트 중복성을 가지면서 연관도가 높은 top-k 결과 트리들을 효율적으로 구하기 위한 검색 알고리즘을 제시한다. 실 데이터를 이용한 성능 실험 결과, 제안한 방법이 기존 방법보다 콘텐트 노드들의 중복이 적은 다양한 결과 트리들을 검색할 뿐만 아니라 결과 트리들의 루트 노드의 중복을 허용함으로써 질의 연관도가 더 높은 결과들을 생성할 수 있음을 보였다.

문서 단위 순위화를 통한 XML 문서에 대한 키워드 검색 성능 향상 (Accelerating Keyword Search Processing over XML Documents using Document-level Ranking)

  • 이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.538-550
    • /
    • 2006
  • XML 문서에 대한 키워드 검색은 사용자로 하여금 XML 문서의 복잡한 구조에 관한 지식 없이 쉽게 정보를 검색할 수 있게 해준다. 또한 사용자의 정보 요구에 대해 해당 정보를 포함하는 문서 전체를 반환하는 기존의 정보 검색 시스템과 달리 문서 내의 해당 정보를 포함하는 문서 조각을 결과로 반환함으로써 보다 빠르게 원하는 정보를 얻을 수 있도록 도와준다. 이러한 특징은 XML 문서 검색 시스템이 XML 문서를 문서 단위가 아닌 세부적인 엘리먼트 단위로 처리함으로써 가능하다. 하지만 이로 인해 대용량 문서들에 대한 질의 처리 부담 역시 가중되었다. 본 논문에서는 엘리먼트 단위 질의 처리의 비용을 줄이기 위해 XML 문서에 대한 문서 단위 순위화 기법을 제안하는데, 이는 결과물의 점수에 영향을 미치는 질의 키워드들의 문서 내에서의 근접도를 경로 노드 집합 정보와 이에 대한 유사도를 통해 구함으로써 엘리먼트 단위 질의 처리 결과를 예측하고 문서 단위 점수를 계산한다. 이러한 문서 중심의 뷰는 대용량 문서에 대한 순위화 혹은 필터링을 가능하게 해주며, 우리는 문서 단위 인덱스를 통해 순위가 높은 문서를 우선적으로 처리함으로써 Top-k 질의에 대해 검색 성능을 높였으며, 실험을 통해 해당 기법의 유효성과 성능 향상을 검증하였다.

키워드 네트워크 분석 방법을 활용한 블록체인 트렌드 분석에 관한 연구 (A Study on Analysis of the Trend of Blockchain by Key Words Network Analysis)

  • 조성환
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.550-555
    • /
    • 2018
  • 본 연구는 키워드 네트워크 분석에 사용되는 텍스트마이닝과 의미연결망 분석 방법을 활용하여 블록체인의 산업 활용 분야로 언론 및 정부 발표에서 언급되고 있는 '금융', '에너지', '물류'를 언급한 기사들을 비교 분석하였다. 블록체인 적용이 언급된 산업 분야별로 기사의 내용 및 키워드의 차이를 파악하고 비교 분석하는 것을 목적으로 하였다. 2017년 1월부터 2018년 7월까지 언론에서 보도한 총 43,093건의 기사를 Python BeautifulSoup을 이용하여 네이버 뉴스에서 수집하였고, 세 용어의 상호 중복을 제거하기 위한 정제 작업을 수행하였다. 이후 키워드 간 네트워크 분석을 위해 텍스톰(Textom)과 UCINET을 이용하여 세 용어에 대한 텍스트마이닝과 의미연결망 분석을 진행하였다. 분석 결과, 세 용어는 모두 '기술' 측면에서는 유사한 단어들이 있었으나, '정부 정책'이나 '산업'측면의 이슈 등에서 내용적 차이가 있었다. 또한 빈도 및 중심성에 있어서도 차이가 있음을 확인할 수 있었다.