• 제목/요약/키워드: 검색어 추출

검색결과 328건 처리시간 0.027초

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

빅데이터를 활용한 뉴노멀(New normal)시대의 관광행태 변화에 관한 연구 (A Study on Tourism Behavior in the New normal Era Using Big Data)

  • 유경미;강종천;최연희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.167-181
    • /
    • 2023
  • 본 연구는 코로나 19 발생 후 여행 제재가 완화된 현재의 관광행태 변화를 분석하기 위해 소셜네트워크 분석프로그램인 TEXTOM을 활용하였다. 네이버, 구글, 다음이 제공하는 블로그, 카페, 뉴스 등을 대상으로 '국내여행', '해외여행' 키워드에 대한 데이터를 수집하였다. 사회적 거리두기가 해제된 2022년 4월~12월로 수집 기간을 정하였고, 코로나19 발생 이전인 2019년과 코로나19의 영향이 가장 심각했던 2020년은 각각 1년으로 하여 2022년과 비교 분석하였다. 텍스트 마이닝을 통하여 각각 총 80개의 핵심어를 추출하고 NetDraw를 사용하여 중심성분석을 하였다. 마지막으로 CONCOR분석을 통하여 상관관계가 있는 핵심어들을 4개로 군집화하였다. 연구결과, 2022년도의 관광행태는 코로나 발생 이전으로의 관광 회복, 각자가 선호하는 테마를 중심으로 여행의 세분화, 나라별 코로나 완화정책을 우선적으로 검색해 본 후 관광지를 선택하는 관광행태를 보인다. 코로나19 이후에 새롭게 도래하는 관광생태계에 대한 관광마케팅 전략과 관광상품 개발을 위한 기초자료를 제공할 것으로 기대한다.

소셜 빅 데이터 분석을 통한 미용분야 대학생 창업지원 정책에 관한 연구 -탐색적 데이터 분석법을 기반으로- (Study on the Policy of Supporting University Students in the Beauty Field through Social Big Data Analysis: Based on exploratory data analytics)

  • 윤미연;박남훈
    • 한국응용과학기술학회지
    • /
    • 제39권6호
    • /
    • pp.853-863
    • /
    • 2022
  • 본 연구에서는 미용분야 창업 활성화를 위해 소셜 빅데이터 분석을 탐색적 데이터 분석(EDA)을 기반으로 하여 2019년부터 2021년 동안 각 년도별로 기간을 구분하여 '미용창업'에 대한 수요 변화와 감정 및 의미 차이의 특징적인 패턴을 도출하고자 하였다. '미용창업' 키워드를 주제로 연관된 검색어를 추출한 결과 창업에 필요한 전문적인 창업교육 보다는 미용관련 기술을 배울 수 있는 기관이나 자격증에 더 많은 관심을 보였으며, 이는 정부 및 지자체에서 여러 가지 창업지원 정책들이 마련되고 있음에도 불구하고 여전히 전문적인 창업교육의 중요성을 인식하지 못하고 있는 것으로 파악할 수 있으며, 이에 대한 대안으로 미용분야 창업을 성공적으로 이루기 위한 전공별 맞춤형 창업교육 프로그램을 개발하는 것이 필요할 것으로 사료된다. 탐색적 데이터 분석을 통해 가설을 설정하고 전통적인 확증적 데이터 분석(CDA)을 결합하여 가설을 검증한다. 미용 창업을 위한 탐색적 데이터 분석 방법이 존재한 적은 없으며, 정식 창업교육의 필요성을 언급하기보다는 미용창업에 대한 관심 변화와 예비창업자의 요구사항을 탐색적 데이터로 분석한다면 맞춤형 창업 프로그램 개발에 도움이 될 것이라고 확신한다.

키워드 네트워크 분석을 활용한 창업분야 지속가능발전목표(SDGs) 연구동향 분석 (A Bibliometric Study on Sustainable Development Goals (SDGs) Research Trends in Entrepreneurship)

  • 안승권;최민정
    • 벤처창업연구
    • /
    • 제18권2호
    • /
    • pp.21-34
    • /
    • 2023
  • 본 연구의 목적은 지속가능발전목표(SDGs)가 유엔총회에서 결의된 이후 전 세계적으로 창업분야에서 SDGs 연구가 얼마나 수행되었는지 살펴보고, 해외 및 국내 연구동향을 비교하여 국내 SDGs 이행을 위한 창업분야의 연구 방향성을 모색하는 데 있다. 이를 위해 검색어를 선정한 후 Web of Science(Wos), KCI, DBpia 등 세 개의 데이터베이스를 활용하여 창업분야의 SDGs 연구물을 추출하였다. 데이터 정제를 거쳐 해외는 총 356편의 연구물을, 국내는 총 4편의 연구물을 분석에 활용하였다. 국내 연구물은 숫자가 너무 적어 해외 연구물만 빈도분석과 키워드 네트워크 분석을 실시하여 연구동향을 살펴보았다. 연구 결과 빈도분석에서는 창업분야 SDGs 연구가 지속가능성과 관련된 용어들을 중심으로 비즈니스 모델, 혁신, 창업교육, 전략 등과 함께 연구되는 것으로 나타났다. 또한 연도별 빈도분석을 통해 창업분야 SDGs 정책, SDGs 이행에 있어 여성 창업가들의 역할, 에너지 창업분야의 SDGs, 경영대학원의 SDGs 이행 방향성과 SDGs 교육, SDGs 이행과 평가를 위한 지표, 지속가능성을 위한 기술 등으로 매년 주제가 다양하게 확장되는 것으로 나타났다. 키워드 네트워크 분석에서는 연구제목과 저자 키워드, 초록을 모두 포함하여 분석한 결과, 비즈니스, 지속가능성, SDGs, 혁신, 창업가정신, 비즈니스 모델, 교육 등의 핵심 키워드를 중심으로 연구범위가 창업생태계, 변화와 전략, 윤리, 기후 등으로 확장되는 것이 확인되었다. 본 연구는 해외 창업분야의 SDGs 연구동향을 제시함으로써 불모지에 가까운 국내 창업분야 SDGs 연구의 발판을 마련하였다는 점에 의의가 있다.

  • PDF

배에서 추출한 Phenolic Compound가 Streptozotocin으로 유발된 고혈당 생쥐에 미치는 영향 (Effects of Pear Phenolic Compound on the STZ-treated Mice for Induction of Diabetes)

  • 김정상;나창수
    • 한국식품영양과학회지
    • /
    • 제31권6호
    • /
    • pp.1107-1111
    • /
    • 2002
  • 배에서 추출한 phenolic compound가 streptozotocin(STZ)응 투여하고 고혈당을 유발시킨 생쥐에 미치는 영향을 밝히고자, 생쥐의 혈당, 혈중 creatinine, BUN의 변화 및 insulin-면역 조직화학적 검색과 췌장섬 $\beta$-세포의 전자현미경관찰을 통한 미세구조 변화를 관찰하였다. 실험군은 정상적인 동물 사료를 식이토록 한 대조군, 사료에 phenolic compound(PA군, 13 mg/g/kg/day; PB군,90 mg/kg/day)를 혼합하여 6주 동안 섭식하게 한 실험군으로 구분하였다. 대조군의 혈당 농도는 4주부터 높게 나타났으며, PA군의 혈당은 대조군에 비하여 유의성 (p<0.05)있게 감소하였으며, 특히 PB군에서는 4주부터 감소하기 시작하여 6주까지 유의성 (p<0.05)있게 감소하였다. BUN과creatinine의 농도는 대조군에 비하여 실험군에서 다소 감소하였으나 유의성은 없었다. STZ을 투여한 대조군의 췌장섬은 대부분 파괴되어 insulin-면역조직화학적 반응을 보인 세포들이 거의 관찰되지 않았으나, PB군에서는 다수의 췌장섬이 관찰될 뿐만 아니라 인슐린-면역조직화학 반응이 양성으로 관찰되었다. 전자현미경관찰 결과 대조군의 $\beta$-세포에서는 인슐린 함유 과립들이 소수 관찰되었으나 PB군에서는 이들 과립들이 다수 관찰되었다. 이상의 결과로 보아 phenolic compound를 섭식한 실험군 생쥐는 STZ에 의해서 손상된 췌장섬이 회복 또는 재생되어 $\beta$-세포의 인슐린 분비가 복원되 어 가고 있다고 사료되었다.

네트워크 분석을 활용한 국내 지문인식연구의 동향분석 (A Network Analysis of the Research Trends in Fingerprints in Korea)

  • 정진효;이창무
    • 융합보안논문지
    • /
    • 제17권1호
    • /
    • pp.15-30
    • /
    • 2017
  • 보안을 위한 기술들은 꾸준히 발전하고 점점 다양화되고 있다. 국내에서 이러한 흐름에 걸 맞는 보안기술들 중 하나로 지문인식을 꼽을 수 있다. 지문인식역시 꾸준히 성장하고 있는 분야로 많은 연구자들의 관심을 받고 있으며 다양한 분야와 장비들에 적용되어 보안기술로서 착실히 성장하고 있다. 관련 논문들 역시 증가하고 있으며 이는 지문인식 기술 분야의 발전을 이룩한 토대가 되어왔다. 하지만 대부분의 논문들은 기술발전과 적용을 위한 연구에 치중되어 있고 지문인식의 전체적인 흐름을 파악하고 현재까지 이룩된 연구 성과들을 객관적으로 제시해주는 연구는 소수에 불과하다 지문인식 연구동향 관련 논문들은 대체로 시장 현황, 특허 현황, 기술 현황, 적용 현황과에 집중되어 있다. 출간된 논문들을 대상으로 지문인식관련 연구들이 어떤 식으로 이루어져 왔는지를 파악한 연구는 전무하다고 할 수 있다. 앞으로의 지문인식관련 연구의 방향성을 제시하고 효과적인 연구를 이끌어내기 위해서는 그동안의 연구 성과들을 객관적으로 살펴볼 필요가 있다. 이에 본 연구는 그동안 발간된 논문들을 통해 지문인식분야의 연구동향을 분석하고자 한다. 주관적인 관점에서 오는 오류를 최대한 배제하기 위해 계량분석방식인 네트워크 분석방법을 사용했다. 네트워크 분석을 위해 1990년부터 2015년까지 발간된 지문인식관련 논문들 중 '등재학술지'와 '등재후보학술지' 122편을 수집한 후 초록을 추출하여 데이터로 사용했다. 논문의 검색은 '한국연구정보서비스 RISS'를 이용했고 전처리를 통한 주제어 추출을 위해 Kwords와 R을 사용했다. 동시출현단어 행렬을 만들기 위해서는 Ktitle을 사용했고 근접 중심성 분석을 위해 Netminer를 활용했다. 분석한 자료들을 통해 1990년 ~ 2000년, 2001년 ~ 2005년, 2006년 ~ 2010년, 2011년 ~ 2015년 4구간으로 시기를 구분하고 연구영역, 연구목적, 연구대상을 기준으로 연구동향을 분석했다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.

CORBA 환경에서 멀티미디어 컴퍼넌트 관리 시스템을 통한 프레임워크 구축 (Framework Construction with Multimedia Component Management System on CORBA)

  • 김행곤
    • 한국멀티미디어학회논문지
    • /
    • 제2권2호
    • /
    • pp.217-229
    • /
    • 1999
  • 프레임워크는추상화된 클래스들의 집합또는특정 도메인에서 재사용가능한설계를구성하는상호연관된 클래스틀의 집합으로 도메인에 속한 애플리케이션들간의 공통된 아키텍쳐를 정의한다- 프레엄워크를 재사용 함으로 개발자들은 클래스 코드뿐만 아니라 도메인에 대한 폭넓은 도메인 지식을 재사용할 수 있다. 따라서 본 논문에서는 프레임워크 재사용을 위해 컴퍼넌트기반의 방법론(COM; Component→Oriented M Methodology)을 제시하고 프레임워크 구축환경을 개발한다. 즉, 컴퍼넌트기반의 소프트웨어 생성을 위해 실세계의 도메인 지식을 입력으로 도메인을 분석하고 분석된 정보를 통해 hotspot을 식별하여 사용자와 개빌 자의 추가정보를 첨가하는 재설계 과정올 거친다. 이후 도메인에 따라 도메인 프레임워크와 애플리케이션 프레임워크를 생성한다 이러한 컴퍼넌트 지향 방법론은 내부적으로는 컴퍼넌트/패턴 라이브러리 저장소를 통해 정보를 검색, 이해하여 추출하거나 혹은 합성으로 얻어진 정보는 각각 컴퍼넌트와 패턴에 대한 정보로 분류되고 이것은 재설계시 추가정보로 사용되어진다. 이로 인해 사용자는 멀티미디어 컴퍼넌트를 이용해 자신의 애플리케이션에 쉽게 적용가능한 개발 환경 즉, 본 논문에서는 CORBA(Common Object Request B Broker Architecture) 환경하에 컴퍼넌트/패턴 관리 시스템(Component Pattern Management System C CPMS)을 통해 멀티 미 디 어 컴 퍼 넌트를 추가 갱 신 삭제하는 기 반 환경 (infrastructure environment)을 구축함 으로 재사용성, 사용의 용이성과 이식성을 가질 수 있다.

  • PDF

동시출현단어 분석에 기반한 메타데이터 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Metadata Research by Using Co-word Analysis)

  • 최예진;정연경
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.63-83
    • /
    • 2016
  • 다양한 매체와 유형으로 생산되는 정보자원에 대한 이용이 높아짐에 따라, 정보자원을 기술하기 위한 정보조직의 도구로서 메타데이터에 대한 중요성이 높아지고 있다. 본 연구에서는 메타데이터 분야의 연구 영역을 파악할 수 있도록 동시출현단어 분석을 사용하여 메타데이터 분야의 지적 구조를 규명하고자 하였다. 이를 위하여 1998년 1월 1일부터 2016년 7월 8일까지 Web of Science 핵심컬렉션에 등재된 저널에 게재된 문헌을 대상으로 'metadata'라는 질의어로 Topic 검색을 수행하여, 총 727건의 논문에 대한 서지정보를 수집하였다. 이 중 저자 키워드를 가진 410건의 논문의 저자 키워드로 수집하고, 전처리 과정을 거쳐 저자 키워드 총 1,137개를 추출하여 최종적으로 빈도수 6회 이상의 키워드 37개를 분석대상으로 선정하였다. 이후 메타데이터 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 2개 영역 9개 군집을 도출하였으며, 메타데이터 분야 키워드들의 지적 관계를 시각화하고, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 6개의 군집을 다차원축적지도상에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 메타데이터 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 향후 메타데이터 관련 교육과 연구의 방향성 모색에 유용하게 사용될 수 있을 것이다.

텍스트마이닝을 활용한 감정노동 연구 동향 분석 (Research Trends on Emotional Labor in Korea using text mining)

  • 조경원;한나영
    • 한국산업정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.119-133
    • /
    • 2021
  • 텍스트마이닝을 이용하여 연구동향을 파악하는 연구가 많은 분야에서 이루어지고 있으나 감정노동 분야에서는 텍스트마이닝을 사용하여 연구 동향을 파악한 연구는 없는 실정이다. 본 연구는 텍스트마이닝을 이용하여 2004년부터 2019년까지 한국연구재단의 한국학술지인용색인(KCI)에서 '감정 노동'이라는 주제어가 포함된 1,465건의 검색된 논문을 심층적으로 분석하여 감정노동 연구 동향을 파악하고자 한다. LDA분석으로 주제들을 추출하고, 토픽의 비중과 유사도를 확인하기 위해 IDM분석을 실시하였다. 이를 통해 유사도가 높은 토픽들의 의미유용성을 고려하여 토픽의 통합분석을 실시하였다. 연구토픽은 11개로 구분되며, 감정노동의 스트레스(12.2%), 감정노동과 사회적 지지(12.0%), 고객서비스 종사자의 감정노동(10.9%), 감정노동과 회복탄력성(10.2%), 감정노동전략(9.2%), 콜센터상담사의 감정노동(9.1%), 감정노동의 결과(9.0%), 감정노동과 직무소진(7.9%), 감성지능(7.1%), 예비돌봄서비스 종사자의 감정노동(6.6%), 감정노동과 조직문화(5.9%) 순의 비중으로 나타났다. 토픽모델링과 트렌드분석을 통하여 감정노동의 연구동향과 학문적 추이를 분석함으로써 감정노동 연구의 나아갈 방향을 제시하고자 하며 감정노동에 관한 실무적인 전략을 수립할 수 있기를 기대한다.