• 제목/요약/키워드: Keyword analysis

검색결과 1,151건 처리시간 0.025초

의미간의 유사도 연구의 패러다임 변화의 필요성-인지 의미론적 관점에서의 고찰 (The Need for Paradigm Shift in Semantic Similarity and Semantic Relatedness : From Cognitive Semantics Perspective)

  • 최영석;박진수
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.111-123
    • /
    • 2013
  • 개념간의 의미적 유사도 및 관계도(Semantic Similarity/Relatedness)를 구하는 연구는 고전적인 연구에서는 데이터 베이스 통합이나 시스템 통합, 그리고 현대의 연구에 있어서는 태그 및 키워드 추출, 연관 단어 추천 등에 걸쳐 다양한 분야에서 활용되어 온 연구이다. 그 연구는 역사가 오래되었을 뿐만 아니라, 경영정보와 컴퓨터 공학, 계산 언어학에 걸쳐 여러 분야에서도 많은 관심을 가져왔던 연구 분야라고 할 수 있다. 그러나, 지금까지의 개념간의 관계도 계산 방식은 미리 만들어진 사전이나 참조할 수 있는 다른 시맨틱 네트워크(Semantic Network)를 이용하여 계산하는 방법이 주를 이루었다. 이러한 접근 방법의 경우, 개념간의 의미적 관계가 변화에 대한 가능성을 고려하지 않는 것이 일반적이다. 하지만, 정보 기술의 발달과 빠른 사회변화는 개념간의 의미관계 등에 변화를 가져오고 있는 것이 현실이다. 사회적으로 일어나는 사건이나, 문화적 변화 등이 개념간의 의미관계를 변화시키는 것을 물론이며, 이러한 변화가 정보 통신 기술의 도움으로 빠르게 공유되고 있다. 이렇게 개념간의 의미 관계가 시간이나 맥락에 따라 빠르게 변화할 수 있는 가능성이 있음에도 불구하고, 기존의 개념간 의미적 유사도 및 관계도에 대한 연구들은 이러한 '의미관계의 변화'에 대한 새로운 문제에 대해 해답을 제시하지 못한 것이 사실이다. 따라서, 본 연구에서는 개념간의 유사도 연구에 있어 지금까지 있어왔던 '정적인 의미간 관계도 패러다임'에서 '동적인 의미간 관계도 패러다임'으로의 전환의 필요성과 그 당위성을 인지 의미론적(Cognitive Semantics)의 관점에서 역설하고자 한다. 인간이 인지하는 개념간의 의미관계가 변화할 수 있는 이론적 근거를 인지 의미론에서 찾아봄으로써, 패러다임 변화의 방향을 구체적으로 제시하였다. 또한 이러한 패러다임의 변화에 맞추어 개념간의 의미적 유사도 및 관계도에 대한 연구가 어떠한 방향으로 나아가야 할지 구체적인 연구 방향을 제시함으로써 관련 연구자들에게 새로운 연구의 가이드라인을 제시하였다.

개인 일기의 연구 자료로서의 가치와 전망 "5월12일 일기컬렉션"을 중심으로 (Value and Prosect of individual diary as research materials : Based on the "The 12th May Diaries Collection")

  • 최효진;임진희
    • 기록학연구
    • /
    • 제46호
    • /
    • pp.95-152
    • /
    • 2015
  • 일상아카이브란 '보통사람들'의 삶과 문화를 구체화, 범주화하여 이에 따라 개인이나 공동체, 더 나아가 한 사회의 기억과 이를 담은 기록물을 수집, 평가, 선별, 보존하는 조직이나 시설, 장소를 말한다. 일기를 비롯해 자서전, 회고록, 편지, 메모 등 실물자료와 온라인 공간에서 주고받는 블로그나 카페 게시물, SNS에 업로드되는 일상의 사진도 여기에 속한다. 이렇게 매 순간 생산되는 일상기록의 수집과 보존에 관한 필요성이 기록학계를 비롯해 다양한 분야에서 제기되고 있다. 특히 일기는 시대를 불문하고 한 개인이 매일같이 경험한 사실과 자아성찰 등을 정리한 글로서 기록의 원천성과 개별성, 유일성 등의 가치가 크게 중요시 되고 있다. 최근 여러 편의 일기들이 발굴, 소개되면서 역사학을 비롯해 다양한 인문사회과학 분야에서도 일기와 기록주체, 생산된 시대 연구가 이루어져왔다. 또한 언어학, 교육학, 심리학 등의 분야에서는 일기에서 관찰되는 언어습관, 문화수용양상, 저자의 감정이나 심리변화 등을 분석한다. 이 글에서는 국내외에서 이루어지는 일기 관련 연구 동향을 정리하고 이 맥락에서 일상기록으로서 "5월12일 일기컬렉션"이 갖는 의미를 찾는다. "5월12일 일기컬렉션"은 매년 5월12일 시민들이 직접 생산, 기증한 일기로 구성되어 있다. 명지대 디지털아카이빙연구소가 2013년 첫 '5월12일 일기수집 이벤트'를 개최한지 3년이 되는 현재 유치원생부터 80대 참가자들이 육필 (그림)일기, 전자문서, 디지털사진/영상, 음성녹음 등 다양한 유형으로 생산된 일기가 2천여 건 수집되었다. 이 글에서는 이렇게 수집된 일기를 정량적으로 분석하고 개별 기록물들이 어떤 내용을 담고 있는지를 살펴본다. 가족, 친구, 학교생활, 진로고민 등 연령별 지역별 직업별로 시민들의 생활상과 진솔한 고민을 읽을 수 있다. 개별 기록물에서 추출되는 키워드와 주제어에 따라 이 일기들이 담고 있는 주제를 더욱 포괄적으로 살펴보고자 한다. 또한 수집된 일기들을 형식과 내용에 따라 연구자료로 언어학, 교육학을 비롯해 역사학, 인류학 등 다양한 학문 분야에서 어떻게 활용될 수 있을지 그 연구 가능성을 제언해본다. 그리고 "5월12일 일기컬렉션"이 일상아카이브로서 수집, 보존되기 위해 필요한 과제가 무엇인지 살펴본다.

간호학생의 응급환자간호 임상실습 온라인 프로그램 개발 및 적용 (Development and Application of an Online Clinical Practicum Program on Emergency Nursing Care for Nursing Students)

  • 김원경;박정민;송지은
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권1호
    • /
    • pp.131-142
    • /
    • 2021
  • 코로나 바이러스(COVID-19) 팬데믹으로, 전국의 대학들이 온라인 플랫폼을 사용한 비대면 강의를 시행하고 있다. 따라서 응급환자간호 임상실습 교육에 맞는 온라인 프로그램을 개발하고, 간호학생에게 적용하여 그 효과를 확인해보고자 시도 되였다. 본 연구는 양적자료와 질적자료를 분석한 방법론적 연구로, G광역시 N대학교 성인간호학교수 3인이 G광역시 종합병원 간호부장과 응급실 수간호사들에게 자문을 구하여 학생들의 교과목과 관련된 요구도 조사 후에, 4학년을 대상으로 응급환자간호 임상실습 온라인 프로그램을 ADDIE모형에 따라 개발하였다. 프로그램은 총 4주 동안 진행되었으며, 1주에 영상 4시간, 과제 2가지로 구성하였고, 실시간 쌍방향 화상집담회도 포함되었다. 총 96명 학생 자료가 수집되었으며, SPSS/WIN 22 프로그램으로 분석하였다. 자료 분석결과 교과목 만족도 부분에서 '학습목표 연계성'이 총 6.0만점에 평균 5.58±0.98로 가장 점수가 높았다. 응급간호 학습성취도에서는 'BLS 수행 '이 평균 5.47±0.74로 가장 점수가 높았으며, '낙상예방 간호수행'(5.39±0.77), '응급환자 기록수행'(5.30±0.70), '감염예방 간호수행'(5.27±0.736) 순이었다. '3학년때 시행한 대면임상실습경험과 이번학기 비대면임상실습수업 경험을 비교하여 내가 생각하는 이번학기 수업의 장점은 무엇인가?'에 관한 질적자료를 Keyword로 추출하여 Wordcloud로 제시한 결과 답변을 한 77명의 학생들 중 '간호과정경험'이라고 답한 경우가 13명(16.9%)로 가장 많은 빈도를 나타내었고, '자세한 교수설명'이 10명(13.0%), '사례기반실습'이 9명(11.7%) '시간과 공간의 제약이 없다(Anytime anywhere)'고 답한 경우가 8명(10.4%) 순으로 나타났다. 이에, 개발된 온라인 프로그램을 활용한 응급환자간호 임상실습이 학생들의 교과목 요구도를 반영한 학생들의 학습성취도를 파악하였으며, 대면실습과 비교하여 교과목 만족도가 높게 나타나 개발된 온라인 프로그램을 향후 응급환자간호 임상실습에서 활용 가능할 것으로 생각된다.

소셜미디어에 나타난 풍력발전시설의 경관 인식 연구 (A Study on the Landscape Cognition of Wind Power Plant in Social Media)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.69-79
    • /
    • 2022
  • 본 연구는 최근 신재생에너지원으로 관광, 여행 등의 목적을 가지며 관광자원의 역할을 할 수 있는 풍력발전시설의 경관 인식을 파악하였다. 이에 지역별로 방문객이 경험한 풍력발전시설의 경관과 관련된 소셜미디어 데이터를 분석하였다. 분석 결과, 풍력발전시설의 경관을 인식할 때 연구대상지에서 공통적으로 풍력발전시설의 규모, 조망점과 풍력발전시설 간의 거리, 조망점에서 풍력발전시설을 볼 때 시각적 개방성, 풍력발전시설이 위치하고 있는 지형에 따라 달라지는 것을 알 수 있다. 또한, 풍력발전시설의 선호는 풍력발전시설의 형태와 주변경관을 파악할 수 있는 장소인 평지나 바다에 설치되어 있는 곳을 더 좋은 경관이라고 인식하고 있다. 특이한 점으로 경관에 대한 부정적인 키워드는 강원도 태백 가덕산, 태백 매봉산, 태기산과 경상도 경주 풍력발전시설에서 나타났다. 부정적인 키워드는 풍력발전시설을 가까이 조망했을 때 조망각이 높아 느껴지는 압도적인 크기와 산의 능선이 함께 보이는 경관에서 심리적 위압감을 느끼고 있음을 알 수 있다. 반면, 평지나 바다가 보이는 경관의 풍력발전시설에서는 긍정적인 경관 형용사가 도출되어 방문객은 경관의 스카이라인이 산 능선과 겹쳐서 보이거나 너무 가까이에서 풍력발전시설을 바라볼 때보다 평지나 바다에서 경관의 시각량이 충분히 확보될 때 그 장소를 대표할 만한 상징적인 요소라고 인식하고 있음을 알 수 있다. 본 연구는 풍력발전시설을 경험한 방문객의 의견을 토대로 경관 인식을 분석하였다. 그러나 풍력발전시설은 설치되는 권역별로 경관특성이 다르고, 시점, 관찰자 등 변수가 많아 연구결과를 일반화시키기 어려운 한계가 있다. 최근 풍력발전시설 조성 시 발생하는 경관훼손이 주요 이슈가 되고 있고, 국내에는 풍력발전시설의 경관을 평가할 수 있는 방법이 미흡하다. 이에 풍력발전시설의 경관을 평가할 시 풍력발전시설의 규모, 풍력발전시설이 설치된 지역 고유의 자연적 특성, 풍력발전시설과 조망점과의 거리가 중요한 구성요소로 나타난 것은 주목할 사항이라 판단된다. 또한, 풍력시설은 보전해야 할 자연환경에 설치되는 시설로 추후 경관적 관점에서 풍력발전시설과 주변 환경을 바라보는 경관의 연구가 필요하다.

HMR 무인매장 서비스 품질 분류에 관한 연구 (Classification of Service Quality for HMR unmanned store business)

  • 이종원
    • 서비스연구
    • /
    • 제13권2호
    • /
    • pp.41-61
    • /
    • 2023
  • 제4차 산업혁명 시대의 보편적 삶의 형태는 비대면이라는 키워드로 요약될 수 있을 것이다. 특히 소비 활동 측면에서도 점차 대면 접촉이 최소화되는 시스템으로 변화하고 있으며, 오프라인 매장에서는 키오스크(kiosk)와 로봇 등을 통한 비접촉 서비스로의 전환이 빠르게 이어지고 있다. 사회 구조 역시 시간의 흐름에 따라 변화되고 있으며 특히 1인 가구 증가와 고령화는 식생활과 연관된 외식산업의 변화에도 영향을 미치고 있다. 가정 내에서 직접 조리하는 노동이 줄어들고, 대체할 수 있는 식품의 이용이 증가하고 있음에 따라 가정간편식 (HMR: Home Meal Replacement)시장이 큰 규모로 성장하였다. 시장의 규모가 커지며 상품을 제공하는 비즈니스의 형태도 다양해졌다. 기술의 발전, 비대면 문화 그리고 기업의 경영 효율성이 맞물리며 최근 무인매장이 확산되고 있는 추세이다. 본 연구에서는 차츰 경쟁이 심화되는 HMR 무인매장의 서비스 품질 속성을 분류하여 고객만족을 기반으로 한 서비스 경영 관리 측면의 시사점을 제공하고자 Kano model을 활용한 서비스 품질 분류 및 Timko의 고객만족계수를 산출하였다. 분석결과 '상품(메뉴) 다양성' 등이 매력적 품질로 분류되었으며, '매장 내부/외부 청결성' 등이 일원적 품질로 분류되었다. 또한 '셀프 계산 과정의 편리성'은 당연적 품질, '매장 내 통행의 편리성' 무관심 품질로 분류되었다. 나아가 만족계수가 가장 높은 요소는 '상품(메뉴)다양성'으로, 불만족계수가 가장 높은 요소는 '셀프 계산과정의 편리성'으로 나타났다. 본 연구의 결과를 통해 HMR 무인매장의 서비스 품질 관리에 있어 우선순위를 도출하고, 이를 통해 관련 비즈니스에서의 전략적 시사점을 제공하고자 한다.

현대인의 라이프스타일에 따른 픽업트럭 튜닝 용품 디자인 사례 연구 (A Case Study on the Design of Pickup Truck Tuning Equipment according to the Lifestyle of Modern People)

  • 이동훈;박해림;이상기
    • 서비스연구
    • /
    • 제13권4호
    • /
    • pp.131-141
    • /
    • 2023
  • 라이프스타일 변화에 따라 소비자의 니즈와 행동 변화는 소비문화로 이어져 자동차 시장에도 영향을 미치고 있다. 그러나 관련 시장의 소비자의 라이프스타일에 맞춘 옵션을 제공하기 위한 연구·조사는 아직 부족한 실정이다. 본 연구는 차종 중 라이프스타일이 가장 많이 반영되는 픽업트럭에 적용되는 픽업트럭 액세서리를 중심으로 먼저 픽업트럭과 픽업트럭의 애프터마켓 시장, 라이프스타일에 대한 이론적 배경을 살펴보았다. 둘째, 이미지 맵핑을 통해 시장규모 분석, 가능성을 통한 픽업트럭의 시장 가능성과 기회요소를 발견하고 이를 통해 사용자 유형을 구분할 수 있었다. 셋째, 사용자 유형을 대표하는 이를 대상으로 인터뷰를 진행하였고 내용을 정리하였고 관련 집단을 중심으로 인터뷰하여 사용자 집단의 퍼소나를 작성하고 각 집단의 퍼소나가 원하는 니즈가 무엇인지 정리하였다. 마지막으로, 사용자 라이프스타일 유형별 도출된 이슈 키워드 및 인사이트에 맞는 디자인 콘셉트를 제시하였다. 본 연구에서는 사용자 유형을 ①야외활동형, ②취미활동형, ③소규모업무형으로 나누어 사용자 유형별 인터뷰로 집단별 키워드에 맞는 콘셉트를 적용하여 디자인 사례연구를 하였다. 야외활동형은 가변형 구조의 수납, 거주공간 형태의 액세서리 디자인을 제시하였고, 취미활동형은 모듈형 데크탑 디자인과 스포츠 쿠페형의 하드탑 디자인을 제시하였다. 소규모업무형은 적재물 고정에 용이한 칸막이와 적재함 탑승에 용이한 스탭퍼 디자인을 제시하였다. 현재 대량 맞춤화(Mass Customization)되고 있는 자동차 시장에서 픽업트럭 이용자의 라이프스타일에 맞는 픽업트럭 액세서리 개발에 적용하여 라이프스타일별 사용자가 원하는 옵션 디자인의 다양화로 픽업트럭 애프터마켓의 규모가 확대되길 기대한다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

카테고리 연관 규칙 마이닝을 활용한 추천 정확도 향상 기법 (A Study on the Improvement of Recommendation Accuracy by Using Category Association Rule Mining)

  • 이동원
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.27-42
    • /
    • 2020
  • 인터넷이라는 가상 공간을 활용함으로써 물리적 공간의 제약을 갖는 오프라인 쇼핑의 한계를 넘어선 온라인 쇼핑은 다양한 기호를 가진 소비자를 만족시킬 수 있는 수많은 상품을 진열할 수 있게 되었다. 그러나, 이는 역설적으로 소비자가 구매의사결정 과정에서 너무 많은 대안을 비교 평가해야 하는 어려움을 겪게 함으로써 오히려 상품 선택을 방해하는 원인이 되기도 한다. 이런 부작용을 해소하기 위한 노력으로서, 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 구매의사결정 과정 중 정보탐색 및 대안평가에 소요되는 시간과 노력을 줄여주고 이탈을 방지하며 판매자의 매출 증대에 기여할 수 있다. 연관 상품 추천에 사용되는 연관 규칙 마이닝 기법은 통계적 방법을 통해 주문과 같은 거래 데이터로부터 서로 연관성 높은 상품을 효과적으로 발견할 수 있다. 하지만, 이 기법은 거래 건수를 기반으로 하므로, 잠재적으로 판매 가능성이 높을지라도 충분한 거래 건수가 확보되지 못한 상품은 추천 목록에서 누락될 수 있다. 이렇게 추천 시 제외된 상품은 소비자에게 구매될 수 있는 충분한 기회를 확보하지 못할 수 있으며, 또 다시 다른 상품에 비해 상대적으로 낮은 추천 기회를 얻는 악순환을 겪을 수도 있다. 본 연구는 구매의사결정이 결국 상품이 지닌 속성에 대한 사용자의 평가를 기반으로 한다는 점에 착안하여, 추천 시 상품의 속성을 반영하면 소비자가 특정 상품을 선택할 확률을 좀더 정확하게 예측할 수 있다는 점을 추천 시스템에 반영하기 위한 목적으로 수행되었다. 즉, 어떤 상품 페이지를 방문한 소비자는 그 상품이 지닌 속성들에 어느 정도 관심을 보인 것이며 추천 시스템은 이런 속성들을 기반으로 연관성을 지닌 상품을 더 정교하게 찾을 수 있다는 것이다. 상품의 주요 속성의 하나로서, 카테고리는 두 상품 간에 아직 드러나지 않은 잠재적인 연관성을 찾기에 적합한 대상이 될 수 있다고 판단하였다. 본 연구는 연관 상품 추천에 상품 간의 연관성뿐만 아니라 카테고리 간의 연관성을 추가로 반영함으로써 추천의 정확도를 높일 수 있는 예측모형을 개발하였고, 온라인 쇼핑몰로부터 수집된 주문 데이터를 활용하여 이루어진 실험은 기존 모형에 비해 추천 성능이 개선됨을 보였다. 실무적인 관점에서 볼 때, 본 연구는 소비자의 구매 만족도를 향상시키고 판매자의 매출을 증가시키는 데에 기여할 수 있을 것으로 기대된다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.