• Title/Summary/Keyword: 동시출현

Search Result 441, Processing Time 0.024 seconds

토픽모델링과 동시출현단어 분석을 이용한 기업가정신에 대한 연구동향 분석: 2002~2021 (Current Research Trends in Entrepreneurship Based on Topic Modeling and Keyword Co-occurrence Analysis: 2002~2021)

  • 장성희
    • 벤처창업연구
    • /
    • 제17권3호
    • /
    • pp.245-256
    • /
    • 2022
  • 본 연구는 토픽모델링과 동시출현단어 분석을 이용하여 기업가정신에 대한 연구 동향을 제공하는 것이 목적이다. 이를 위해 Web of Science 데이터베이스에서 'entrepreneurship'을 기본검색어로 설정하고, 2002년부터 2021년까지 발표한 14,953편의 기업가정신 논문의 데이터를 확보하였다. 본 연구에서는 VOSviewer 프로그램을 이용하여 동시출현단어 분석을 하였고, R 프로그램을 이용하여 토픽모델링 분석을 하였다. 본 연구의 분석결과는 다음과 같다. 첫째, 동시출현단어 분석 결과, 기업가정신과 혁신 클러스터, 기업가정신 교육 클러스터, 사회적 기업가정신과 지속가능성 클러스터, 기업성과 클러스터, 그리고 지식 및 기술이전 클러스터 등 5개의 클러스터로 구분되었다. 둘째, 토픽모델링 분석 결과, 창업환경 및 경제발전, 국제 기업가정신, 다양한 기업가정신, 벤처기업과 자본조달, 정부정책 및 지원, 사회적 기업가정신, 경영관련 이슈, 지역도시계획 및 개발, 기업가정신 교육, 기업가의 혁신과 성과, 기업가정신 연구, 기업가의 창업의도 등 12개의 토픽으로 분석되었다. 마지막으로, 시기별 토픽변화 추이 분석결과, 벤처기업과 자본조달과 기업가의 창업의도에 대한 토픽은 상승토픽으로 나타났고, 국제 기업가정신은 하강토픽으로 나타났다. 본 연구의 결과는 기업가정신 연구에 대한 전반적인 연구동향을 파악할 뿐만 아니라, 기업가정신 연구에 대한 통찰력을 제공하는데 유용할 것으로 기대된다.

검색용 MeSH 필터와 단어인접탐색 기법을 활용한 KoreaMed 검색 효율성 향상 연구 (A Study on the Retrieval Effectiveness of KoreaMed using MeSH Search Filter and Word-Proximity Search)

  • 정소나;정지나
    • 한국산학기술학회논문지
    • /
    • 제18권5호
    • /
    • pp.596-607
    • /
    • 2017
  • 의학학술문헌에는 해부학적 조직이나 기관명이 종양, 질환 또는 감염 용어들과 서로 조합하여 사용되는 언어적 특성을 가지고 있다. 의학학술문헌을 검색할 때 데이터베이스가 제공하는 통제어휘도구인 Medical Subject Headings (MeSH)를 활용하면 합성어, 동의어, 그리고 관련어를 추가로 검색할 수 있어 검색효율이 높다. 본 연구에서는 위암(Stomach Neoplasms) 어휘군을 검색용 필터로 추가하는 방법과 동시출현용어의 거리를 측정하여 단어인접탐색 기법으로 검색효율성을 향상시키는 연구를 수행하였다. 검색용 MeSH에 추가할 어휘군을 결정하기 위해 실험데이터로 PubMed에서 중심주제어가 "Stomach Neoplasms"인 2007년~2016년 논문 8,625편을 내려 받아 논문제목으로부터 Stomach와 Neoplasms 관련 용어의 동시출현여부를 분석하였다. 검색효율성은 KoreaMed에서 검색되는 MEDLINE 학술지를 대상으로 "Stomach Neoplasms"가 MeSH로 색인되어 있는 277편으로 검증하였는데 MEDLINE MeSH, MeSH on Demand, 그리고 KoreaMed MeSH Indexer의 "Stomach Neoplasms" 색인어 추출여부와 검색용 필터로 어휘군을 적용했을 때, 그리고 동시출현 용어의 단어인접검색 기법을 적용했을 때 "Stomach Neoplasms"의 매칭여부를 비교하였다. 가장 출현빈도가 높은 용어는 "Gastric Cancer"로 2,780회 출현하였다. "Gastric Adenocarcinoma", "Gastric MALT Lymphoma" 등과 같이 "Stomach" 용어와 "Neoplasms" 관련 조직학적 용어가 조합된 경우는 7,376개(88.51%)였다. 동시출현 거리가 2단어인 용어는 "Stomach"와 "Neoplasms"의 합성어로 5,234개(70.95%)였다. 연구 결과 MeSH용어를 제외하고 973개의 용어를 후보어휘군으로 선정하였다. MEDLINE MeSH와 KoreaMed MeSH Indexer의 MeSH 매칭률은 209편(75.5%)이었는데 검색필터를 적용한 결과 263편(94.9%)으로, 동시출현 용어의 13단어 단어인접탐색 기법을 적용한 경우 268편(96.7%)으로 매칭률이 향상되었다. 본 연구를 통해 자연어 검색에 있어서 검색효율을 향상시키는 수단으로 검색용 시소러스를 사용하면 색인비용에 대한 부담이 적고, 통제어의 망라적 장점과 자연어가 가지는 용어의 특정성을 유지할 수 있음을 증명하였다. 또한 불리안 검색보다는 단어인접탐색 기법을 활용하면 정확률을 높일 수 있어 검색 효율성이 향상됨을 알 수 있었다.

연구영역분석을 위한 디스크립터 프로파일링에 관한 연구 (Descriptor Profiling for Research Domain Analysis)

  • 김판준;이재윤
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.285-303
    • /
    • 2007
  • 본 연구는 연구 영역 분석을 위하여 통제어휘와 비통제어휘를 연계해서 사용하는 새로운 방법을 모색하기 위한 것이다. 동시출현단어분석은 크게 통제어휘와 비통제어휘를 사용하는 경우의 두 가지 유형으로 구분할 수 있는데, 통제어휘를 사용할 경우에는 자료 희귀성 및 색인자 효과가 단점이며, 비통제어휘를 사용할 경우에는 저자의 주관에 따른 단어 선택 및 단어의 중의성이 문제가 된다. 이 연구에서는 양자를 보완할 수 있는 방법으로, 통제어휘인 디스크립터를 비통제어휘인 단어와의 동시출현 정보로 표현하는 디스크립터 프로파일링을 제안하였다. 정보학분야에 적용해본 결과, 디스크립터 프로파일링은 특정 영역의 최신 동향을 파악하는데 있어 통제어휘와 비통제어휘가 갖는 본질적인 문제점을 어느 정도 보완할 수 있는 것으로 나타났다.

동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가 (User Reputation Evaluation Using Co-occurrence Feature and Collective Intelligence)

  • 이현우;한요섭;김래현;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2008
  • 많은 사용자들의 참여로 구축된 집단 지성을 이용한 지식 검색 서비스에서 사용자가 원하는 답변을 빨리 찾고자 하는 요구가 증가하고 있다. 기존의 연구에서 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보가 답변을 평가하는데 좋은 자질임이 증명되었고, 신뢰도를 추정할 수 있는 여러 종류의 단어 사전을 이용하여 답변의 좋고 나쁨을 평가할 수 있는 연구도 진행되었다. 하지만, 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보는 사용자 조작이 간단하여 지속적으로 관리를 해야 하며, 신뢰도를 추정할 수 있는 단어는 지속적으로 보강되어야 한다. 본 논문에서는 이러한 문제점을 해결하고자 동시출현 자질을 이용한 질문과 답변의 유사성을 활용하여 집단 지성에서 사용자의 활동을 분석하여 사용자의 명성을 평가하는 방법을 제안한다. 사용자의 명성을 계산할 수 있다면 조회 수와 추천 수가 많지 않은 답변의 신뢰도도 비교적 정확하게 추정할 수 있다. 이를 위해 우리는 PageRank 알고리즘을 수정하여 사용자 명성을 계산한다. 네이버 지식iN의 문서로 실험한 결과, 기존 정답 선택률을 보완할 수 있는 결과를 보였다.

  • PDF

동시출현 단어분석 기반 스팸 문자 탐지 기법 (Coward Analysis based Spam SMS Detection Scheme)

  • 오하영
    • 정보보호학회논문지
    • /
    • 제26권3호
    • /
    • pp.693-700
    • /
    • 2016
  • 스팸 데이터 셋은 통상적으로 공개적으로 구하기 어렵고 기존 연구들은 대부분 스팸 이메일에 초점이 맞춰져 왔기 때문에 스팸 문자 메시지 자체 특성을 분석하는데 한계가 있었다. 스팸 이메일 특성 분석 활용 및 데이터 마이닝 기법 등의 활용을 통한 기존 연구들이 있었지만, 영향력이 높은 단일 단어를 활용한 스팸 문자 탐지 기법에 한정되어 있다는 한계점이 있다. 본 논문에서는 싱가폴 대학교에서 공개적으로 공개한 스팸 문자메시지를 다 각도에서 실험 및 분석하여 스팸 문자의 특성을 밝히고 동시출현 단어분석 기반의 스팸 문자 탐지 기법을 제안한다. 성능평가 결과, 제안하는 기법의 거짓 양성과 거짓 음성이 2%미만임을 보였다.

데이터사이언스 연구의 지적 구조 분석 및 시각화 (Analyzing and Visualizing the Intellectual Structure of Data Science)

  • 박형주
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.18-29
    • /
    • 2022
  • 본 탐색적 연구의 목적은 데이터사이언스 관련 논문의 연구 동향을 분석하는 것이다. 본 연구는 Clarivate Analytics사의 Web of Science(WoS)에 색인된 데이터사이언스 관련 논문을 분석의 대상으로 했다. 2012년부터 2021년까지 WoS에 색인된 데이터사이언스 관련 논문 총 17,997편을 분석했다. 데이터사이언스 연구의 지적 구조를 집중 분석하기 위해 기술 분석, 인용 분석, 공동 저자 네트워크 분석, 동시 출현 네트워크 분석, 서지 결합 분석, 동시 인용 분석을 수행했다. 본 연구의 결과는 향후 데이터사이언스 관련 연구의 방향성 모색에 유용하게 사용될 수 있다.

연관규칙 기반 동시출현단어 분석을 활용한 기술경영 연구 주제 네트워크 분석 (Exploring the Research Topic Networks in the Technology Management Field Using Association Rule-based Co-word Analysis)

  • 전익진;이학연
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.101-126
    • /
    • 2016
  • 본 연구는 동시출현단어(co-word) 분석을 이용하여 기술경영 분야의 연구 주제 네트워크를 구축하고, 핵심 연구 주제 및 연구 주제 간 상호연관관계를 도출한다. 동시출현 빈도수의 정규화를 통해 키워드 간 유사성을 도출하여 무방향 네트워크를 분석하는 기존 연구들과는 달리 본 연구는 연관규칙분석(association rule)을 통해 키워드 간 신뢰도(confidence)를 도출하여 유방향 네트워크 분석을 수행한다. 2011~2014년 기술경영 분야 9개 국제 학술지에 게재된 2,456개의 논문의 저자키워드를 대상으로 빈도수 상위 200개 키워드를 추출하고, 주제(THEME), 방법(METHOD), 분야(FIELD)의 세 가지 유형으로 키워드를 분류한다. 각 유형별 일원(one-mode) 네트워크를 구축하여, 함께 많이 연구가 이루어진 키워드들을 찾아내고, 핵심 키워드를 도출한다. 또한 두 가지 유형의 키워드 간의 이원(two-mode) 네트워크를 구축하여, 연구 주제별로 함께 많이 활용된 방법 및 대상 분야를 탐색한다. 본 연구 결과는 최근 성숙기에 접어든 기술경영 분야의 연구 흐름 및 지식 구조를 키워드 수준에서 구체적으로 제시함으로써, 기술경영 분야 연구자들의 연구 주제 탐색 및 연구방향 설계에 활용될 수 있을 것으로 기대된다.

동시출현단어 분석을 이용한 도서관경영 분야의 지적구조 분석 (A Study on the Analysis of Intellectual Structure of Library Management Studies using Co-Word Analysis)

  • 이정규;이용구
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.23-26
    • /
    • 2013
  • 지식기반사회와 정보홍수시대로 갈수록, 도서관의 존속여부에 대한 고민으로 도서관경영의 중요성은 심화되며, 관련 연구가 많이 이루어지고 있다. 이에 본 연구는 동시출현단어 분석을 통해 도서관경영 분야의 지적구조를 분석하였다. 데이터 수집은 2001~2013년도까지 한국연구재단에 등재된 5개의 문헌정보학 관련 학회지를 대상으로 하였으며, 해당 논문 수는 413건이다. 데이터 처리후 군집분석을 실시하여 9개의 군집을 형성하였으며, 해당 군집은 장서개발, 디지털도서관, 공공도서관, 마케팅 및 조직관리, 국립중앙도서관 및 작은도서관, 인사관리(직무/자격제도), 대학도서관, 학교도서관, 서비스 품질평가이다. 이러한 연구 결과는 기존의 도서관경영 분야의 주제영역과 비교하였다.

  • PDF

우리나라 서해남부 해역에 분포하는 넓적뿔꼬바새우(Latreutes planirostris)의 생식생태 및 계체군 동태에 관한 연구

  • 나종헌;오철웅;박경양;마채우;장창익
    • 한국어업기술학회:학술대회논문집
    • /
    • 한국어업기술학회 2003년도 춘계 수산관련학회 공동학술대회발표요지집
    • /
    • pp.296-297
    • /
    • 2003
  • 꼬마새우과 (Family Hippolytidae)에 속하는 넓적뿔꼬마새우 (Latreutes planirostris)는 우리나라의 서해, 남해안 해역과 동중국해를 공유하는 일본(훗카이도, 혼슈우, 큐유슈우), 중국, 홍콩 등지에 주로 분포하고, 우리나라에서는 연중 출현하며, 특히 여름과 겨울에 대량 출현한다. 넓적뿔꼬마새우는 연안생태계에서 상위포식자인 두족류나 어류의 먹이인 동시에 초식자를 섭이하는 먹이사슬의 중간단계로서 중요한 역할을 담당하고 있다 (Omori, 1974; Yang and Tan 2000). (중략)

  • PDF

연관성 척도의 빈도수준 선호경향에 대한 연구 (A Study on the Frequency Level Preference Tendency of Association Measures)

  • 이재윤
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.281-294
    • /
    • 2004
  • 연관성 척도는 정보검색 및 데이터마이닝을 비롯한 다양한 분야에서 사용되고 있다. 각 연관성 척도가 높거나 낮은 빈도 중에서 어떤 쪽을 선호하는가를 나타내는 빈도수준 선호경향은 척도의 적용 결과에 중요한 영향을 미치므로 이에 대한 면밀한 조사가 필요하다. 이 연구에서는 주요 연관성 척도들의 빈도수준 선호경향을 가상의 데이터를 통해 분석하고 그 결과를 제시하였다. 또한 코사인 계수를 비롯한 대표적인 연관성 척도에 대해서 빈도수준 선호경향을 조절할 수 있는 방법을 제안하였다. 이 조절 방법을 동시출현 기반 질의확장 정보검색에 적용해본 결과 그 유용성이 확인되었다. 마지막으로 분석 및 실험 결과가 관련 분야에 시사하는 바를 논하였다.