• 제목/요약/키워드: keyword

검색결과 2,066건 처리시간 0.028초

MeSH 시소러스를 이용한 한영 교차언어 키워드 자동 부여 (Automatic Korean to English Cross Language Keyword Assignment Using MeSH Thesaurus)

  • 이재성;김미숙;오영순;이영성
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.155-162
    • /
    • 2006
  • 의학용 시소러스인 MeSH (Medical Subject Heading)는 영어 의학 논문 색인을 위한 통제어 시소러스로서 오랫동안 사용되고 있다. 본 논문에서는 한국어 MeSH를 이용하여 한국어 의학 논문의 요약문에 자동으로 영문 MeSH 색인어를 부여하는 '교차언어 키워드 부여' 방법을 제안하고 색인 전문가 및 저자의 색인 효율과 비교한다. 이 색인어 부여 과정은 우선 한국어 MeSH 용어를 문장에서 인식하여 추출하고, 이 용어를 다시 영어 MeSH 용어로 바꾼 후, 용어의 중요도를 계산하여 상위의 용어를 색인어로 부여한다. 특히, 한국어 MeSH 용어 추출을 위해 효과적으로 띄어쓰기 변이를 처리할 수 있는 방법을 제안한다 실험 결과, 띄어쓰기 변이를 효과적으로 처리하여 한국어 MeSH의 크기를 약 42% 정도 줄였을 뿐만 아니라, 후보 색인어 추출의 효과도 높였다. 또 이 방법을 이용하여 색인어 자동 부여를 한 후, 색인 전문가 및 저자의 색인 결과를 비교한 결과, 이 자동 색인 방법이 전문가의 색인 능력보다는 부족했지만, 저자의 색인 능력과는 별 차이가 없음을 보였다.

키워드 네트워크 분석을 통한 산학협력 학술논문 연구 (A study on academic articles of industry-academic cooperation through keyword network analysis)

  • 권선희
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.43-50
    • /
    • 2021
  • 본 논문은 지난 10년간(2011~2021) 발간된 산학협력에 대한 국내 논문과 국외 논문의 비교 분석을 통해 국내 산학협력의 동향을 파악하고 국외 산학협력 연구 주제와 비교하고자 한다. 수집된 전체 기사의 특색을 파악하기 위해 키워드 네트워크 분석과 토픽 모델링 분석을 실시하였다. 주요 결과는 다음과 같다. 국내 논문은 학교, 고용, 교육, 특허, 교수 등이 주요 토픽이며 관련 키워드가 영향력 있는 키워드로 나타났다. 국외 논문의 경우, 프로젝트, 정책, 혁신, 회사 등이 주요 토픽이며 관련 키워드가 영향력 있는 것으로 나타났다. 본 연구 결과는 국내 산학협력은 대학, 교수가 고용을 위한 교육을 설계하고 주도해 왔다고 해석될 수 있으며, 향후 국내 산학협력 활동이 '연구'와 '기술이전' 영역에서 보다 활발히 이루어질 필요가 있으며, 이를 위해서 정부의 관련 정책과 지원이 학교와 기업 모두 이익을 얻을 수 있는 양방향 관계 수립에 중점을 두어야 함을 시사한다.

역인덱스 기반 상향식 군집화 기법을 이용한 대규모 학술 핵심어 분석 (Analysis of Massive Scholarly Keywords using Inverted-Index based Bottom-up Clustering)

  • 오흥선;정유철
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.758-764
    • /
    • 2018
  • 특허(patent), 학술 논문(scholarly paper)과 연구 보고서(research report)와 같은 디지털 문서(digital document)에는 주제(topic)를 요약하는 저자 키워드(author keyword)가 있다. 서로 다른 문서가 동일한 키워드를 공유하고 있다면 두 문서가 동일한 주제의 내용을 기술하고 있을 가능성이 매우 높다. 문서 군집화(document clustering)는 비슷한 주제를 가지는 문서들을 비지도 학습 방법(unsupervised learning)을 이용하여 같은 군집으로 그룹(group)화 하는 것이다. 문서 군집화는 다양한 분석에 이용되지만 대용량의 문서 데이터에 적용하기 위해서는 많은 계산량이 필요함으로 쉽지 않다. 이러한 경우, 문서의 내용을 이용하는 것보다 문서의 키워드를 이용하여 군집화하면 더욱 효율적으로 대용량의 데이터를 연결할 수 있다. 기존의 상향식 군집화 방법(bottom-up hierarchical clustering)은 대용량의 키워드 군집화(keyword clustering)를 수행하는데 있어서 많은 시간이 필요하다는 문제점이 있다. 본 논문에서는 정보검색(information retrieval)에서 널리 사용되는 역인덱스(inverted-index) 구조를 상향식 군집화에 적용한 효율적인 군집화 방법을 제안하고, 제안 방법을 대용량의 키워드 데이터에 적용하였으며, 그 결과를 분석하였다.

개인 맞춤형 사용자 인증 시스템 설계 (Design of the Personalized User Authentication Systems)

  • 김성열
    • 융합정보논문지
    • /
    • 제8권6호
    • /
    • pp.143-148
    • /
    • 2018
  • 본 논문은 사용자 인증시 사용할 패스워드 키워드를 사용자가 맞춤형으로 정의하여 사용자 인증시 다단계로 사용될 수 있는 개인 맞춤형 사용자 인증 시스템(PUAS)을 설계 제안한다. 제안 개념은 사용자 인증시 서버 시스템 접근시 취득한 패스워드를 다시 사용하는 수동적인 재전송 공격에 강력히 대처할 수 있도록 사용자 인증시 사용될 패스워드 키워드를 사용자가 스스로가 맞춤형으로 정의한다. 인증단계도 단일단계에서 다단계로 확장할 수 있도록 설계한다. 또한 사용자가 정의한 패스워드 관련 정보를 시스템 내에 임의의 암호화된 장소에 저장하도록 설계하여 네트워크의 불법적인 접근을 무력화하도록 설계 제안한다. 따라서 설계 제안한 시스템을 이용하면 침입자가 시스템에 접근하더라도 개인만이 갖고 있는 독특한 개인정보를 통한 패스워드 키워드를 생성하여 개인인증 정보를 생성하고 생성된 인증정보가 저장되어 있는 장소를 알 수 없어 어떠한 수동적 재전송 공격이라도 무력화할 수 있다는 강력한 보안 특성을 갖는다.

빈칸 되묻기 방식 기반 다중 키워드 처리가 가능한 주문용 챗봇 개발 (Development of ordering chatbot that can process multiple keywords based on recursive slot-filling method)

  • 최현준;배승주;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권4호
    • /
    • pp.440-448
    • /
    • 2019
  • 이 논문에서는 빈칸 되묻기 방식 기반 다중 키워드 처리가 가능한 주문용 챗봇을 제안한다. 일반적으로 챗봇을 이용한 주문 서비스의 경우에는 개발자가 미리 정의한 순서에 따라서만 주문이 진행된다. 그리고 한번의 답변으로 들어올 수 있는 입력 정보가 정해져 있기 때문에 사용자에 따라 다른 입력을 고려하지 못한다. 이 연구에서는 이러한 문제를 해결하기 위해 빈칸 되묻기 방식을 사용하여 다중 키워드 동시 처리를 하고자 한다. 빈칸 되묻기 방식은 다음과 같이 진행된다. 첫번째, 각 주문 단계에서 입력 받아야 하는 정보를 저장할 수 있는 배열을 미리 만들어 둔다. 그리고 각 주문 단계별로 받을 수 있는 정보들을 키워드로 미리 지정한다. 두번째로, 입력된 문장에서 키워드를 추출하는 작업을 진행한다. 그리고 추출된 키워드들을 해당하는 주문 단계의 배열에 채워 넣는다. 마지막으로, 각 주문 단계의 배열을 체크하면서 비어있는 단계에 대한 질문만 진행하여 부족한 정보들을 전부 채운다. 배열이 모두 채워지면 주문이 완료된다. 제안하는 방식은 한 문장에 주문과 관련된 키워드가 여러 개이더라도 처리가 가능하다. 그리고 한 번에 여러 개의 키워드를 처리할 수 있기 때문에 주문 단계를 생략하여 주문 시간을 줄일 수 있다. 안드로이드 스마트폰을 이용해 챗봇을 구현하고 빈칸 되묻기 방식을 이용해 주문 단계의 동적 처리가 되는지 실험을 통해 확인한다.

건강보험 연구동향에 대한 키워드 네트워크 분석 (A Keyword Network Analysis on Research Trends in the Area of Health Insurance)

  • 이수정;이선희
    • 보건행정학회지
    • /
    • 제31권3호
    • /
    • pp.335-343
    • /
    • 2021
  • Background: The purpose of this study was to extract the major areas of interest in health insurance research in Korea, and infer policy agendas related to health insurance by analyzing research keywords. Methods: For this study, 2,590 articles were selected from among 7,459 academic papers related to health insurance published between January 1987 and December 2018, which were looked up using the Research Information Sharing Service (RISS). Keyword extraction and keyword network analysis were performed using the KrKwic, KrTitle, and UCINET software. Results: First, the number of studies in the area of health insurance continued to increase in all government terms, and it was not until after the 2000s that the subjects of health insurance researches were diversified. Second, degree centrality showed that 'medical expenditure' and 'medical utilization' were consistently high-ranking keywords regardless of the government in power. Aging and long-term care insurance-related keywords were ranked higher in the Lee Myung-bak government, Park Geun-hye government, and Moon Jae-in government. Third, betweenness centrality showed the same high ranking in key topics such as medical expenditure and medical utilization, while the ranking of key keywords differed depending on the interests and characteristics of each government policy. Conclusion: We confirm that health insurance as a research topic has been the main theme in Korean health care research fields. Research keywords extracted from articles also corresponded to the main health policies promoted during each government period. Efforts to systematically investigate policy megatrends are needed to plan adaptive future policies.

텍스트마이닝을 활용한 농업 R&D 키워드 분석 (A Study on the Analysis of Agricultural R&D Keywords Using Textmining Method)

  • 김지훈;김성섭
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.721-732
    • /
    • 2021
  • 본 연구는 농업 R&D의 추세를 살펴보고자 텍스트마이닝 기법을 활용하여 농업 R&D에 해당하는 키워드를 분석하였다. 분석자료는 NTIS의 국가연구개발사업 과제정보를 활용하였으며, 2003년부터 2018년까지의 농업 R&D의 주요 키워드를 연도별 및 연구개발단계별로 구분하였다. 텍스트마이닝을 위해 키워드의 TF-IDF를 계산하여 점수별로 순위를 매기었으며, 유사한 키워드별로 그룹화하여 해석하였다. 주요 분석 결과는 다음과 같다. 첫 번째, 신기술의 도입과 외부 환경에 변화에 따른 농업 R&D 트렌드가 변화해가고 있다. 시간이 흐를수록 새로운 키워드가 대두되고 있으며, 기초연구 단계에서는 '기후변화'가, 응용연구 단계에서는 'ICT'와 '스마트팜'이, 개발연구 단계에서는 '수출' 키워드가 주되게 등장하고 있다. 두 번째, 연구개발 단계에서 시차를 가지고 키워드 변화가 나타나고 있다. 기초연구-응용연구-개발연구 순으로 주요 키워드가 변화하고 있으며, 대표적으로 '기후변화'와 '신품종' 키워드가 연구개발단계별로 연계되어 있었다. 세번째, 농업 R&D의 대표적인 키워드는 '벼' 키워드로 나타났다. 그러나 '녹색 및 기후변화 대응'과 '가공 및 유통기술' 같이 국내외 농업 환경 변화에 따라 연구의 방향성과 목적이 변화하고 있었다.

다중 수신자 환경에서 키워드 검색 가능한 공개키 암호시스템 (Public Key Encryption with Keyword Search in Multi-Receiver Setting)

  • 이현숙;박종환;이동훈
    • 정보보호학회논문지
    • /
    • 제19권2호
    • /
    • pp.31-38
    • /
    • 2009
  • 키워드 검색 가능한 공개키 암호 (PEKS)은 검색어에 대한 프라이버시를 제공하기 위해서 Boneh et. al.에 의해서 처음으로 제안되었다. 검색 가능한 공개키 암호 (PEKS) 기술은 송신자가 수신자의 공개키로 암호화된 메일 메시지를 이메일 서버에 보내고 서버는 암호문과 송신자에 의해서 생성된 암호화된 쿼리를 이용하여 암호화된 메일 메시지와 암호화된 검색어와의 관련성을 얻는 것이 가능하도록 한다. 이러한 메일 시스템에서는 그룹메일과 같이 하나의 암호화된 메일을 다수의 수신자에게 전송하는 경우를 생각할 수 있다. Hwang과 Lee는 이러한 점을 고려하여 다중 수신자환경에서 FEKS 스킴을 제안하였다. 이러한 다수의 수신자의 환경에서는 전송되는 데이터의 사이즈와 서버의 계산량을 줄이는 것이 중요한 이슈이다. 본 논문에서는 서버측의 페어링(Pairing) 계산량을 줄인 좀더 효율적인 다수의 수신자를 고려한 mPEKS 스킴을 제안한다.

빅데이터를 활용한 국가생태문화탐방로 이용자의 경험분석 - 부안 마실길과 군산 구불길을 대상으로 - (An Analysis of the Experience of Users of National Ecological and Cultural Exploration Routes Using Big Data - A Focus on the Buan Masil Road and Gunsan Gubul Road -)

  • 이현정;안병철
    • 한국환경복원기술학회지
    • /
    • 제23권6호
    • /
    • pp.151-166
    • /
    • 2020
  • Various experience keywords were derived through text mining analysis of two National Ecological and Cultural Exploration Routes. The results of this study were drawn as follows: The interaction between the experience keywords was analyzed by the degree centrality, closeness centrality, and betweenness centrality value calculated through the centrality analysis of the research site experience keywords. First, In the text mining analysis, 'walking' appeared as the top keyword in the I, II, and III periods of the two target areas. The keywords related to the stay type of "rental cottage" and "recreational forest" were derived for Masil Road in relation to accommodation facilities. However, the keywords related to the accommodation were not derived in Gubul Road. Second, as a result of the centrality analysis, the degree centrality of the keywords "walking", "sea", "look", "salt flats" of Masil Road and "walking", "lake" and "park" of Gubul Road was high. The keywords located at the center are "walking" and "sea" in the Masil Road, and "walking" in the Gubul Road. As an influential keyword, Masil Road is "experience" and Gubul Road is "history". Third, According to the results of the analysis, the keywords that appeared at the top of the Gubul Road are derived from the keywords related to the 1 ~ 8 course, and it is judged that the visitors are visiting the 1 ~ 8 course trail evenly. However, the Gubul Road only appears in the top keyword only for a few courses. Through this, it seems that three courses are intensively visited as the main course of 6 Gubul Road, 6-1 Gubul Road, and 8 Gubul Road.

A Method for Compound Noun Extraction to Improve Accuracy of Keyword Analysis of Social Big Data

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.55-63
    • /
    • 2021
  • 소셜 빅데이터는 신조어나 고유명사를 포함하는 경우가 많으며, 이들을 처리하기 위해 단어별 출현 빈도수를 기반으로 한 통계적인 형태소 분석 방법이 많이 활용되고 있다. 그러나 이들 방법에서는 복합 명사를 제대로 인지하지 못해, 키워드 추출의 정확도가 떨어지는 문제점이 지적되고 있다. 본 논문에서는 소셜 빅데이터의 키워드 분석에 있어 복합 명사를 추출하기 위한 방법을 제안한다. 제안 방법은 형태소 분석 단계를 통해 얻어진 단어를 조합하여 복합 명사 후보군을 만들고, 주어진 리뷰에서 이들의 출현 빈도를 조사하여 얻어진 빈도수를 기반으로 복합 명사를 추출한다. 복합 명사 후보군을 구성하는 방법에 따라 두 가지 알고리즘을 제안하였으며, 각 알고리즘의 성능을 수식으로 표현하고 비교한다. 그리고 온라인에서 수집된 실제 데이터를 대상으로 실험을 통해 비교 결과를 검증하는 동시에, 제안 방법이 실시간 처리에도 적합함을 보여준다.