• 제목/요약/키워드: Co-word

검색결과 310건 처리시간 0.022초

키팩트 색인텀에 기반한 정보검색 시스템 (An Information Retrieval System Based on Keyfact Index Term)

  • 박의규;나동열;변성찬;정경택;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.245-251
    • /
    • 2000
  • 지금까지의 정보검색 시스템은 소위 키워드 기반 정보검색 시스템으로서 색인이 단일 단어(single word) 즉 키워드의 집합으로 나타내어 진다. 그러나 이 방법은 문서의 내용을 정확히 표현하는 데 한계가 있다. 따라서 최근에는 단어 이상의 구문 단위인 구(phrase)를 이용하여 색인과 검색을 하도록 하는 시스템을 개발하고자 하는 추세에 있다. 따라서, 본 논문에서는 키워드보다는 의미를 좀더 잘 나타내고 일반적인 구보다는 정형화된 형태의 색인 단위인 키팩트를 색인어로 하는 정보검색시스템을 개발하고 이의 성능을 살펴보았다.

  • PDF

웹 환경에서 100 논문에 대한 텍스트 마이닝, 데이터 분석과 시각화 (100 Article Paper Text Minning Data Analysis and Visualization in Web Environment)

  • 이효맹;이가베;이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.157-158
    • /
    • 2017
  • There is a method to analyze the big data of the article and text mining by using Python language. And Python is a kind of programming language and it is easy to operating. Reaserch and use Python to creat a Web environment that the research result of the analysis can show directly on the browser. In this thesis, there are 100 article paper frrom Altmetric, Altmetric tracks a range of sources to capture. It is necessary to collect and analyze the big data use an effictive method, After the result coming out, Use Python wordcloud to make a directive image that can show the highest frequency of words.

  • PDF

공기정보를 이용한 단어 의미 중의성 해결 방안 (Word Sense Disambiguation Method Using Co-occurrence Information)

  • 박요셉;김경임;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.177-178
    • /
    • 2010
  • 단어 의미 중의성은 자연언어처리 분야에서의 주요 관심 분야이다. 한국어에서의 단어 의미 중의성 문제는 다른 언어에 비하여 연구가 미흡한 상태이다. 기존 연구에서는 빈도 수에 기반한 공기 정보 벡터를 이용한 방법에서 처리되지 못하는 경우가 발생하였다. 또한 사전에 기반한 상위어 추출 시에 정형화된 형태가 아닌 경우에 어려움이 발생하였다. 본 논문에서는 상호정보량을 추가하여 공기 정보 처리 과정 시에 발생하는 오류를 최소화 하였다. 또한 대상 명사의 상위어 추출 문제를 해결하기 위해 어휘 지식 베이스를 적용하였다.

  • PDF

바이오인포매틱스 분야 회색문헌 및 백색문헌의 연구 동향 비교 분석 (Analyzing Research Trends in Bioinformatics based on Comparison between Grey and White Bioinformatics Literatures)

  • 김예은;김정주;송민
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.11-14
    • /
    • 2013
  • 본 연구의 목적은 바이오인포매틱스 분야의 회색문헌과 백색문헌의 초록을 대상으로 단어 동시출현(word co-occurrence)네트워크 분석을 통해 해당 분야의 연구 동향을 비교 분석하고자 하였다. 이를 위해 2010년부터 2012년까지 발표된 회색문헌인 회의자료(proceeding)와 백색문헌인 학술논문(journal article)의 초록을 SCOPUS, IEEEXplore, Microsoft academic search에서 수집하였다. 단어 동시출현 네트워크를 분석한 결과 회색문헌의 주요 연구는 분석도구 및 방법으로, 백색문헌의 주요 연구는 바이오인포매틱스의 주요 연구대상인 유전자 발현, 단백질 서열 및 구조 등으로 나타났다.

  • PDF

단어빈도와 유사도 분석을 이용한 다중주제 회의록 요약시스템 (Design and Implementation of a Multi-Subject Minutes Summary System Based on Word Frequency and Similarity Analysis)

  • 허강호;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.453-454
    • /
    • 2019
  • 현대 사회에서는 의사 결정을 위해 다양한 도구가 사용되고 있다. 대규모로 진행되는 토의나 토론에서는 데이터를 분석하는데 많은 비용과 시간이 소모되고 있다. 회의록 요약시스템은 기존 문서처리방법을 자동화하여 인건비 절감과 처리시간을 단축하는 긍정적 효과를 기대하고 있다. 본 논문은 기존에 수작업으로 진행되었던 과정을 보다 효과적으로 운영할 수 있도록 회의록 요약시스템을 설계하고 구현한다. 대규모 토론이나 토의에서도 요약시스템 통해 대표의견을 제시받아 정확한 의사결정을 하여 시간절약과 비용절감 효과를 기대한다.

  • PDF

Examining China's Internet Policies through a Bibliometric Approach

  • Li, Jiang;Xu, Weiai Wayne;Wang, Fang;Chen, Si;Sun, Jianjun
    • Journal of Contemporary Eastern Asia
    • /
    • 제17권2호
    • /
    • pp.237-253
    • /
    • 2018
  • In order to understand China's internet governance, this paper examined 1,931 Internet policies of China by bibliometric techniques. Specifically, the bibliometric techniques include simple document counting, co-word analysis, collaboration network analysis and citation analysis. The findings include: (1) China's Internet legislations mainly emphasized e-commerce and Internet governance, and, to some extent, neglected personal data protection; (2) China's Internet is under intensive multiple regulatory controls by central government. A large number of government agencies are involved in Internet policy-making. The Propaganda Department of the Central Committee of the Communist Party of China and the State Information Leading Group of the State Council, enforced fewer policy documents, but occupy higher positions in the Internet governance hierarchy; (3) China's Internet legislation system is primarily composed of industry-specific administrative rules, rather than laws or administrative regulations. Nevertheless, laws and administrative regulations received significantly more citations owing to their superior force. This paper also discussed current gaps in China's internet governance and how the country's internet policies are situated in the broader global context.

동시출현단어 분석을 이용한 도서관경영 분야의 지적구조 분석 (A Study on the Analysis of Intellectual Structure of Library Management Studies using Co-Word Analysis)

  • 이정규;이용구
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.23-26
    • /
    • 2013
  • 지식기반사회와 정보홍수시대로 갈수록, 도서관의 존속여부에 대한 고민으로 도서관경영의 중요성은 심화되며, 관련 연구가 많이 이루어지고 있다. 이에 본 연구는 동시출현단어 분석을 통해 도서관경영 분야의 지적구조를 분석하였다. 데이터 수집은 2001~2013년도까지 한국연구재단에 등재된 5개의 문헌정보학 관련 학회지를 대상으로 하였으며, 해당 논문 수는 413건이다. 데이터 처리후 군집분석을 실시하여 9개의 군집을 형성하였으며, 해당 군집은 장서개발, 디지털도서관, 공공도서관, 마케팅 및 조직관리, 국립중앙도서관 및 작은도서관, 인사관리(직무/자격제도), 대학도서관, 학교도서관, 서비스 품질평가이다. 이러한 연구 결과는 기존의 도서관경영 분야의 주제영역과 비교하였다.

  • PDF

Equipment and Worker Recognition of Construction Site with Vision Feature Detection

  • Qi, Shaowen;Shan, Jiazeng;Xu, Lei
    • 국제초고층학회논문집
    • /
    • 제9권4호
    • /
    • pp.335-342
    • /
    • 2020
  • This article comes up with a new method which is based on the visual characteristic of the objects and machine learning technology to achieve semi-automated recognition of the personnel, machine & materials of the construction sites. Balancing the real-time performance and accuracy, using Faster RCNN (Faster Region-based Convolutional Neural Networks) with transfer learning method appears to be a rational choice. After fine-tuning an ImageNet pre-trained Faster RCNN and testing with it, the result shows that the precision ratio (mAP) has so far reached 67.62%, while the recall ratio (AR) has reached 56.23%. In other word, this recognizing method has achieved rational performance. Further inference with the video of the construction of Huoshenshan Hospital also indicates preliminary success.

Predicting the Adoption of Health Wearables with an Emphasis on the Perceived Ethics of Biometric Data

  • Tahereh Saheb;Tayebeh Saheb
    • Asia pacific journal of information systems
    • /
    • 제31권1호
    • /
    • pp.121-140
    • /
    • 2021
  • The main purpose of this research is to understand the strongest predictors of wearable adoption among athletes with an emphasis on the perceived ethics of biometric data. We performed a word co-occurrence study of biometrics research to determine the ethical constructs of biometric data. A questionnaire incorporating the Unified Theory of Acceptance and Use of Technology (UTAUT), Health Belief Model and Biometric Data Ethics was then designed to develop a neural network model to predict the adoption of wearable sensors among athletes. Our model shows that wearable adoption's strongest predictors are perceived ethics, perceived profit, and perceived threat; which can be categorized as professional stressors. The key theoretical contribution of this paper is to extend the literature on UTAUT by developing a predictive modeling of factors affecting acceptance of wearables by athletes, and highlighting the ethical implications of athlete's adoption of wearables.

단어 간 관계 패턴 학습을 통한 하이퍼네트워크 기반 자연 언어 문장 생성 (Hypernetwork-based Natural Language Sentence Generation by Word Relation Pattern Learning)

  • 석호식;작가멧;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.205-213
    • /
    • 2010
  • 본 논문에서는 단어간 관계 패턴을 학습한 후 이에 기반하여 자연 언어 문장을 생성하는 방법을 소개한다. 기존의 문장 생성 방법론에서는 내재된 문법 규칙의 존재를 가정하거나 템플릿을 사용하고 있으나, 본 논문에서 소개하는 방법론에서는 태깅 등의 부가 정보 없이 단어의 동시 등장 빈도만을 활용하여 단어간 관계 패턴을 학습한다. 단어간 관계 패턴은 하이퍼네트워크 방법론에 기반하여 학습되었다. 학습이 진행됨에 따라 하이퍼네트워크의 복잡도가 높아지며, 학습 모델에 축적되는 언어 관계 패턴의 수가 증가한다. 학습된 모텔의 유효성은 학습 패턴에 기반한 자연 언어 문장 생성을 통해 확인하였다. 실험 결과 학습이 진행됨에 따라 문법적으로 성립하는 문장의 비율이 향상하였다. 파서를 이용하여 생성된 문장을 구성하는 문법 규칙을 분석한 후 문법 규칙의 분포를 학습에 사용한 코퍼스의 문법 규칙 분포와 비교한 결과 학습에 사용된 코퍼스의 문법적 특성을 학습할 수 있는 잠재력을 갖고 있음을 확인하였다.