• Title/Summary/Keyword: domain of words

검색결과 213건 처리시간 0.023초

문헌정보학의 정보행동과 의학분야의 건강정보탐색행동에 대한 연구들의 비교 분석 (A Comparative Analysis of Research on LIS Information Behavior and Health Information Seeking Behavior)

  • 김은기
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.167-187
    • /
    • 2019
  • 본 논문은 정보행동 분야에 상당한 연구가 진척된 문헌정보분야의 정보행동에 관한 연구와 의학분야의 건강정보탐색행동 연구를 비교하였다. 이 연구는 계량서지학적 접근으로 진행하였다. 연구 실행을 위해 Scopus 데이터베이스를 사용하여 서지기록들을 문헌정보학과 건강과의학 분야별로 데이터 세트를 구성하였다. 계량서지학적 분석은 다음과 같은 영역으로 실행하였다: 출판된 논문, 인용, 논문지, 저자키워드, 제목에서 고유한 단어, 제목에서 "information" 앞에 이용되는 단어들, 제목에서 "study" 앞에 이용되는 단어들, 제목에서 국가명을 표기한 단어들, 저자 키워드와 색인 키워드. 결과적으로, 두 분야에서 드러난 정보행동에 관한 연구영역에서의 주요차이점은 정의, 주된 초점, 일반적인 인구통계학적 그룹에서 분명하게 나타났다. 이러한 다양한 차이점은 두 학계 연구자들에게 정보 탐색과 정보행동을 연구하는데 있어 학계별 특수한 차이와 상황들에 따라 유연하게 접근하고 적용해야 함을 시사하였다.

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법 (Inverse Document Frequency-Based Word Embedding of Unseen Words for Question Answering Systems)

  • 이우인;송광호;심규석
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.902-909
    • /
    • 2016
  • 질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고 있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.

IPTV의 VOD 어노테이션을 위한 반자동 온톨로지 모델링 (Semi-automatic Ontology Modeling for VOD Annotation for IPTV)

  • 최정화;허길;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권7호
    • /
    • pp.548-557
    • /
    • 2010
  • 본 연구는 IPTV의 지능형 검색을 가능하게 하는 VOD 어노테이션을 위해 효율적인 반자동 온톨로지 모델링 기법을 제안한다. 제안하는 방법은 워드넷(WordNet)으로 부터 특정 도메인(또는 장르)을 대표하는 콘텐츠에 관련된 키워드의 상 하위어와 동의어에 해당하는 부분 트리를 추출하고, 워드넷에 없는 외래어, 한자어 등은 확장하여 콘텐츠 온톨로지를 구축한다. 이 온톨로지는 보편적 계층구조와 특정 계층구조를 생성한다. 전자는 콘텐츠와 관련 키워드를 제약 기술(description)을 포함하는 클래스로 정의한 어휘의 의미 모델이다. 후자는 생성된 모델에 함의관계(subsumption) 추론 기술을 적용하여 키워드를 관련있는 콘텐츠로 추론한 모델이다. 어노테이션은 이 온톨로지를 기반으로 VOD에 콘텐츠와 장르의 메타데이터를 의미 기반으로 생성한다. 보편적 계층구조는 서비스 도메인에 독립적으로 재사용이 가능하며, 특정 계층구조는 서비스 목적에 맞는 완전하고 함축적인 모델을 생성한다. 제안하는 방법은 서비스 도메인에 상관없이 적용 가능한 알고리즘이며, 2,400건의 테스트 데이터로 어노테이션 결과를 평가하여 82%의 정확도를 보였다.

Word Embedding 자질을 이용한 한국어 개체명 인식 및 분류 (Korean Named Entity Recognition and Classification using Word Embedding Features)

  • 최윤수;차정원
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.678-685
    • /
    • 2016
  • 한국어 개체명 인식에 다양한 연구가 있었지만, 영어 개체명 인식에 비해 자질이 부족한 문제를 가지고 있다. 본 논문에서는 한국어 개체명 인식의 자질 부족 문제를 해결하기 위해 word embedding 자질을 개체명 인식에 사용하는 방법을 제안한다. CBOW(Continuous Bag-of-Words) 모델을 이용하여 word vector를 생성하고, word vector로부터 K-means 알고리즘을 이용하여 군집 정보를 생성한다. word vector와 군집 정보를 word embedding 자질로써 CRFs(Conditional Random Fields)에 사용한다. 실험 결과 TV 도메인과 Sports 도메인, IT 도메인에서 기본 시스템보다 각각 1.17%, 0.61%, 1.19% 성능이 향상되었다. 또한 제안 방법이 다른 개체명 인식 및 분류 시스템보다 성능이 향상되는 것을 보여 그 효용성을 입증했다.

온톨로지 이질성 문제를 해결하기 위한 온톨로지 매칭 방법 (Ontology Matching Method for Solving Ontology Heterogeneity Issue)

  • 단홍조우;이용주
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.571-576
    • /
    • 2024
  • 온톨로지는 도메인 전문가에 의해 만들어지지만, 동일한 내용이라도 전문가마다 도메인 지식에 대한 이해가 다르기 때문에 상이하게 표현될 수 있다. 아직 온톨로지 표준화가 부족하기 때문에 동일한 도메인 내에 여러 개의 온톨로지가 존재할 수 있으며, 이로 인해 온톨로지 이질성이라는 현상이 발생한다. 따라서 우리는 온톨로지 이질성 문제를 해결하기 위해 SCBOW(: Siames Continuois Bag Of Words)와 BERT(: BiDirectional Encoder Representations from Transformers) 모델을 결합한 새로운 온톨로지 매칭 방법을 제안한다. 온톨로지를 그래프로 표현하며, 온톨로지 매칭 문제에서 발생할 수 있는 일대다 문제를 해결하기 위해 SimRank 알고리즘을 사용한다. 실험 결과 우리의 접근 방식이 전통적인 매칭 알고리즘보다 약 8%의 성능 향상을 보였다. 제안 방법은 온톨로지 매칭에 사용되는 정렬 기술을 향상하고 개선할 수 있다.

함정 전투체계의 도메인 컴포넌트 참조 아키텍처 (Domain Component Reference Architecture within Naval Combat System)

  • 이선열;채흥석
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1443-1450
    • /
    • 2019
  • 함정 전투체계는 기술의 발전을 적극적으로 수용하여 점진적으로 진화하고 있다. 함정 전투체계의 도메인 컴포넌트들 또한 함정 전투체계의 점진적 진화에 맞추어 변경되어야 한다. 즉, 도메인 컴포넌트는 변경용이성을 가져야 한다. 그러나 기존 도메인 컴포넌트는 변경용이성을 충분히 고려하지 않는다. 특히, 미들웨어로부터 계획된 것보다 더 많은 메시지를 수신할 경우, 이에 대응하기 위한 방안을 고려하지 않는다. 우리는 증가된 메시지에 신속하게 대응할 수 있는 도메인 컴포넌트 참조 아키텍처를 제안한다. 제안된 아키텍처는 비즈니스 로직이 독립적으로 동작할 수 있도록 도메인 컴포넌트를 분리하고, 다수의 비즈니스 로직이 동시에 동작하도록 설정하여 증가된 메시지를 처리하고자 한다. 제안된 참조 아키텍처를 이용하여 표적관리 도메인 컴포넌트를 설계하여 참조 아키텍처의 적용 가능성을 확인하였다.

패션 트렌드의 다중화(多重化) 현상(現象)에 대(對)한 범주(範疇) 분석(分析) - 1995 S/S$\sim$2001/2002 A/W 시즌을 중심(中心)으로 - (A Domain Analysis on the Hybrid of Fashion Trends - Fashion Trends of 1995 S/S $\sim$ 2001/2002 A/W -)

  • 윤수정;이주현
    • 패션비즈니스
    • /
    • 제6권2호
    • /
    • pp.110-123
    • /
    • 2002
  • This study investigated the influence of cultural and general trend of the times on fashion trends and the hybridization of these trends. The objectives of this study were to suggest new approach method of the fashion forecasting and to find out the cultural meanings and values of fashion. Key words that explains fashion trend from spring/summer of 1995 to fall/winter of 2002 were collected from professional fashion trend journals. These terms were analysed with domain analysis based on the semantic relationship. The frequency of their appearance in each season and the aspect of their appearance in each season were analysed. The hybrids of the fashion trends were analysed longitudinally and cross-sectionally as well by investigating the cover terms that were found as a result of domain analysis. The method used in this study can be applied to future study of fashion trend in that it offers an objective view of fashion trend and can allow researchers to study fashion trend in a concrete way.

한국어 극성 사전 구축을 위한 크라우드소싱 기반 감성 단어 극성 태깅 게임 (A Crowdsourcing-based Emotional Words Tagging Game for Building a Polarity Lexicon in Korean)

  • 김준기;강신진;배병철
    • 한국게임학회 논문지
    • /
    • 제17권2호
    • /
    • pp.135-144
    • /
    • 2017
  • 감성 분석은 글을 통해 작성자의 주관적인 생각이나 느낌을 분석하는 방법으로 효과적인 감성 분석을 위해서는 감성 단어 극성 사전 구축이 필수적이다. 본 논문은 효율적인 한국어 극성 사전 구축을 위해 우리가 개발한 크라우드소싱 기반 게임을 소개한다. 먼저, 크롤러를 이용해 인터넷 커뮤니티에서 말뭉치들을 수집했고, Twitter 형태소를 이용해 수집한 말뭉치를 형태소별로 분류하고 단어화했다. 이 단어들은 모바일 플랫폼 기반 태깅 게임 형태로 제공되어 게임플레이를 통해 플레이어들이 자발적으로 단어들의 극성을 선택하고 결과가 데이터 베이스에 축적되도록 게임이 설계되었다. 현재까지 약 1200여개의 단어들의 극성을 태깅하였으며, 향후 좀 더 많은 감성 단어 데이터들을 축적함으로써 특히 게임 도메인에서 한국어 감성 분석 연구에 기여할 것으로 기대한다.

A Methodology for Ontology-based Knowledge Acquisition and Structuring in an Industry-Academic-Government Project ″Go Japan!″

  • Hideki-Mima;Yoon, Tae-Sung
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2003년도 종합학술대회 논문집
    • /
    • pp.197-203
    • /
    • 2003
  • The purpose of the study is to develop an integrated knowledge structuring system for the domain of engineering, in which ontology-based literature mining, knowledge acquisition, knowledge integration, and knowledge retrieval are combined using XML-based tag information and ontology management. The system supports combining different types of databases (papers and patents, technologies and innovations) and retrieving different types of knowledge simultaneously. The main objective of the system is to facilitate knowledge acquisition and knowledge retrieval from documents through an ontology-based dynamic similarity calculation and a visualization of automatically structured knowledge. Through experimentations we conducted using 100,000 words economic documents reported in the "Go! Japan" project for analyzing Japanese industrial situation, and 100,000 words molecular biology Papers, we show the system is Practical enough for accelerating knowledge acquisition and knowledge discovery from the information sea.

  • PDF

RASTA 필터를 이용한 립리딩 성능향상에 관한 연구 (A Study on Lip-reading enhancement using RATSTA fileter)

  • 신도성;김진영;최승호;김상훈
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.191-194
    • /
    • 2002
  • Lip-reading technology that is studied them is used to compensate speech recognition degradation in noise environment in bi-modal's form. The most important thing is that search for correct lips area in this lip-reading. But, it is hard to forecast stable performance in dynamic environment. Used RASTA filter that show good performance to remove noise in the speech to compensate. This filter shows that improve performance of using time domain of digital filter. To this experiment observes performance of speech recognition only using image information, service chooses possible 22 words and did recognition experiment in car. We used hidden Markov model by speech recognition algorithm to compare this words' recognition performance.

  • PDF