• 제목/요약/키워드: synonyms

검색결과 155건 처리시간 0.018초

폭소노미 분위기 태그를 이용한 음악의 분위기 유형 분석 (Analysis of Music Mood Class using Folksonomy Tags)

  • 문창배;김현수;김병만
    • 감성과학
    • /
    • 제16권3호
    • /
    • pp.363-372
    • /
    • 2013
  • 폭소노미 (foxonomy) 분위기 태그를 이용한 음악 검색 시 내부적으로 단어 태그 대신에 수치 태그 (AV 태그: Arousal과 Valence 값으로 이루어진 태그)를 이용하면 폭소노미의 문제점 중의 하나인 유사어 문제점을 일부 해결할 수 있다. 하지만 이를 위해서는 두 가지 선행 작업이 제대로 이루어져야 하는데, 그 첫 번째가 단어 태그를 수치 태그로 변환하는 작업이며 그 두 번째가 검색 대상인 음악을 수치 태그로 표현하는 작업이다. 첫 번째 작업에 대해서는 이전 연구를 통하여 그 유의성을 보였기 때문에 본 논문에서는 두 번째 작업에 대해서 그 유의성을 밝히고자 하였다. 이를 위하여 본 논문에서는 음악과 AV값 간의 관계를 정의하는 음악-분위기 매핑테이블을 제안하고, ANOVA 검증을 이용하여 분석 하였다. 실험 결과, 동의어 포함 유무에 무관하게 음악 구간의 A값과 V값 모두 12개 음악의 분위기에 대하여 분포차가 발생하고, 모두 제 1종 오류확률 P<0.001를 만족하였다. 결론적으로 음악의 분위기에 따라 AV 값 분포가 다르다는 것을 확인할 수 있었다.

  • PDF

XML문서의 자동변환을 위한 스키마 매칭 알고리즘 (A Schema Matching Algorithm for an Automated Transformation of XML Documents)

  • 이준승;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1195-1207
    • /
    • 2004
  • 스키마 매칭은 XML문서의 자동 변환을 위한 전처리 과정으로서 필수적이다. 스키마 매칭에 관한 기존 연구는 의미적으로 대응 가능한 모든 매칭관계를 고려하기 때문에 다대다의 대응관계를 추출한다. 이에 명확한 매칭관계를 필요로하는 XML문서의 자동변환에는 적합하지 않다. 본 논문에서는 스키마 사이의 일대일 대응관계를 추출할 수 있는 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 단발노드 사이의 언어적 유사도와 데이터타입 유사도를 이용하여 후보매칭을 계산한다. 계산된 후보매칭의 경로유사도 비교를 통해 일대일 매칭을 추출하게 된다. 특히 제안된 방법은 보다 정교한 수준의 스키마 매칭을 위하여 축약어 사전, 동의어 사전, 그리고 도메인 온탈로지에 기반한다. 제안된 알고리즘의 성능을 평가하기 위해서 전자상거래 분야에서 사용 중인 스키마를 대상으로 실험한 결과, 평균적으로 97%의 정확률을 보여 기존 연구보다 우수하였다.

  • PDF

해양 생물다양성 정보시스템 개발 -한국 해양생물 종 목록 수립을 중심으로- (Development of the Korea Marine Biodiversity Information System -Focus on the Establishment of the Korea Maine Species Inventory-)

  • 박수영;김성대;이윤호;배세진;박흥식;김충곤
    • Ocean and Polar Research
    • /
    • 제29권3호
    • /
    • pp.273-282
    • /
    • 2007
  • For an efficient management and utilization of marine biodiversity information, we made an attempt to develop the Korea Marine Biodiversity Information System (KoMBIS), building a species name inventory of Korea marine organisms. The inventory includes 17 organism groups: phytoplankton, zooplankton, algae and halophyte, sponges, cnidarians, rotifers, nematodes, bryozoans, brachiopods, molluscs, echiurans, annelids, arthropods, echinoderms, urochordates and fish. The species names were collected from 37 different references and reviewed for validity by taxonomists, which resulted in 9,798 valid names in addition to 1,845 synonyms. The Korea marine species inventory is the first one of this kind, for previous Korean species name inventories were mostly composed of terrestrial and freshwater organisms. KoMBIS, the information system developed, contains not only the species name but also information on morphological and ecological characteristics such as distribution, DNA barcode, and references. This system is convenient for the inputting of new data and servicing users through the internet, so that management and utilization of the biodiversity information is more efficient. Linking the DNA barcode data with species information provides an objective measure for identification of a species, which accommodates the recommendation of Consortium for the Barcode of Life, and makes the Korea marine biodiversity information compatible with international databases. Considering the frequent exchange of marine organisms internationally via ballast water and such issues as climate change, this information system will be useful in many areas of marine biodiversity.

실험동물의 발생이상 용어집 (Terminology of Developmental Abnormalities in Common Laboratory Animals)

  • 김종춘;양영수;안태환;김성호;정수연;이규식;정나영;정문구
    • Toxicological Research
    • /
    • 제22권3호
    • /
    • pp.157-220
    • /
    • 2006
  • This paper presents the first version of a Korean glossary of terms for structural developmental abnormalities in common laboratory animals, mainly rats, mice and rabbits. This is a translation of the glossary entitled Terminology and Developmental Abnormalities in Common Laboratory Mammals that was edited by the International Federation of Teratology Societies(IFTS) Committee on International Harmonization of Nomenclature in Developmental Toxicology. The purpose of the Korean glossary is to provide a common vocabulary that will reduce confusion and ambiguity in the description of developmental effects, particularly in submissions to regulatory agencies worldwide. The glossary contains a primary term or phrase, a definition of the abnormality, and notes, where appropriate. Selected synonyms or related terms, which reflect a similar or closely related concept, are noted. Non-preferred terms are indicated where their usage may be incorrect. Modifying terms used repeatedly in the glossary(e.g., absent, branched) are listed in Appendix A, and syndrome names are generally excluded from the glossary, but are listed separately in Appendix B. The glossary is organized into broad sections for external, visceral, and skeletal observations, then subdivided into regions, structures, or organs in a general overall head to tail sequence. Numbering is sequential, and not in any regional or hierarchical order, Uses and misuses of the glossary are discussed. Updates of the Korean glossary are planned based on the comments received.

이산 푸리에 변환을 적용한 텍스트 패턴 분석에 관한 연구 - 표절 문장 탐색 중심으로 - (A Study on Text Pattern Analysis Applying Discrete Fourier Transform - Focusing on Sentence Plagiarism Detection -)

  • 이정송;박순철
    • 한국산업정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.43-52
    • /
    • 2017
  • 패턴 분석은 신호 및 영상 처리와 텍스트 마이닝 분야에서 가장 중요한 기술 중 하나이다. 이산 푸리에 변환(Discrete Fourier Transform: DFT)은 일반적으로 신호와 영상의 패턴을 분석하는데 사용된다. 본 논문에서는 DFT가 텍스트 패턴 분석에도 적용될 수 있음을 가정하고 문서의 텍스트 패턴이 다른 문서에서도 존재하는지를 탐색하는 표절 문장 탐색에 세계 최초로 적용하였다. 이를 위해 텍스트를 ASCII 코드로 변환하여 신호화하고 복사/붙여넣기, 용어의 재배치 등 단순한 표절 형태의 탐색은 Cross-Correlation(상호상관)을 이용하였다. 또한 유의어를 사용하거나 번역 및 요약 등의 표절 형태를 탐색하기 위해 워드넷(WordNet) 유사도를 사용하였다. 실험을 위해 표절 탐색 분야의 저명한 워크숍인 PAN에서 제공하는 공식적인 데이터 셋(2013 Corpus)을 사용하였으며, 실험 결과 11개의 표절 문장 탐색 기법 중 4번째로 우수한 성능을 보였다.

A Rare and Often Unrecognized Brain Meningitis and Hepatopneumonic Congestion are a Major Cause of Sudden Death in Somatic Cloned Piglets

  • 박미령;조성근;임여정;박종주;김진회
    • 한국동물번식학회:학술대회논문집
    • /
    • 한국동물번식학회 2003년도 학술발표대회 발표논문초록집
    • /
    • pp.18-18
    • /
    • 2003
  • In human, sudden infant death syndrome(SIDS) is synonyms for the sudden, unexpected and unexplained death of an infant. The incidence of SIDS has been estimated to be from 1 to 3%. Cloning has a relatively high rate of late abortion and early postnatal death, particularly when somatic cells are used as donors of nuclei and rates as high as 40 to 70% have been reported. However, the mechanisms for SIDS in cloned animals are not known yet. To date, few reports provide detailed information regarding phenotypic abnormality of cloned pigs. In this study, most of the cloned piglets were alive at term and readily recovered respiration. However, approximately 82% of male cloned piglets (81/22) died within a week after birth. Significant findings from histological examinations showed that 42% of somatic cloned male piglets died earlier than somatic cloned female piglets, most probably due to severe congestion of lung and liver or neutrophilic inflammation in brain, which indicates that unexpected phenotypes can appear as a result of somatic cell cloning. No anatomical defects in cloned female piglets were detected, but three of the piglets had died by diarrhea due to bacterial infection within 15 days after birth. Although most of male cloned piglets can be born normal in terms of gross anatomy, they develop phenotypic anomalies that include leydig cell hypoplasia and growth retardation post-delivery under adverse fetal environment and depigmentation of hair- and skin-color form puberty onset. This may provide a mechanism for development of multiple organ system failure in some cloned piglets. Th birth weights of male cloned pig in comparison with those of female cloned piglets are significantly reduced(0.8 vs 1.4kg) and showed longer gestational day(120 vs 114). In conclusion, brain meningitis and hepatopneumonic congestion are a major risk factor for SIDS and such pregnancy in cloned animals requires close and intensive antenatal monitoring.

  • PDF

문서범주화 성능 향상을 위한 의미기반 자질확장에 관한 연구 (A Semantic-Based Feature Expansion Approach for Improving the Effectiveness of Text Categorization by Using WordNet)

  • 정은경
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.261-278
    • /
    • 2009
  • 기계학습 기반 문서범주화 기법에 있어서 최적의 자질을 구성하는 것이 성능향상에 있어서 중요하다. 본 연구는 학술지 수록 논문의 필수적 구성요소인 저자 제공 키워드와 논문제목을 대상으로 자질확장에 관한 실험을 수행하였다. 자질확장은 기본적으로 선정된 자질에 기반하여 WordNet과 같은 의미기반 사전 도구를 활용하는 것이 일반적이다. 본 연구는 키워드와 논문제목을 대상으로 WordNet 동의어 관계 용어를 활용하여 자질확장을 수행하였으며, 실험 결과 문서범주화 성능이 자질확장을 적용하지 않은 결과와 비교하여 월등히 향상됨을 보여주었다. 이러한 성능향상에 긍정적인 영향을 미치는 요소로 파악된 것은 정제된 자질 기반 및 분류어 기준의 동의어 자질확장이다. 이때 용어의 중의성 해소 적용과 비적용 모두 성능향상에 영향을 미친 것으로 파악되었다. 본 연구의 결과로 키워드와 논문제목을 활용한 분류어 기준 동의어 자질 확장은 문서 범주화 성능향상에 긍정적인 요소라는 것을 제시하였다.

딜리셔스에서 유사태그 추출에 관한 연구 (Mining Semantically Similar Tags from Delicious)

  • 이관
    • 정보관리학회지
    • /
    • 제26권2호
    • /
    • pp.127-147
    • /
    • 2009
  • 자연언어에서 유사어의 처리는 사람과 컴퓨터간의 의사소통에 적지 않은 장애가 되어왔고, 이는 사용자의 임의적 단어사용에 기반을 두고 있는 웹 2.0 애플리케이션, 특히 소셜태깅 분야에 있어서 그 장애의 정도가 더 심각해질 수 있다. 본 연구는 한 대표적인 웹 2.0 애플리케이션에서 자동 유사어 추출에 관한 문제를 다루고 있다. 더 구체적으로, 가장 널리 사용되는 소셜북마킹 애플리케이션인 딜리셔스를 기반으로, 유사태그를 추출하는 방법(FolkSim)을 제시하고자 한다. 제시한 방법의 평가를 위하여, 문서유사도의 측정을 위해서 쓰여진 고전적 벡터모델에 의거한 유사태그를 추출하는 방법(CosSim)과 그 결과들을 서로 비교분석하여 보았다. 몇 가지 면에서 FolkSim가 더 나은 결과 산출해내는 증거들이 관찰되어졌다. 또한, FolkSim 방법에 의한 유사태그가 만들어지지 않는 경우에 대비하여, 그 대안 또한 제시하고 있다.

위키피디아를 이용한 분류자질 선정에 관한 연구 (An Experimental Study on Feature Selection Using Wikipedia for Text Categorization)

  • 김용환;정영미
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.155-171
    • /
    • 2012
  • 텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.

생성 기반 질의응답 채팅 시스템 구현을 위한 지식 임베딩 방법 (Knowledge Embedding Method for Implementing a Generative Question-Answering Chat System)

  • 김시형;이현구;김학수
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.134-140
    • /
    • 2018
  • 채팅 시스템은 사람의 말을 기계가 이해하고 적절한 응답을 하는 시스템이다. 채팅 시스템은 사용자의 간단한 정보 검색 질문에 대답해야 하는 경우가 있다. 그러나 기존의 생성 채팅 시스템들은 질의응답에 필요한 정보인 지식 개체(트리플 형태 지식에서의 주어와 목적어)의 임베딩을 고려하지 않아 발화에 나타나는 지식 개체가 다르더라도 같은 형태의 답변이 생성되었다. 본 논문에서는 생성 기반 채팅 시스템의 질의응답 정확도를 향상시키기 위한 지식 임베딩 방법을 제안한다. 개체와 유의어의 지식 임베딩을 위해 샴 순환 신경망을 사용하며 이를 이용해 주어와 술어를 인코딩 하고 목적어를 디코딩하는 sequence-to-sequence 모델의 성능을 향상 시켰다. 자체 구축한 채팅데이터를 통한 실험에서 제안된 임베딩 방법은 종래의 합성곱 신경망을 통한 임베딩 방법 보다 12.48% 높은 정확도를 보였다.