• Title/Summary/Keyword: similarity weight

Search Result 379, Processing Time 0.083 seconds

멀티태스크 러닝 심층신경망을 이용한 화자인증에서의 나이 정보 활용 (Utilization of age information for speaker verification using multi-task learning deep neural networks)

  • 김주호;허희수;정지원;심혜진;김승빈;유하진
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.593-600
    • /
    • 2019
  • 화자 간 음색의 유사성은 화자 인증 시스템의 성능을 하락 시킬 수 있는 요인이다. 본 논문은 화자 인증 시스템의 일반화 성능을 향상시키기 위해, 심층신경망에 멀티태스크 러닝 기법을 적용시켜 발화자의 화자 정보와 나이 정보를 함께 학습 시키는 기법을 제안한다. 멀티태스크 러닝 기법은 은닉층들이 하나의 태스크에 과적합 되지 않도록 하여 심층신경망의 일반화 성능을 향상시킨다고 알려져 있다. 하지만 심층신경망을 멀티태스크 러닝 기법으로 학습시키는 과정에서, 나이 정보에 대한 학습이 효율적으로 수행되지 않는 것을 실험적으로 확인하였다. 이와 같은 현상을 방지하기 위해, 본 논문에서는 심층신경망의 학습 과정 중 화자 식별과 나이 추정 목적 함수의 가중치를 동적으로 변경 하는 기법을 제안한다. 동일 오류율을 기준으로 RSR2015 평가 데이터세트에 대해 화자 인증 성능을 평가한 결과 나이 정보를 활용하지 않은 화자 인증 시스템의 경우 6.91 %, 나이 정보를 활용한 화자 인증 시스템의 경우 6.77 %, 나이 정보를 활용한 화자 인증 시스템에 가중치 변경 기법을 적용한 경우 4.73 %의 오류율을 확인하였다.

도입 마(Dioscorea alata L.)의 특성 분석 (Characteristics of Dioscorea alata L. Introduced from Tropical and Subtropical Regions)

  • 장광진;유기억;박철호;박종인;홍규현;박주현
    • 현장농수산연구지
    • /
    • 제3권1호
    • /
    • pp.48-69
    • /
    • 2001
  • 1997년 부터 한국농업전문학교에서 수집하여 재배되고 있는 마 (Dioscorea alata L.) 계통 중 품질이 우수하고 이용 가치가 기대되는 33개 계통에 대한 특성을 조사하였으며, 형태적 차이를 보이는 19개 계통에 대한 RAPD분석을 실시하였다. 1. 주당 괴경의 전체 무게는 최대 2,147g (No.36), 최소 90g (No.20)으로 평균 610g이었다. 주당 평균 괴경수는 2.8개였으며 최대 4.7개, 최소 1.3개였다. 괴경중은 평균 363g이었으며 최대 1200g, 최소 70g이었다. 2. 괴경의 육질은 백색, 담황색 및 적자색 3가지 패턴을 보였으며, 잎은 녹색, 진녹색 및 담녹색으로 분류되었다. 3. RAPD 분석에 사용된 총 113개 primers 중 12개 primer 만이 모든 분류군에서 증폭되었다. 이를 통하여 93개의 밴드를 얻었으며 69개 밴드는(71.0%) polymorphic 하게 나타났다. 4. 유집분석 결과 19개 계통은 유사도 지수 값 0.66~0.90의 범위로 나타났으며, 크게 2개의 그룹, 즉 인도네시아와 가고시마에서 도입된 8개의 계통이 포함된 그룹과, 유사도지수 0.70~0.90의 범위를 갖는 Nauru, Palau Is., Okinawa와 Papua New Guinea에서 도입된 11 계통이 포함된 그룹으로 대별되었다.

Production of a New Biosurfactant by a New Yeast Species Isolated from Prunus mume Sieb. et Zucc.

  • Jeong-Seon Kim;Miran Lee;Dae-Won Ki;Soon-Wo Kwon;Young-Joon Ko;Jong-Shik Kim;Bong-Sik Yun;Soo-Jin Kim
    • Journal of Microbiology and Biotechnology
    • /
    • 제33권8호
    • /
    • pp.1023-1029
    • /
    • 2023
  • Biosurfactants reduce surface and interfacial tension due to their amphiphilic properties and are an eco-friendly alternative for chemical surfactants. In this study, a new yeast strain JAF-11 that produces a biosurfactant was selected using drop collapse method, and the properties of the extracts were investigated. The nucleotide sequences of the strain were compared with closely related strains and identified based on the D1/D2 domain of the large subunit ribosomal DNA (LSU) and internal transcribed spacer (ITS) regions. Neodothiora populina CPC 39399T, the closest species with strain JAF-11, showed a sequence similarity of 97.75% for LSU and 94.27% for ITS, respectively. The result suggests that the strain JAF-11 represents a distinct species that cannot be assigned to any existing genus or species in the family Dothideaceae. Strain JAF-11 produced a biosurfactant reducing the surface tension of water from 72 mN/m to 34.5 mN/m on the sixth day of culture and the result of measuring the critical micelle concentration (CMC) by extracting the crude biosurfactant was found to be 24 mg/l. The molecular weight 502 of the purified biosurfactant was confirmed by measuring the fast atom bombardment mass spectrum. The chemical structure was analyzed by measuring 1H nuclear magnetic resonance (NMR), 13C NMR, and two-dimensional NMRs of the compound. The molecular formula was C26H46O9, and it was composed of one octanoyl group and two hexanoyl groups to myo-inositol moiety. The new biosurfactant is the first report of a compound produced by a new yeast strain, JAF-11.

AI를 활용한 메타데이터 추출 및 웹서비스용 메타데이터 고도화 연구 (Metadata extraction using AI and advanced metadata research for web services)

  • 박성환
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.499-503
    • /
    • 2024
  • 방송 프로그램은 자체 방송 송출 외에도 인터넷 다시 보기, OTT, IPTV 서비스 등 다양한 매체에 제공되고 있다. 이 경우 콘텐츠 특성을 잘 나타내는 검색용 키워드 제공은 필수적이다. 방송사에서는 제작 단계, 아카이브 단계 등에서 주요 키워드를 수동으로 입력하는 방법을 주로 사용한다. 이 방식은 양적으로는 핵심 메타데이터 확보에 부족하고, 내용 면에서도 타 매체 서비스에서 콘텐츠 추천과 검색에 한계를 드러낸다. 본 연구는 EBS에서 개발한 DTV 자막방송 서버를 통해 사전 아카이빙 된 폐쇄형 자막 데이터를 활용하여 다수의 메타데이터를 확보하는 방법을 구현했다. 먼저 구글의 자연어 처리 AI 기술을 적용하여 핵심 메타데이터를 자동으로 추출하였다. 다음 단계는 핵심 연구 내용으로 우선순위와 콘텐츠 특성을 반영하여 핵심 메타데이터를 찾는 방법을 제안한다. 차별화된 메타데이터 가중치를 구하는 기술로는 TF-IDF 계산법을 응용하여 중요도를 분류했다. 실험 결과 성공적인 가중치 데이터를 얻었다. 이 연구로 확보한 문자열 메타데이터는 추후 문자열 유사도 측정 연구와 결합하면 타 매체에 제공하는 콘텐츠 서비스에서 정교한 콘텐츠 추천용 메타데이터를 확보하는 기반이 된다.

중복을 허용한 계층적 클러스터링에 의한 복합 개념 탐지 방법 (Hierarchical Overlapping Clustering to Detect Complex Concepts)

  • 홍수정;최중민
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.111-125
    • /
    • 2011
  • 클러스터링(Clustering)은 유사한 문서나 데이터를 묶어 군집화해주는 프로세스이다. 클러스터링은 문서들을 대표하는 개념별로 그룹화함으로써 사용자가 자신이 원하는 주제의 문서를 찾기 위해 모든 문서를 검사할 필요가 없도록 도와준다. 이를 위해 유사한 문서를 찾아 그룹화하고, 이 그룹의 대표되는 개념을 도출하여 표현해주는 기법이 요구된다. 이 상황에서 문제점으로 대두되는 것이 복합 개념(Complex Concept)의 탐지이다. 복합 개념은 서로 다른 개념의 여러 클러스터에 속하는 중복 개념이다. 기존의 클러스터링 방법으로는 문서를 클러스터링할 때 동일한 레벨에 있는 서로 다른 개념의 클러스터에 속하는 중복된 복합 개념의 클러스터를 찾아서 표현할 수가 없었고, 또한 복합 개념과 각 단순 개념(Simple Concept) 사이의 의미적 계층 관계를 제대로 검증하기가 어려웠다. 본 논문에서는 기존 클러스터링 방법의 문제점을 해결하여 복합 개념을 쉽게 찾아 표현하는 방법을 제안한다. 기존의 계층적 클러스터링 알고리즘을 변형하여 동일 레벨에서 중복을 허용하는 계층적 클러스터링(Hierarchical Overlapping Clustering, HOC) 알고리즘을 개발하였다. HOC 알고리즘은 문서를 클러스터링하여 그 결과를 트리가 아닌 개념 중복이 가능한 Lattice 계층 구조로 표현함으로써 이를 통해 여러 개념이 중복된 복합 개념을 탐지할 수 있었다. HOC 알고리즘을 이용해 생성된 각 클러스터의 개념이 제대로 된 의미적인 계층 관계로 표현되었는지는 특징 선택(Feature Selection) 방법을 적용하여 검증하였다.

무부자 쌍끌이 중층망 어구어법의 개발(I) - 아래끌줄의 길이에 따른 모형어구의 전개성능 - (Development for Fishing Gear and Method of the Non-Float Midwater Pair Trawl Net(I) - Opening Efficiency of Model Net according to the Length of Lower Warp -)

  • 이주희;유제범;이춘우;권병국;김정문
    • 수산해양기술연구
    • /
    • 제39권1호
    • /
    • pp.33-43
    • /
    • 2003
  • 본 연구는 현재 국내에서 사용되는 쌍끌이 중층망 어구어법에서 문제점으로 지적되고 있는 고속예망에서 망고의 제어가 어렵다는 점, 망목에 뜸이 걸려서 파망이 자주 일어나는 점, 네트드럼에 감기는 어구부피가 너무 크다는 점 등의 해결방법으로 무부자 쌍끌이 중층망의 모형실험을 통하여 우리 나라 쌍끌이 중층망에 대한 적용 가능성을 검토하는데 있다. 이를 위하여 850ps급 쌍끌이 기선저인망어선에서 현재 사용되는 실물망을 1/100로 축소 제작한 모형망에서 뜸을 모두 제거하고 끌줄을 양쪽으로 각각 두가닥으로 분리한 후 추를 부착하여 아래끌줄의 길이를 조절함으로써 망고를 제어할 수 있는 무부자 쌍끌이 중층망의 모형어구를 제작하여 회류수조에서 유속에 대한 아래끌줄의 길이에 따른 어구의 전개성능 등을 규명하고 기준형과 비교 분석한 결과를 요약하면 다음과 같다. 1. 유체저항은 무부자망이 기준형보다 약 10∼20%정도 작았으며, 무부자망의 유체저항은 동일유속에서 아래끌줄이 길어짐에 따라 약 1ton씩 증가하였다. 또, 동일유속에서 dL이 10m씩 증가함에 따라 아래끌줄에 작용하는 저항은 약 5%씩 감소하고, 그 반면에 윗 끌줄에 작용하는 저항이 증가하였다. 2. 망고는 직선에 가까운 지수함수적으로 감소하는 경향을 보였으며, 동일유속에서 아래끌줄이 길어짐에 따라 증가하여 로그함수적인 경향을 보였다. 또한, 망고감소율은 무부자망의 경우가 기준형보다 작게 나타났으며, 그 차이는 유속이 증가함에 따라 더욱 커져 dL이 30m인 무부자망을 기준으로 3.0knot일 때 12%, 4.0knot일 때 25%로 나타났다. 3. 망폭은 유속이 증가함에 따라 약 2m 내외로 거의 일정하였으며 무부자망이 기준형보다 크게 나타났다. 4. 망구면적은 유속이 증가함에 따라 지수함수적으로 감소하는 경향을 보였으며, 망구면적의 감소율은 기준형보다 무부자망이 더 작게 나타났다. 여과량은 유속이 증가함에 따라 로그함수적인 경향을 보였으며 기준형이 3.0knot 이상에서 급격히 감소하였지만, 무부자망은 4.0knot까지 증가하였다가 완만하게 감소하였다. 5. dL의 최대적정길이는 망구면적 및 여과량이 최대인 30m일 때이며, 추의 최적위치는 4개의 그물목줄이 연결되는 지점이었다.

재몰유선택적정황하공동특성대우고객희호적영향(在没有选择的情况下共同特性对于顾客喜好的影响): 조절초점적조절작용(调节焦点的调节作用) (The Effect of Common Features on Consumer Preference for a No-Choice Option: The Moderating Role of Regulatory Focus)

  • Park, Jong-Chul;Kim, Kyung-Jin
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.89-97
    • /
    • 2010
  • 本文研究共同特性对于无选择权的影响, 并涉及到了调节焦点理论. 本文主要着眼于这三个因子以及他们之间的关系. 之前的研究已经广泛涉及到这三个方面. 第一, 共同特性影响已经被广为研究. Tversky (1972) 开创了这个理论, EBA 模型: 通过消除方面. 根据这个理论, 消费者在比较的过程中更易于注意特殊的特性, 而忽略共同特性. 最近, 更多的研究开始针对于此模型对于消费者行为的影响. Chernev (1997) 认为增加共同特性可以减少选择距离. 但是, 随后Chernev (2001) 的研究指出共同特性可能是消费者认知上的负担, 所以他们更喜欢启发式的过程而不是系统式的过程. 这些研究提出了一系列问题: 共同特性是否影响顾客选择? 如果是的话, 这些影响是什么样子的? 第二, 一些研究指出没有选择的状况是消费者最好的选择, 他们在犹豫不决时用这种方法回避选择. 其他关于这一理论的研究是时间的压力, 消费者自信, 以及可供选择的数量. 第三, 调节聚焦理论在目前非常流行. 消费者有两个焦点目标: 促进和制止. 促进聚焦主要和希望, 野心, 成功, 获得等有关; 而制止聚焦和责任, 职责, 安全, 规避等有关. 调节聚焦理论预测了顾客的感情, 创造, 态度, 记忆, 表现, 和判断. 而这些都是市场营销研究的领域这些文献为本文的研究提供了一些理论支持. 特别是增加共同特征而不是忽略他们可以增加选择过程中克制消费者的没有选择状况的比重, 其对于促进消费者的作用确实相反的. 本文通过两个试验进行验证. 第一个是2 X 2 组间的设计(共同特性X调节聚焦), 数码相机作为相关的客体. 特别的是, 调节聚焦变量是从11个问题中取得的. 共同特性包括焦距, 重量, 记忆卡, 电池, 而像素和价格作为独特特性. 结果证明了我们的假设, 那就是增加共同特性增加了克制消费者的无选择比重, 而对促进消费者没有作用. 第二个试验被用来复制第一个实验的结果. 这个实验和之前的基本相同, 只有两个方面不同—主要控制和研究客体. 在促进的前提下, 研究对象必须一些词例如: 利润, 野心, 高兴, 成功, 发展等. 在克制的前提下, 他们必学写下坚持, 安全, 保护, 规避, 损失, 责任等词. 实验证明我们假设是成立的. 本研究说明了共同特性对于顾客选择的二重效果. 增加共同特性可以提高或者降低无选择状况. 本文对于理论研究和实践上都有着贡献. 对于市场营销人员来说, 他们可能需要根据顾客的划分来考虑产品的共同特性. 理论上, 研究结果支持共同特性和无选择状况的调节变量. 最后, 本文也有一些不足, 例如过于强调态度的重要性等. 我们希望本文能够为未来的研究做出抛砖引玉的作用.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

국내 사용농약의 노출 기간이 개의 독성반응에 미치는 영향 분석 (Toxic Impact Analysis by Exposure Duration of Dog Studies for Pesticides using in Korea)

  • 이제봉;정미혜;유아선;홍순성;백민경;오진아;박경훈;임양빈
    • 농약과학회지
    • /
    • 제17권4호
    • /
    • pp.350-358
    • /
    • 2013
  • 농약의 등록을 위한 국내 독성시험성적 요구 기준 중 비식용 농약 등 인체노출이 장기적으로 발생되지 않는 물질에 대하여 개 1년 독성시험 성적을 요구할 것인가에 대한 검토를 목적으로 개 13주와 1년 시험성적을 독성학적으로 비교분석 하였다. 본 연구는 최근에 ADI 설정을 위하여 평가한 40종 농약과 기존에 등록된 농약 중 ADI가 고시된 농약 등 총 166종을 대상으로 ADI설정에 사용된 독성시험성적, 주요관련 표적장기, 13주 및 1년의 표적장기 및 영향의 유사성, NOAEL 차이 등을 검토하였다. 그 결과 166종 중 68(41%)종이 개를 이용한 독성시험 NOAEL을 이용하여 ADI를 설정하였고, 표적장기에 대한 영향으로는 간에 대한 영향 49건, 체중변화 21건, 콜린에스테라제 저해 16건, 혈액학적변화 14건 등의 순이었으며, 13주와 1년 시험의 표적장기 및 영향의 유사성은 73%에 달했다. 두 시험 간 NOAEL에 대한 차이는 최근 등록된 40종을 대상으로 분석한 결과 1.5배 이내로 관찰된 것이 22종(55%)으로 가장 많았고 1.6~3.5배가 9종이었다. 나머지 9종에서도 대부분 투여용량 설정 등의 문제였으며 4종(10%)만이 13주 및 1년간에 독성학적 영향이 다른 것으로 나타났다.

새만금 방조제 외측 고군산군도 지역의 해조상 및 군집구조 (Marine Algal Flora and Community Structure of Gogunsan Islands outside the Saemangeum Dike)

  • 김주희;고용덕;김영식;남기완
    • 한국환경생태학회지
    • /
    • 제25권2호
    • /
    • pp.156-165
    • /
    • 2011
  • 고군산군도의 해조상 및 군집구조를 파악하기 위해 7개 정점을 선정하여 2008년 12월부터 2009년 11월까지 계절별 조사를 실시하였다. 고군산군도에서 출현한 해조류는 총 58종으로, 녹조식물 10종, 갈조식물 16종, 홍조식물 32종이 채집 동정되었으며, 그 중 11종은 연중 출현하였다. 평균 생물량은 Sinsido 1 정점에서 213.8 g $m^{-2}$, Sinsido 2 정점에서 143.1 g $m^{-2}$, Sinsido 3 정점에서 133.3 g $m^{-2}$, Munyeodo 정점에서 164.0 g $m^{-2}$, Seonyudo 정점에서 116.9 g $m^{-2}$, Jangjado 정점에서 145.1 g $m^{-2}$으로 Sinsido 1 정점에서 가장 높은 생물량을 보였으며, Sinsido 4 정점에서 최저 생물량을 나타냈다. 생물량에서 우점종은 지충이(Sargassum thunbergii), 구멍갈파래(Ulva pertusa), 톳(Sargassum fusiforme) 및 작은구슬산호말(Corallina pilulifera)이었으며, 지충이는 전 계절에 걸쳐 가장 높은 생물량을 보여 이 지역 대표종으로 확인되었다. 이 지역의 6개 기능형군은 성긴분기형(46.6%), 사상형(27.6%), 엽상형(17.2%), 다육질형(3.4%), 유절산호말형(3.4%), 각상형(1.7%)군으로 구분되었다. 해조류의 지역적 특성의 기준으로 이용되는 C/P, R/P 그리고 (R+C)/P값은 각각 0.33~0.75, 1.11~2.50, 1.47~3.25이었다. 종다양도지수(H')와 우점도지수(DI)로 본 고군산군도의 해조군집 안정도는 '불안정'하고 환경상태는 '나쁜것'으로 나타났다. MDS와 군집분석 결과, Sinsido 2, Sinsido 3, Seonyudo, Munyeodo로 이루어진 그룹, Sinsido 1, Jangjado로 이루어진 그룹, 그리고 Sinsido 4로 이루어진 총 3개의 군집으로 분류되었으며, 암반이 적어 해조류가 빈약하였던 Sinsido 4는 다른 정점과 유사도에서 차이를 나타냈다.