• Title/Summary/Keyword: 관계적 유사성

Search Result 1,902, Processing Time 0.03 seconds

Self-learning Method Based Slot Correction for Spoken Dialog System (자기 학습 방법을 이용한 음성 대화 시스템의 슬롯 교정)

  • Choi, Taekyoon;Kim, Minkyoung;Lee, Injae;Lee, Jieun;Park, Kyuyon;Kim, Kyungduk;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.353-360
    • /
    • 2021
  • 음성 대화 시스템에서는 사용자가 잘못된 슬롯명을 말하거나 음성인식 오류가 발생해 사용자의 의도에 맞지 않는 응답을 하는 경우가 있다. 이러한 문제를 해결하고자 말뭉치나 사전 데이터를 활용한 질의 교정 방법들이 제안되지만, 이는 지속적으로 사람이 개입하여 데이터를 주입해야하는 한계가 있다. 본 논문에서는 축적된 로그 데이터를 활용하여 사람의 개입 없이 음악 재생에 필요한 슬롯을 교정하는 자기 학습(Self-learning) 기반의 모델을 제안한다. 이 모델은 사용자가 특정 음악을 재생하고자 유사한 질의를 반복하는 상황을 이용하여 비지도 학습 기반으로 학습하고 음악 재생에 실패한 슬롯을 교정한다. 그리고, 학습한 모델 결과의 정확도에 대한 불확실성을 해소하기 위해 질의 슬롯 관계 유사도 모델을 이용하여 교정 결과에 대한 검증을 하고 슬롯 교정 결과에 대한 안정성을 보장한다. 모델 학습을 위한 데이터셋은 사용자가 연속으로 질의한 세션 데이터로부터 추출하며, 음악 재생 슬롯 세션 데이터와 질의 슬롯 관계 유사도 데이터를 각각 구축하여 슬롯 교정 모델과 질의 슬롯 관계 유사도 모델을 학습한다. 교정된 슬롯을 분석한 결과 발음 정보가 유사한 슬롯 뿐만 아니라 의미적인 관계가 있는 슬롯으로도 교정하여 사전 기반 방식보다 다양한 유형의 교정이 가능한 것을 보였다. 3 개월 간 수집된 로그 데이터로 학습한 음악 재생 슬롯 교정 모델은 일주일 동안 반복한 고유 질의 기준, 음악 재생 실패의 12%를 개선하는 성능을 보였다.

  • PDF

A lexical structure of adjectives for the sensibility of visual design elements in Textile (직물디자인의 시각적 요소와 관련된 감성 어휘 모형)

  • 박수진;조경자;장준익;김길님
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1997.11a
    • /
    • pp.63-68
    • /
    • 1997
  • 본 연구에서는 직물 디자인의 시각적 요소와 관련된 감성 모형을 제안하고, 아울러 감성 모형을 구성하는 과정에서 사용될 수 있ㅅ는 대안적인 방안을 제시하고자 한다. 이를 위해 설문 조사와 관련 잡지, 신문, 사전 등을 통한 광범위한 어휘 수집이 이뤄졌으며 수집된 어휘는 1,000여 개였다. 수집된 어휘에 대해 이해도 및 적절성 평가를 실시하여 직물 제품과 관련된 감성을 표현하기에 부적절하거나 이해하기 어려운 어휘들을 제거하여 360개의 감성 어휘로 정리하였다. 사용 빈도가 높은 어휘 108개를 이용하여 자유 연상과제를 실시하였으며 그결과 어휘들 간 관계에 대한 연결망을 그려낼 수 있었다. 어휘망에서 중심적인 대표어 역할을 하는 18개 어휘를 추출하여 1차로 유사성평정을 실시하였으며 다차원 척도법으로 분석한 결과 어휘들 간 관계를 표현하기 위해 필요한 차원은 네 개였다. 1차로 구성된 모형의 타당성을 확인하기 위해 추가로 각각 20개씩의 어휘를 새로이 추출하여 2회에 걸쳐 유사성 평정을 실시한 결과, 직물 디자인의 시각적 요소와 관련된 감성을 모형화하기 위해서는 세 개차원이면 충분하다고 생각된다.

  • PDF

Semantic-based Keyword Search System over Relational Database (관계형 데이터베이스에서의 시맨틱 기반 키워드 탐색 시스템)

  • Yang, Younghyoo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.18 no.12
    • /
    • pp.91-101
    • /
    • 2013
  • One issue with keyword search in general is its ambiguity which can ultimately impact the effectiveness of the search in terms of the quality of the search results. This ambiguity is primarily due to the ambiguity of the contextual meaning of each term in the query. In addition to the query ambiguity itself, the relationships between the keywords in the search results are crucial for the proper interpretation of the search results by the user and should be clearly presented in the search results. We address the keyword search ambiguity issue by adapting some of the existing approaches for keyword mapping from the query terms to the schema terms/instances. The approaches we have adapted for term mapping capture both the syntactic similarity between the query keywords and the schema terms as well as the semantic similarity of the two and give better mappings and ultimately 50% raised accurate results. Finally, to address the last issue of lacking clear relationships among the terms appearing in the search results, our system has leveraged semantic web technologies in order to enrich the knowledgebase and to discover the relationships between the keywords.

Floc Behaviors Due to Flocculation Process (응집현상에 의한 플럭의 거동 변화)

  • Son, Minwoo;Park, Byeoung Eun;Byun, Jisun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.253-253
    • /
    • 2019
  • 유사의 이동은 하천, 해안 지역과 같은 수계에서 하상의 변동, 침식과 퇴적을 일으켜 지형적인 변화를 초래한다. 유사의 이동은 유사의 특성과 유체의 유수동역학적 특성에 의해 결정되며 유체특성 간의 복잡한 상호 작용에 의해 변화한다. 유사가 가지는 점착성은 유사의 특성에 큰 영향을 끼친다. 입자의 크기가 매우 작은 점착성 유사는 그 표면이 가지는 전자기적 점착력에 의해 주위의 1차 입자나 다른 작은 알갱이들이 서로 뭉치는 응집과 충돌에 의해 크기가 작아지는 파괴의 과정을 겪는다. 이 과정을 응집현상이라고 하며 응집현상을 통해 점착성 유사의 크기와 밀도, 침강속도는 계속해서 변화한다. 따라서 점착성 유사의 응집거동 고려한 유사 이동 연구는 필수적이다. 과거 연구의 많은 사례에서 유사의 크기와 농도는 비례 관계를 가지는 것이 일반적이라 알려져 있다. 그러나 실제 현장에서 측정한 결과 유사의 크기와 농도가 반비례 관계를 가지는 특이점이 발견되었다. 실측 연구에서 발견된 응집거동에 따른 유사의 특성의 특이한 변화를 설명하기 위해 1차원 연직 수치 모형(1DV)을 이용하여 수치 실험을 수행하였다. 모의 수행 시, 흐름 조건을 크기와 방향이 일정한 순방향흐름(Current)에 특정 주기와 진폭을 가지는 진동 흐름(Oscillatory Flow)을 추가하여 진행하였다. 플럭의 성장과 그에 따른 입자의 크기는 많은 현상에 영향을 받는다. 그 중 응집현상의 응집 과정과 파괴 과정 중 어떤 현상이 더 우세한지 그 경쟁관계를 파악하여 플럭의 크기의 증감을 예측할 수 있게 농도(?)와 난류소산매개변수(?)를 이용하여 $c/G^{0.5}$로 매개화하였다. 실험 결과, 순방향 흐름을 제외하고 스토크스파 흐름 조건을 이용하여 진행된 모의에서는 플럭의 크기와 농도가 반비례하는 현상을 관찰할 수 없었으며 $c/G^{0.5}$ 의 변화 역시 흐름의 속도와 농도가 더 큰 지점에서 큰 값을 가지는 일반적인 결과를 나타내었다. 그러나 같은 조건에서 순방향흐름을 추가하여 모의한 결과에서는 플럭의 크기와 농도가 반비례하는 현상을 나타냈다. 연직 방향 $c/G^{0.5}$의 변화를 나타낸 그래프에서 응집과 파괴의 우세에 따라 $c/G^{0.5}$ 가 역전되는 현상을 확인하였다. 즉, 플럭의 크기는 난류의 구조와 그 영향에 의해 농도와 비례관계를 갖지 않을 수도 있다고 판단된다. 또한 본 연구에서 정상류 흐름 조건의 유무에 따라 플럭의 크기와 농도가 비례하거나 반비례하는 상반된 결과를 보였다. 정상류 흐름 조건이 난류의 강도에 큰 역할을 하며 이에 따라 비선형 관계에 영향을 끼친다는 것을 발견하였다. 그러나 흐름의 영향에 대한 더 자세한 분석은 본 연구에서 진행되지 않았으며 향후 연구 시에 분명히 고려되어야 할 사항이다.

  • PDF

A Design of Building a Meaningful Tag Cluster (의미 있는 태그 클러스터 구축을 위한 설계 방안)

  • Park, Byoung-Jae;Woo, Chong-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.658-661
    • /
    • 2008
  • 태깅은 웹 2.0의 핵심 기술 중 하나로, 매우 유연하고 역동적인 분류 체계를 제공한다. 하지만 유연성과 역동성의 확보에 의해 계층 구조나 연관 관계와 같은 태그의 관계성이 부족하거나 존재하지 않는 한계점을 가지고 있는 것 또한 사실이다. 이런 한계점을 보완하기 위한 방법으로 계층 관계를 형성하기 위한 계층 클러스터링 방법과, 연관 관계를 형성하기 위한 협업 필터링 방법이 존재한다. 이 두 가지 방법은 태그의 관계성을 제공하지만, 연관 관계와 계층 관계 중 하나만 제공한다는 단점을 가진다. 본 논문에서는 태그 검색 시 연관 관계뿐 아니라 계층 구조의 탐색을 제공해주기 위한 태그 클러스터링 알고리즘을 설계하였다. 제안한 알고리즘은 사용자 태그셋을 활용하여 태그의 유사성을 계산하는 방법을 제시하고, 기존의 시각화 방법(태그 구름)과 다른 새로운 형태로 시각화 할 수 있는 결과 데이터를 제공한다.

Selective Speech Feature Extraction using Channel Similarity in CHMM Vocabulary Recognition (CHMM 어휘인식에서 채널 유사성을 이용한 선택적 음성 특징 추출)

  • Oh, Sang Yeon
    • Journal of Digital Convergence
    • /
    • v.11 no.10
    • /
    • pp.453-458
    • /
    • 2013
  • HMM Speech recognition systems have a few weaknesses, including failure to recognize speech due to the mixing of environment noise other voices. In this paper, we propose a speech feature extraction methode using CHMM for extracting selected target voice from mixture of voices and noises. we make use of channel similarity and correlate relation for the selective speech extraction composes. This proposed method was validated by showing that the average distortion of separation of the technique decreased by 0.430 dB. It was shown that the performance of the selective feature extraction is better than another system.

Question Similarity Analysis in dialogs with Automatic Feature Extraction (자동 추출 자질을 이용한 대화 속 질의 문장 유사성 분석)

  • Oh, KyoJoong;Lee, DongKun;Lim, Chae-Gyun;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.347-351
    • /
    • 2018
  • 이 논문은 대화 시스템에서 질의를 이해하기 위해 딥 러닝 모델을 통해 추출된 자동 추출 자질을 이용하여 문장의 유사성을 분석하는 방법에 대해 기술한다. 문장 간 유사성을 분석하기 위한 자동 추출 자질로써, 문장 내 표현 순차적 정보를 반영하기 위한 RNN을 이용하여 생성한 문장 벡터와, 어순에 관계 없이 언어 모델을 학습하기 위한 CNN을 이용하여 생성한 문장 벡터를 사용한다. 이렇게 자동으로 추출된 문장 임베딩 자질은 금융서비스 대화에서 입력 문장을 분류하거나 문장 간 유사성을 분석하는데 이용된다. 유사성 분석 결과는 질의 문장과 관련된 FAQ 문장을 찾거나 답변 지식을 찾는데 활용된다.

  • PDF

Building of Protein 3-D Structure Database and Similarity Search System (3D 단백질 구조 데이터베이스 및 유사성 검색 시스템 구축)

  • Li, Rong-Hua;Park, Sung-Hee;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.79-82
    • /
    • 2002
  • 단백질 3차 구조 정보는 PDB에서 플랫화일 형태로 제공되고 있으며 이러한 플랫화일 각각의 엔트리들은 단백질 3차 분자 구조를 구성하는 원자들의 공간좌표정보, 서열정보, 실험정보 및 참조정보 등으로 구성된다. 이러한 정보들을 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적 검색을 위해서는 플랫파일을 데이터베이스로 구축함과 동시에, 구축된 데이터베이스를 위한 유사성 검색시스템 구축이 요구된다. 따라서, 이 논문에서는 Protein DataBank에서 제공하는 플랫파일을 공간객체 모델링기법에 기반한 관계형 데이터베이스로 구축하고 PSI-BLAST를 적용하여 단백질 서열 유사성 검색 시스템을 구축한다. 이렇게 함으로써 단백질 3자 구조 분자를 구성하는 원자에 대한 검색과 구조에 대한 서열 유사성 검색을 통하여 단백질 3차 구조 분류 및 구조 예측 시스템 구축에 활용할 수 있다.

  • PDF

A study on the ordering of similarity measures with negative matches (음의 일치 빈도를 고려한 유사성 측도의 대소 관계 규명에 관한 연구)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.1
    • /
    • pp.89-99
    • /
    • 2015
  • The World Economic Forum and the Korean Ministry of Knowledge Economy have selected big data as one of the top 10 in core information technology. The key of big data is to analyze effectively the properties that do have data. Clustering analysis method of big data techniques is a method of assigning a set of objects into the clusters so that the objects in the same cluster are more similar to each other clusters. Similarity measures being used in the cluster analysis may be classified into various types depending on the nature of the data. In this paper, we studied upper and lower bounds for binary similarity measures with negative matches such as Russel and Rao measure, simple matching measure by Sokal and Michener, Rogers and Tanimoto measure, Sokal and Sneath measure, Hamann measure, and Baroni-Urbani and Buser mesures I, II. And the comparative studies with these measures were shown by real data and simulated experiment.

Quantitative structure-activity relationships and molecular shape similarity of the herbicidal N-substituted phenyl-3,4-dimethylmaleimide Derivatives (제초성 N-치환 phenyl-3,4-dimethylmaleimide 유도체의 정량적인 구조-활성관계와 분자 유사성)

  • Sung, Nack-Do;Ock, Hwan-Suk;Chung, Hun-Jun;Song, Jong-Hwan
    • The Korean Journal of Pesticide Science
    • /
    • v.7 no.2
    • /
    • pp.100-107
    • /
    • 2003
  • To improve the growth inhibitory activity against the shoot and root of rice plant (Oryza sativa L) and barnyard grass (Echinochloa crus-galli), a series of N-substituted phenyl-3,4-dimethylmaleimdes derivatives as substrates were synthesized and then their the inhibitory activities of protoporphyrinogen oxidase (1.3.3.4), protox were measured. The quantitative structure-activity relationships (QSAR) between structures and the inhibitory activities were studied quantitatively using the 2D-QSAR method. And also, molecular sharp similarity between the substrate derivatives and protogen, substrare of protox enzyme were studied. The activities of the two plants indicated that barnyard grass had a higher activity than the rice plant and their correlation relationships have shown in proportion for each. Accordingly, the results of SARs suggest that the electron donating groups as $R_2=Sub.X$ group will bind to phenyl ring because the bigger surface area of negative charged atoms in the substrate molecule derivatives may increase to the higher the activity against barnyard grass. Based on the molecular shape similarity, when the derivatives and protogen, subsbrate of protox enzyme were superimposed by atom fitting, the similarity indices (S) were above 0.8 level but the correlation coefficients (r) between S values and the activities showed not good.