• Title/Summary/Keyword: 카테고리화

Search Result 166, Processing Time 0.03 seconds

A Study on Methods of Speacker Adaptation for Speech Recognition (음성인식을 위한 화자적응화 기법에 관한 연구)

  • 이종연
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.309.2-314
    • /
    • 1998
  • 본 연구에서는 음성인식을 위한 화자적응화 기법에 대해 연구하였다. 첫째로 적응화에 포함되지 않은 카테고리 음절에 대해 적응화 효과를 줄 수 있는 보간적응화 방법에 대해 연구하였다. 표준모델과 소량의 음성 데이터만으로 적응화가 가능한 MAPE(최대사후확률추정)으로 적응화한 모델의 평균벡터 변화정도를 적응화 발화에 포함되지 않은 모델에 보간적응하는 방법이다. 둘째로 음절단위 모델을 구축한 후 적응화 하고자 하는 화자의 데이터를 연결학습법과 Viterbi 알고리즘으로 음절단위의 추출을 자동화 한 후 MAPE으로 적응화하는 방법에 대해 각각 실험을 하였다.

  • PDF

A Search Category Recommendation System Using Client-based Deep Learning (클라이언트 기반 딥러닝을 이용한 검색 카테고리 추천 시스템)

  • Ahn, Cheol-Yong;Park, JiSu;Shon, Jin Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.687-690
    • /
    • 2019
  • 웹 사이트 사용자들은 자신의 취향에 맞춘 웹 사이트 개인화 서비스를 원한다. 이에 따라 관련 기업들은 웹 사이트의 회원가입을 통해 사용자들의 개인 정보를 관리하여 개인화 서비스를 지원하고 있다. 하지만 기업들의 개인 정보 유출 사고와 잘못된 기업 간 공유로 개인 정보보호 관리에 어려움이 있다는 문제점이 있다. 본 논문에서는 클라이언트 기반 딥러닝(Client-based Deep Learning)과 웹 브라우저 표준 데이터베이스 IndexedDB를 사용하여 검색 카테고리 추천 시스템을 구현한다.

Biomarker Detection of Specific Disease using Word Embedding (단어 표현에 기반한 연관 바이오마커 발굴)

  • Youn, Young-Shin;Kim, Yu-Seop
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.317-320
    • /
    • 2016
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다. 2차원으로 맵핑된 결과 값을 코사인 유사도를 사용하여 질병과 바이오 마커간의 유사도를 구한다. 이 유사도 결과 값 상위 20쌍의 결과를 가지고 실제 연구가 되고 있는지 구글 스콜라를 통해 관련 논문을 검색하여 확인하고, 검색 결과를 점수화 한다. 실험 결과 상위 20쌍 중에서 85%의 쌍이 실제적으로 질병과 바이오 마커 간의 관계를 파악하는 방향으로 진행 되고 있으나, 나머지 15%의 쌍에 대해서는 실질적인 연구가 잘 되고 있지 않은 것으로 파악되었다.

  • PDF

A Software Birthmark of Windows PE File Based on Import Table (Windows PE 파일의 임포트 테이블에 기반한 소프트웨어 버스마킹(Birthmarking) 기법)

  • Park, Hee-Wan;Lim, Hyun-Il;Choi, Seok-Woo;Han, Tai-Sook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.546-551
    • /
    • 2007
  • 소프트웨어 버스마크는 프로그램을 식별하는데 사용될 수 있는 프로그램의 고유한 특징을 말한다. 본 논문에서는 windows PE(Portable Executable) 파일의 API에 대한 정보를 가지는 임포트 테이블에 기반한 프로그램 버스마킹 기법을 제안한다. 버스마크의 신뢰도를 높이기 위한 방법으로 대부분의 Windows 프로그램에서 사용되는 범용의 API는 버스마크에서 제외시키고 프로그램 개개의 특성을 나타낼 수 있는 특화된 API에 초점을 맞추어서 비교하는 방법을 사용한다. 본 논문에서 제안한 버스마킹 기법을 평가하기 위해서 다양한 카테고리의 Windows 프로그램에 대해서 실험을 하였다. 신뢰도를 측정하기 위해서 같은 프로그램에 대해서 버전별로 비교를 하였고, 프로그램의 분류에 따라서 유사한 카테고리와 다른 카테고리에 대해서 비교를 하였다. 프로그램의 변환이나 난독화에도 견딜 수 있는 강인도(Resilience)를 평가하기 위해서 서로 다른 컴파일러를 사용하여 생성된 프로그램에 대해서 비교를 하였다. 실험 결과에서 본 논문에서 제안하는 버스마크가 프로그램의 특징을 충분히 표현하고 있음을 보여준다.

  • PDF

Biomarker Detection of Specific Disease using Word Embedding (단어 표현에 기반한 연관 바이오마커 발굴)

  • Youn, Young-Shin;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.317-320
    • /
    • 2016
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다. 2차원으로 맵핑된 결과 값을 코사인 유사도를 사용하여 질병과 바이오 마커간의 유사도를 구한다. 이 유사도 결과 값 상위 20쌍의 결과를 가지고 실제 연구가 되고 있는지 구글 스콜라를 통해 관련 논문을 검색하여 확인하고, 검색 결과를 점수화 한다. 실험 결과 상위 20쌍 중에서 85%의 쌍이 실제적으로 질병과 바이오 마커 간의 관계를 파악하는 방향으로 진행 되고 있으나, 나머지 15%의 쌍에 대해서는 실질적인 연구가 잘 되고 있지 않은 것으로 파악되었다.

  • PDF

고도화 시설원예에 관한 연구의 방향

  • 김문기
    • Proceedings of the Korean Society for Bio-Environment Control Conference
    • /
    • 1995.04a
    • /
    • pp.9-15
    • /
    • 1995
  • 농업의 시험 연구에 있어서 장치화 시스템화에 따른 생산공학적 연구의 강화의 필요성이 날로 높아가고 있다. 생산공학적 연구는 그 관련 부문이 수도작, 전작, 축산, 원예, 잠사 등 광범위하고, 더구나 공학으로서의 카테고리에 대한 사고방식도 여러가지이므로 생산공학적 연구의 정의가 공식화되어 있는 것은 아니다. 우리나라 농업계통의 공학적 연구 중에서도 특히 농업시설연구는 뒤쳐져있고, 연구자도 몇 사람 안되는 것이 실정이다. (중략)

  • PDF

A Study of Civil Unmanned Aerial System Category Classification (민간 무인항공기시스템 카테고리 분류에 관한 연구)

  • Ahn, Hyojung
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.43 no.7
    • /
    • pp.657-667
    • /
    • 2015
  • With development of technology and increase of commercial demand for unmanned aerial system(UAS), the related regulation has been prepared and complemented with the advanced countries such as Unite States and European Union(EU). However it is difficult for regulation to cover all areas of UASs practically since UASs have been developed in a variety of configurations and performance depending on their purpose. Therefore the reasonable criteria for the classification of UASs and their category should be suggested before development of the regulation. For this reason, many countries have been studying the standard for UASs classification and International Civil Aviation Organization(ICAO) makes an effort to prepare the international standards. In this paper, the new classification scheme which can complement domestic regulation is suggested based on investigation of the global trend of UAS classification and their researches.

A Technique of Forecasting Market Share of Transportation Modes after Introducing New Lines of Urban Rail Transit with Observed Mode Share Data (관측 교통수단 분담률 자료를 활용한 도시철도 신설 후 수단분담률 예측분석 기법)

  • Seo, Dong-Jeong;Kim, Ik-Ki;Lee, Tae-Hoon
    • Journal of Korean Society of Transportation
    • /
    • v.30 no.1
    • /
    • pp.7-18
    • /
    • 2012
  • This study suggested a method of forecasting market-share of each mode after introducing new urban rail transit lines. The study reflected the observed market share of presently operating urban rail transit into forecasting process in order to improve accuracy in predicting market share of each modes. For more realistic representation of the forecasting model, we categorized O/D pairs according to attributes of trip distance, access time and number of transfers. The analysis results of traveler's mode choice behavior with observed data showed that the trip distances are longer, the share of urban rail tends to be higher, and that the number of transfers is fewer and the access times are lesser, the share of urban rail also tends to be higher. Then, incremental logit model was used in estimating mode choice probabilities for O/D pairs along with rail transit lines while utilizing observed market shares of each modes and differences in transit service level. As the next step, the market share of rail transit after introducing new rail transit lines was forecasted by using incremental logit model with the intial share values calculated the previous analysis step. It also reflected changes in level of service for automobile in highway due to changes in highway systems and changes in mode shares after introducing new lines of rail transit. It can be expected that the proposed method would more realistically duplicates phenomena of mode choice behavior for rail transit and that it would be more theoretically logical than the typical existing methods using SP data and incremental logit model or using addictive logit model in this country.

The Relationship Between Trade Character Recognition and Attitude Toward Brand Category (상품카테고리에 대한 트레이드 캐릭터 인지와 태도간의 관계)

  • 김지애;조동민;오정화;홍찬석
    • Proceedings of the Korea Society of Design Studies Conference
    • /
    • 1999.10a
    • /
    • pp.58-59
    • /
    • 1999
  • 성인전용 제품을 위한 광고가 아동들에게 미치는 영향에 대한 실험적 연구는 미비한 편이다. 대부분의 연구는 아동들이 어떻게 반응하는지에 대한 사례 설명이나 설문응답에 관한 것들이다. (중략)

  • PDF

Cooperative Query Answering Using the Metricized Knowledge Abstraction Hierarchy (계량화된 지식 추상화 계층을 이용한 협력적 질의 처리)

  • Shin, Myung-Keun
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.3
    • /
    • pp.87-96
    • /
    • 2006
  • Most conventional database systems support specific queries that are concerned only with data that match a query qualification precisely. A cooperative query answering supports query analysis, query relaxation and provides approximate answers as well as exact answers. The key problem in the cooperative answering is how to provide an approximate functionality for alphanumeric as well as categorical queries. In this paper, we propose a metricized knowledge abstraction hierarchy that supports multi-level data abstraction hierarchy and distance metric among data values. In order to facilitate the query relaxation, a knowledge representation framework has been adopted, which accommodates semantic relationships or distance metrics to represent similarities among data values. The numeric domains also compatibly incorporated in the knowledge abstraction hierarchy by calculating the distance between target record and neighbor records.

  • PDF