• 제목/요약/키워드: search word

검색결과 379건 처리시간 0.03초

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

  • 신옥근
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.299-307
    • /
    • 2003
  • 화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.

연관규칙 마이닝을 활용한 뉴스기사 키워드의 연관성 탐사 (Discovering News Keyword Associations Using Association Rule Mining)

  • 김한준;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.63-71
    • /
    • 2011
  • 현재 대부분의 웹포털 사이트는 인기도 또는 중요도가 높은 키워드를 제공하는 서비스가 제공되고 있는데, 구체적으로 태그 클라우드 형태와 연관 검색 서비스와 같은 사용자 친화형 서비스를 지원하고 있다. 하지만 일반적으로 뉴스기사는 날짜와 분야별로 기사들이 분류되어 있기에, 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사를 쉽게 찾아보지는 못한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력내용을 기반으로 연관성 정도를 분석하기에 충분한 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 방식을 제안한다. 제안 기법은 기본적으로 연관규칙 마이닝을 이용하여 키워드 연관성을 추출하게 되며, 뉴스기사 특성을 반영하여 문장 내부에 존재하는 키워드에 한정하여 연관성을 추출한다. 연관된 키워드 집합을 이용하여 키워드와 가장 밀접한 기사를 검색할 뿐만 아니라, 연관 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

Triangulation Based Skeletonization and Trajectory Recovery for Handwritten Character Patterns

  • Phan, Dung;Na, In-Seop;Kim, Soo-Hyung;Lee, Guee-Sang;Yang, Hyung-Jeong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권1호
    • /
    • pp.358-377
    • /
    • 2015
  • In this paper, we propose a novel approach for trajectory recovery. Our system uses a triangulation procedure for skeletonization and graph theory to extract the trajectory. Skeletonization extracts the polyline skeleton according to the polygonal contours of the handwritten characters, and as a result, the junction becomes clear and the characters that are touching each other are separated. The approach for the trajectory recovery is based on graph theory to find the optimal path in the graph that has the best representation of the trajectory. An undirected graph model consisting of one or more strokes is constructed from a polyline skeleton. By using the polyline skeleton, our approach accelerates the process to search for an optimal path. In order to evaluate the performance, we built our own dataset, which includes testing and ground-truth. The dataset consist of thousands of handwritten characters and word images, which are extracted from five handwritten documents. To show the relative advantage of our skeletonization method, we first compare the results against those from Zhang-Suen, a state-of-the-art skeletonization method. For the trajectory recovery, we conduct a comparison using the Root Means Square Error (RMSE) and Dynamic Time Warping (DTW) in order to measure the error between the ground truth and the real output. The comparison reveals that our approach has better performance for both the skeletonization stage and the trajectory recovery stage. Moreover, the processing time comparison proves that our system is faster than the existing systems.

Survival Rates for Breast Cancer in Iranian Patients: a Meta-Analysis

  • Rahimzadeh, Mitra;Pourhoseingholi, Mohamad Amin;Kavehie, Behrooz
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권4호
    • /
    • pp.2223-2227
    • /
    • 2016
  • Background: Breast cancer is the most common cancer among Iranian women. Since development of the disease in Iranian women occurs relatively early, the survival rate matters considerably. In different countries, survival of breast cancer patients varies considerably. Therefore, the one-year, three-year, five-year, and ten-year survival rates for breast cancer in Iran were assessed using a meta-analysis. Materials and Methods: This systematic review and meta-analysis was based on valid Iranian sources including SID, MAGIRAN and IRANMEDEX, along with reliable English databases, namely, PUBMED and SCOPUS. In domestic databases, a search was conducted based on key words of breast cancer and survival rate, and in international databases, with "breast cancer" and the equivalent of "neoplasm" of Mesh Word, "survival rate" and "Iran." Then all reviewed papers and theses which met the inclusion criteria were selected for investigation. To conduct the analysis STATA 11.2 software and random-effects models were used. Results: In 24 studies, 22,745 participants were included. The one-year, three-year, five-year and ten-year survival rates were 0.956, 0.808, 0.695 and 0.559, respectively. The minimum and maximum survival rates for 5-years were 0.48 and 0.87. The average age of the onset of the disease was 48.3. Conclusions: As in Iran, since the onset of the disease is at low age, in spite of the relatively high survival rate as compared to other cancers, prevention and screening programs at early age for early stage diagnosis seems necessary.

국내외 지식경영연구의 주제어 프로파일링 및 동시출현분석을 통한 학문정체성에 관한 연구 (A Study on the Academic Identity through the Profiling and Co-Word Analysis of Domestic and Foreign Knowledge Management Research)

  • 윤승정;김민용
    • 지식경영연구
    • /
    • 제18권3호
    • /
    • pp.81-99
    • /
    • 2017
  • This study is to compare the main subjects of domestic and foreign knowledge management research in terms of keywords and to clarify whether domestic knowledge management research reflects research trends in overseas knowledge management research. Specifically, we try to find out whether the central activities such as knowledge sharing, knowledge generation, and acquisition, which are knowledge management activities of knowledge management research, are being studied without bias. In order to analyze this, we analyzed the data of domestic and foreign knowledge management research for the last 5 years from 2012 to 2016. In Korea, the Knowledge Management Society of Korea collected 167 papers and 787 keywords, and collected 132 papers and 640 keywords from the Korea Society of Management Information Systems in order to distinguish the research areas. Overseas papers collected 315 papers and 1,746 keywords published by Emerald. Also, we collected 382 papers and 1,633 keywords in the Korean Management Review and collected 646 papers and 2,879 keywords in the Korean Business Education Review. Frequency analysis and network analysis of 1,642 papers and 7,685 keywords are summarized as follows. The Knowledge Management Society of Korea has focused on knowledge sharing, and in 2016, interest in knowledge transfer and knowledge search has shifted. The Journal of Knowledge Management, which is published by Emerald, has been a major concern for knowledge transfer and knowledge sharing. The research trends of the Korea Society of Management Information Systems to distinguish a clear identity of knowledge management research are focusing on smart area and mobile domain such as information security domain, cloud, smart phone, and smart work. In the Korea Society of Management Information Systems research, the main subject of knowledge sharing is also commonly found.

시계열데이터의 모델기반 클러스터 결정 (Determining on Model-based Clusters of Time Series Data)

  • 전진호;이계성
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.22-30
    • /
    • 2007
  • 대부분의 실세계의 시스템들, 즉 경제, 주식시장, 의료분야 등의 많은 시스템들은 동적이며 복잡한 현상을 갖는다. 이러한 특징들의 시스템을 이해하는 전형적인 방법은 시스템행위에 대한 모델을 세우고 분석하는 것이다. 본 연구에서는 실세계의 동적 시스템에서 발생되는 시계열데이터들에 대하여 최적의 클러스터를 형성하기 위한 방법을 연구한다. 먼저 클러스터 수를 결정하는 기준으로 베이지안정보기준(BIC : Bayesian Information Criterion)근사법의 활용도를 검증하고 데이터 크기와 베이지안정보기준값의 상관관계를 파악함으로 탐색 효율을 높이는 방안을 제안하며 클러스터링 과정으로 모델기반과 유사기반의 방법론을 비교 확인하여 본다. 실제의 시계열데이터(주가)에 대해 실험을 시행하였고 베이지안정보기준 근사 측도는 데이터의 크기에 따라 파티션의 사이즈를 정확히 추정하는 것을 확인하였으며 또한 유사기반의 방식보다 모델기반의 방법론이 클러스터링에서 더 나은 결과를 갖는 것을 확인하였다.

의료소비자의 정보탐색행태와 지각된 위험이 고객만족도에 미치는 상대적 영향 (The Effects of Information Searching Behavior and Perceived risk on Consumer Satisfaction in Medical Service Consumer)

  • 채유미;이선희
    • 보건행정학회지
    • /
    • 제20권3호
    • /
    • pp.138-156
    • /
    • 2010
  • Objective : The purpose of this study is 1) to understand the information-searching behavior of health care consumers ; 2) to examine the relationship between the information-searching behavior of health-care consumers and regulatory variables such as socioeconomic factors, characteristics of medical utilization, and perceived risks ; and 3) to determine the factors that affect consumer satisfaction, especially with respect to information-searching behavior. Method : The data for this study were collected from 838 respondents in five university hospital located in three areas?Seoul, Gyeonggi province, and Chungchong province. As the first step of the study, we conducted a preliminary survey from September 23?26, 2008. At the second step, we conducted a survey on the effect of information-searching behavior on those individuals who had visited. Furthermore, personal interviews were conducted through a face-to-face survey between September 30 and October 17, 2008. Results : The major research findings that were obtained from the study were as follows : First, the age, educational level, and residential district were associated with information source utilization. Second, the level of information searching effort and quality of service had a significant effect on consumer satisfaction. Conclusion : These results show that it is essential for marketers to have in-depth knowledge about the young and educated people who actively search for information and about those who are in the prime of their life and rely on word-of-mouth communication from personal and experi in-al informers. Therefore, marketers should develop different marketing strategies to meet the needs of such consumers.

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법 (Inverse Document Frequency-Based Word Embedding of Unseen Words for Question Answering Systems)

  • 이우인;송광호;심규석
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.902-909
    • /
    • 2016
  • 질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고 있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.

감성 정보 기반 맞춤형 미디어콘텐츠 큐레이션 시스템 개발 (Development of Personalized Media Contents Curation System based on Emotional Information)

  • 임지희;장두성;최호섭;옥철영
    • 한국콘텐츠학회논문지
    • /
    • 제16권12호
    • /
    • pp.181-191
    • /
    • 2016
  • 현재 IPTV에서 서비스되는 미디어콘텐츠의 검색 질의어 분석을 통해, 고객의 미디어콘텐츠를 선택하는 기준을 살펴보았다. 그 결과 명시적인 메타정보뿐만 아니라 콘텐츠의 내용(소재, 줄거리 등)과 감성 정보가 중요한 요소가 된다는 점을 발견하였다. 그리하여 본 연구에서는 IPTV에서 제공하는 다양한 미디어콘텐츠를 사용자에게 효율적으로 제공하기 위해, 미디어콘텐츠의 감성 정보를 활용하기 위한 감성분류체계를 설계하였다. 그리고 제안한 감성분류체계를 기반으로 사용자 감성 프로파일을 구축하고, 단계적 처리 모듈을 탑재하여 미디어콘텐츠를 편성하는 맞춤형 큐레이션 시스템을 제안하였다. 마지막으로 제안한 맞춤형 미디어콘텐츠 큐레이션 시스템의 효과를 입증하기 위하여, 사용자 만족도 설문 조사를 실시하여 72.0점을 받았다. 또한 인기도 기준으로 편성한 결과와 제안한 시스템의 편성 결과를 비교한 결과 실 사용자의 시청 행위로 이어지는 비율이 최대 10배 높게 나타났다.

복잡한 배경에서 신경망을 이용한 얼굴인식 (Face Recognition on complex backgrounds using Neural Network)

  • 한준희;남기환;박호식;이영식;정연길;나상동;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1149-1152
    • /
    • 2005
  • 복잡한 배경을 지닌 이미지에서 얼굴을 검출하기란 매우 어려운 일이다. 본 논문에서는 신경망 모델을 기반으로 한 제한생성모델(CGM: Constrained Generative Model)을 제안한다. 학습 과정의 목표라 할 수 있는 생성은 신경망 모델이 입력 데이터를 발생시킬 확률을 계산하도록 하는 것이고, 계산하는데 걸리는 시간을 줄이기 위해서 고속 탐지 알고리즘을 제안한다. 얼굴 측면 검출과 오 인식의 수를 줄이기 위해서 조건을 혼합한 신경망을 사용하였고 반증으로 인한 제한을 둠으로써 모델의 측정 품질을 증가시켰다. 본 논문에서 제안한 검출 알고리즘이 0$_{\circ}$ ${\sim}$60$_{\circ}$ 사이에서는 90%정도의 검출율을 나타냄을 알 수 있었다.

  • PDF