• 제목/요약/키워드: 상위5%

검색결과 1,188건 처리시간 0.032초

중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출 (Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA)

  • 김정태;김창현;천민아;김재훈;김재환
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

다층회귀신경망을 이용한 음성인식 (Speech Recognitioin Using Multilayered Recurrent Neural Networks)

  • 어태경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.267-271
    • /
    • 1998
  • 신경망에 의한 음절과 연속음성 인식시 동특성처리의 한방법으로 회귀신경망을 이용한다. 본 연구는 비회귀형 상위은닉층과 회귀형 하위은닉층을 가진 4층 구조의 다층회귀신경망으로 예측기를 반들어 나성화자 5명이 CV형 음절 14개, CVC형 음절 14개를 각각 5회씩 발음한 총 700개의 음성중 3회분인 420개 음성으로 학습한 후 나머지 2회분인 280개 음성으로 인식을 평가한다. 입력신호의 예측차수와 상, 하위 은닉층으 뉴런수를 변경시키면서 각각의 인식률을 조사해 본 결과 상위 은닉층의 뉴런이 10개이고 하위 은닉층의 뉴런이 10개와 15개 그리고 예측차수가 3,4차일 때 가장 양호한 인식기로 동작한다는 것을 알 수 있었다. 이 때 나타난 인식률은 Elman 망보다 다소 우세하다.

  • PDF

한국어 질의응답시스템에서 개체인식에 기반하여 대답 추출 (Answer Extraction based on Named Entity in Korean Question Answering System)

  • 이경순;김재호;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.184-189
    • /
    • 2000
  • 본 논문에서는 한국어 질의응답시스템에서 개체인식에 기반하여 대답을 추출하는 방법을 제안한다. 질의에 대한 문서검색을 통해 검색된 상위 문서를 대상으로 하여 대답이 들어 있을 가능성이 높은 단락을 추출한다. 질의 유형 분석을 통해 대답 유형을 파악한다. 단락에 나타나는 어휘들에 대해서 대답유형에 속하는지에 대한 개체인식을 통해서 대답을 추출한다. 질의응답 시스템의 평가를 위한 테스트컬렉션을 이용한 성능평가에서는 순위 5위까지의 대답추출에서 역순위 평균값이 개체추출에 대해서는 0.322, 50바이트 대답추출에서는 0.449, 250바이트 대답추출에서는 0.559이다. 상위 5이내에 정답을 포함할 비율은 개체추출에서는 48.90%, 50바이트 대답추출에서는 62.20%, 250바이트 대답추출에서는 68.90%을 성능을 보였다.

  • PDF

자원 제약하에서 가변 데이터 입력의 파이프라인 데이터 패스 함성을 위한 스케줄링 알고리즘 (A Scheduling algorithm for pipelined data path synthesis with variable initiation intervals under resource constraints)

  • 오주영;박도순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.34-36
    • /
    • 2001
  • 상위 수준 합성 과정에서 스케줄링은 하드웨어 동작을 표현한 연산들이 주어진 제약 조건을 만족하며 최적의 제어단계에 배정되도록 하는 과정이며 스케줄 결과는 목적 하드웨어의 면적과 실행속도에 많은 영향을 준다. 파이프 라인은 순차적인 데이터 입력을 중첩 수행하여 실행 속도와 자원 이용률을 동시에 증가시키는 방법이다. 상위 수준에서 파이프라인 데이터 패스를 합성하기 위한 기존의 스케줄링 알고리즘들은 고정된 데이터 입력 간 격열을 기반으로 제안된 것이 대부분이며, 가변 데이터 입력 간격을 지원하는 스케줄링 알고리즘으로는 시간 제약 하의 자원최소화 알고리즘[5]이 제안되었다. 본 논문에서는 가변데이터 입력 간격을 지원하는 자원 제약하의 실행 시간 최소화 알고리즘을 제안한다. 이를 위해 연산의 스테이지 인덱스가 초기에 고정되는 시간제약하의 스케줄링 알고리즘[5]을 응용하여 자원제약하의 스케줄 진행과정에서 증가되는 제어단계에 따라 스테이지 인덱스가 변경 될 수 있도록 하고 점진적인 모빌리티 축소에 의해 스케줄한다. 제안된 스케줄링 알고리즘의 실험 결과는 다양한 자원제약과 입력 간격렬에 대하여 제약조건을 만족하는 효과적인 스케줄 결과를 유도한다.

  • PDF

퍼지 의사 결정 트리 기반 한방 자가 진단 (Fuzzy Decision Tree Based Self Health Diagnosis of Oriental Medicine)

  • 정세훈;안하준;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.383-385
    • /
    • 2018
  • 기존의 한방 자가 진단 방법에서는 PCM 기반의 알고리즘을 적용시켰으나 고질적인 문제점 중의 하나인 증상 수가 급격하게 증가할 경우에는 진단 결과가 정확하게 도출되지 않는 현상이 발생한다. 이러한 문제점을 개선하는데 효율적인 퍼지 의사 결정 트리 알고리즘을 적용한다. 퍼지 의사 결정 트리는 과거의 데이터를 미리 학습시킨 후에 엔트로피에 따라 경계 값을 구한 후, 사용자가 여러 증상을 입력하면 입력된 증상에 해당되는 상위 질병 5개를 도출한다. 그리고 도출된 상위 5개의 질병과 도출된 질병의 원인과 치료하기 위한 민간요법을 제공한다. 질병과 증상에 대한 데이터베이스는 한의사가 추천한 여러 한의학 전문 서적을 기반으로 증상과 질병의 데이터베이스를 설계한 후, 한의학 전문의의 검증을 거쳐 구현하였다. 제안된 한방 자가 진단 시스템은 과거의 데이터를 바탕으로 증상을 학습함으로써 기존의 질병 진단 시스템보다 정확하고 신속한 진단 결과를 도출하는 것을 확인하였다.

  • PDF

중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출 (Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA)

  • 김정태;김창현;천민아;김재훈;김재환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

한국어 질의응답시스템에서 개체인식에 기반한 대답 추출 (Answer Extraction based on Named Entity in Korean Question Answering System)

  • 이경순;김재호;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-189
    • /
    • 2000
  • 본 논문에서는 한국어 질의응답시스템에서 개체인식에 기반하여 대답을 추출하는 방법을 제안한다. 질의에 대해 문서검색을 통해 검색된 상위 문서를 대상으로 하여 대답이 들어 있을 가능성이 높은 단락을 추출한다. 질의 유형 분석을 통해 대답 유형을 파악한다 단락에 나타나는 어휘들에 대해서 대답유형에 속하는지에 대한 개체인식을 통해서 대답을 추출한다. 질의응답 시스템의 평가를 위한 테스트컬렉션을 이용한 성능평가에서는 순위5까지의 대답추출에서 역순위 평균값이 개체추출에 대해서는 0.322, 50바이트 대답추출에서는 0.449, 250바이트 대답추출에서는 0.559이다. 상위 5이내에 정답을 포함할 비율은 개체추출에서는48.90%, 50바이트 대답추출에서는 62.20%, 250바이트 대답추출에서는 68.90%을 성능을 보였다.

  • PDF

음극 크기에 따라 가상 음극발진기를 이용한 고출력 마이크로파 발생 및 진단

  • 정민우;최명철;최성혁;조광섭;서윤호;최은하;엄환섭;신희명
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2000년도 제18회 학술발표회 논문개요집
    • /
    • pp.179-179
    • /
    • 2000
  • 음극의 크기에 따라 발생된 전자빔 전류가 도파관 영역에서 공간 전하 한계 전류를 초과할 경우 형성되는 가상 음극 (Virtual Cathode)을 이용한 축 방향으로의 고출력 마이크로파 발생 및 진단에 관한 연구를 수행하였다. 먼저 실험에 앞서 전산모사를 통해 결과를 예측하고 실험을 통해 확인하는 순으로 하였다. 전산 모사는 2-1/2차원 Partical-In-Cell(PIC) 코드인 "MAGIC"을 사용하여 축 방향으로 진행하는 새로운 개념의 가상 음극발진기를 모사하고, 정확한 경과를 얻기 위해 강렬한 상대론적 전자빔 발생 장치인 "천둥"( 최대 전압 600kV, 최대 전류 70KA, 60ns)을 사용하여 전산 모사에 넣어줄 전류값을 얻었다. 음극의 반지름이 2.5cm 일 때 전파되는 최대 출력이 약 800MW인 마이크로파가 발생되었고, 이때 출력변환 효율이 약 30%임을 전산모사를 통하여 알 수 있었다. 또한 전파하는 전기장의 축방향 성분(Ez)의 반지름 방향에 대한 분포 특성을 통하여 주된 전파 모드가 TM01와 그 상위모드의 조합으로 이루어졌음을 알았고 이때 기대되는 동작 진동수는 5~7 GHz임을 전산 모사 결과로부터 알 수 있었다. 실험을 통해서도 음극의 크기가 2.5cm 때, 최대 출력이 약 520MW인 마이크로파를 발생하였고, 이 때 출력 변환 효율은 약 8%이고, 방전 사진을 통해서 주된 동작 모드가 TM01와 그 상위모드의 조합으로 이루어졌음을 알았고, 이때 주된 출력 진동수는 5~6 GHz임을 알 수 있었다.는 5~6 GHz임을 알 수 있었다.

  • PDF

AHP 기법을 활용한 창업 성장단계별 특허분석 요인 중요도 연구

  • 김종식;남정민
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2022년도 춘계학술대회
    • /
    • pp.89-97
    • /
    • 2022
  • 본 연구에서는 창업 성장단계별 특허분석 요인들의 중요도와 우선순위를 제시하였고, 구체적으로 창업준비기, 창업기, 성장기, 성숙기 창업 성장단계 기준으로 구분하여 가장 먼저 선행되어야 할 특허분석 요인을 AHP기법을 활용하여 분석하였다. 분석결과, 상위요인의 중요도는 창업준비기(.633), 창업기(.231), 성장기/성숙기(0.136) 순으로 나타났다. 상위요인인 창업준비기의 하위요인 중요도는 환경분석(.593), 특허조사(.236), 특허분석(.171) 순으로 분석되었다. 창업기의 하위요인 중요도는 사업화전략(.415), R&D전략(.333), 보완출원전략(.138), 보유특허분석(.114) 순이고, 성장기/성숙기 하위요인 중요도는 후속IP창출(.337), 핵심특허 대응전략(.260), 후속R&D방향제시(.183), 특허인프라구축(.137), 라이센싱(매입)전략(.083) 순으로 나타났다. 전체 복합신뢰도 상위권 중요도 순위로는 1위 환경분석, 2위 특허조사, 3위 특허분석, 4위 사업화전략, 5위 R&D전략, 6위 후속 IP창출 순으로 나타났다. 이러한 연구 결과를 통해 창업을 준비하는 창업자에게 특허와 관련하여 단계별 집중해야 하는 요인의 중요도와 우선순위를 제시하고 더 생산적이고 효율적인 일들에 집중할 수 있는 가이드가 되기를 바란다.

  • PDF

장기해고노동자의 심리적 경험에 대한 질적 연구: 노동조합 조합원을 대상으로 (A Qualitative Study on Long Term Laid off Workers' Psychological Experiences: Focusing on labor Union Members)

  • 임정선
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.228-243
    • /
    • 2015
  • 본 연구에서는 노동조합 조합원인 장기해고노동자들이 해고와 이후 실업기간을 어떻게 경험하는지 그 변화과정을 현상학적 방법으로 분석하였다. 연구대상자는 평균해고 기간이 8년 4개월인 남성 해고노동자로 5명을 심층 면담하였다. 해고 당시의 심리적 경험, 해고 이후 지속적인 심리적 또는 신체적 변화, 현재 상태, 해고기간 동안의 대처방법 등을 반구조화 질문지에 근거하여 심층 면담을 진행하여 자료를 수집하였다. 이를 분석한 결과 21개의 하위 주제와 이를 포괄하는 5개의 상위주제를 구성하였다. 중요상위주제는 '해고 당시와 이후의 감정과 인식', '해고가 장기화되면서 생기는 증상과 변화', '장기화된 현재의 상태', '사회적 인식에 대한 양상', '해고에 대한 대처' 이었다. 상위주제와 하위범주에 대하여 기술하고 이와 관련된 장기해고노동자의 경험을 구체적으로 기술하였다. 마지막으로 장기해고노동자의 변화 및 경험을 선행연구를 바탕으로 논의하였다.