• 제목/요약/키워드: 분할 학습

검색결과 897건 처리시간 0.032초

통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 (Determination of an Optimal Sentence Segmentation Position using Statistical Information and Genetic Learning)

  • 김성동;김영택
    • 전자공학회논문지C
    • /
    • 제35C권10호
    • /
    • pp.38-47
    • /
    • 1998
  • 실용적인 기계번역 시스템을 위한 구문 분석은 긴 문장의 분석을 허용하여야 하는데 긴 문장의 분석은 높은 분석의 복잡도 때문에 매우 어려운 문제이다. 본 논문에서는 긴 문장의 효율적인 분석을 위해 문장을 분할하는 방법을 제안하며 통계 정보와 유전자 학습에 의한 최적의 문장 분할 위치 결정 방법을 소개한다. 문장 분할 위치의 결정은 분할 위치가 태그된 훈련 데이타에서 얻어진 어휘 문맥 제한 조건을 이용하여 입력문장의 분할 가능 위치를 결정하는 부분과 여러 개의 분할 가능 위치 중에서 안전한 분할을 보장하고 보다 많은 분석의 효율 향상을 얻을 수 있는 최적의 분할 위치를 학습을 통해 선택하는 부분으로 구성된다. 실험을 통해 제안된 문장 분할 위치 결정 방법이 안전한 분할을 수행하며 문장 분석의 효율을 향상시킴을 보인다.

  • PDF

음소단위 TDNN에 기반한 한국어 연속 음성 인식을 위한 데이타 자동분할 (Automatic segmentation for continuous spoken Korean language recognition based on phonemic TDNN)

  • 박규봉;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.30-34
    • /
    • 1995
  • 신경망을 이용하는 연속 음성 인식에서 학습이라 함은 인위적으로 분할된 음성 데이타를 토대로 진행되는 것이 지배적이었다. 그러나 분할된 음성데이타를 마련하기 위해서는 많은 시간과 노력, 숙련 등을 요구할 뿐만아니라 그 자체가 인식도메인의 변화나 확장을 어렵게 하는 하나의 요인 되기도 한다. 그래서 분할된 음성데이타의 사용을 가급적 피하고 그러면서도 성능을 떨어뜨리지 않는 신경망 학습법들이 나타나고 있다. 본 논문에서는 학습된 인식기를 이용하여 자동으로 한국어 음성데이타를 분할한 후 그 분할된 데이타를 이용하여 다시 인식기를 재학습시켜나가는 반복 과정을 소개하고자 한다. 여기에는 TDNN이 인식기로 사용되며 인식단위는 음소이다. 학습은 cross-validation 기법을 이용하여 제어된다.

  • PDF

TrapMI: 분할 학습에서 모델 전도 공격을 회피할 수 있는 훈련 데이터 보호 방법 (TrapMI: Protecting Training Data to Evade Model Inversion Attack on Split Learning)

  • 나현식;최대선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.234-236
    • /
    • 2023
  • Edge AI 환경에서의 DNNs 학습 방법 중 하나인 분할 학습은 모델 전도 공격으로 인해 입력 데이터의 프라이버시가 노출될 수 있다. 본 논문에서는 분할 학습 환경에서의 모델 전도 공격에 대한 기존 방어 기술들의 한계점을 회피할 수 있는 TrapMI 기술을 제안하고, 이를 통해 입력 이미지를 원 본 데이터 세트의 도메인에서 특정 타겟 이미지 도메인으로 이동시킴으로써 이미지 복원의 가능성을 최소화시킨다. 추가적으로, 테스트 과정에서 타겟 이미지의 정보를 알 수 없는 제약을 회피하기 위해 AutoGenerator를 구축한 후 실험을 통해 원본 데이터 보호 성능을 검증한다.

한국어 인식을 위한 인식 단위와 학습 데이터 분류 방법에 대한 연구 (A Study on Recognition Units and Methods to Align Training Data for Korean Speech Recognition))

  • 황영수
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.40-45
    • /
    • 2003
  • 본 연구는 한국어 분절음 인식을 위한 인식 단위 설정과 학습시 학습 데이터 분할 방법에 대한 연구이다 대용량 음성 인식을 수행할 경우, 표준 패턴의 인식 단위를 단어나 음절이 아닌 분절음 단위로 사용하여야 효율적인 음성 인식을 수행할 수 있다. 본 연구는 이와 같은 분절음 인식을 수행하기 위한 연구로서, 인식 단위 설정 변화와 학습시 학습 데이터 분할 방법에 따른 인식 결과를 미국 OGI 연구소의 speech toolkit을 이용하여 검토한다. 인식 단위에 관해서 특히 모음의 경우 철자에 기초한 음소별 인식 단위 설정과 현대어 발음에 기초한 인식 단위 설정을 비교했으며, 그 결과 발음에 기초해 몇 개의 모음을 통합한 경우가 더 우수한 결과를 보였으며, 학습 데이터 분할 방법에 따른 인식 결과는 손으로 분할한 방법이 자동 분할 방법보다 약 2-3%의 인식 향상을 보였다. 또한 인식 단위의 설정에 있어서 독립된 분절음으로 설정한 경우보다 앞, 뒤의 소리의 상황을 고려한 바이폰(bipbone)을 이용할 경우가 5.7%-25.9%의 향상된 인식 결과를 보였다 인식 방법에 있어서는 HMM 만을 이용한 방법보다 신경회로망과 HMM을 결합한 인식 방법이 6.1%-7.5%의 더 좋은 인식률을 나타내었다.

  • PDF

3D CNN 기반 전립선 MRI 영상 분할 기술 (3D CNN-Based Segmentation of Prostate MR images)

  • 문주혁;최환;이세호;장원동;김창수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.145-146
    • /
    • 2017
  • 본 논문에서는 남성의 하반신을 촬영한 MRI 영상으로부터 전립선을 분할하는 알고리즘을 제안한다. 우선 3 차원 입체 영상을 학습하기 위해 3D 컨볼루션 계층(convolutional layer) 및 3D 풀링 계층(pooling layer)에 기반한 네트워크를 제안한다. 다음으로 네트워크의 최후단에 해당하는 전연결 계층(fully connected layer)의 강인한 학습을 돕는 잡음 계층을 제안한다. 잡음 계층은 네트워크의 학습 파라미터 혹은 출력 영상에 가우시안 잡음를 더함으로써 드롭 아웃과 같이 훈련 영상에 대한 과적합(overfitting)을 막고 테스트 영상에 강인한 네트워크의 학습을 돕는다. 마지막으로 실험을 통해 제안하는 기법이 기존 기법에 비해 우수한 분할 성능을 보임을 확인한다.

  • PDF

분할 가중치 테이블 역전파 신경망을 이용한 구구단 학습 기능성 게임 제작에 관한 연구 (A Study on the Implementation of Serious Game Learning Multiplication Table using Back Propagation Neural Network on Divided Interconnection Weights Table)

  • 이경호
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.233-240
    • /
    • 2009
  • 본 논문에서는 학습자의 흥미를 유도하기 위해 인간의 학습 과정과 유사하게 학습 진화되는 구구단 학습 기능성 게임을 제작하였다. 이 기능성 게임은 사용자인 구구단을 배우는 학습자가 교사적 위치에서 아바타를 학습시키는 은유를 이용하여 사용자가 학습되도록 구성하였다. 학습 진화 기술은 역전파 인공신경망을 이용하여 구성하였으나, 인공신경망의 학습 속도 문제를 분할 가중치 테이블 구조를 개발하여 개선하였다. 이렇게 구성된 엔진으로 학습 횟수 60~80번 정도에서 100% 학습률을 얻을 수 있었고, 또한 학습의 횟수에 따른 학습률이 기계적 상승을 하지 않고 학습시마다 다양한 비단조 형태로 증가하여 다양한 인간의 학습률과 유사하게 작동할 수 있었다.

명시야 현미경 영상에서의 세포 분할을 위한 이중 사전 학습 기법 (Dual Dictionary Learning for Cell Segmentation in Bright-field Microscopy Images)

  • 이규현;트란민콴;정원기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권3호
    • /
    • pp.21-29
    • /
    • 2016
  • 본 논문은 명시야 (bright-field) 현미경 영상를 위한 데이터 기반 세포 분할 알고리즘을 제시한다. 제시된 알고리즘은 일반적인 사전 학습 기법과 다르게 동시에 두 개의 사전과 관련된 희소 코드 (sparse code)를 통해 정의된 에너지 함수의 최소화를 진행하게 된다. 두 개의 사전 중 하나는 명시야 영상에 대해 학습된 사전이고 다른 하나는 사람에 의해 수작업으로 세포 분할된 영상에 대해 학습된 것이다. 학습된 두 개의 사전을 세포 분할 될 새로운 입력 영상에 대해 적용하여 이와 관련된 희소 코드를 획득한 후 픽셀 단위의 분할을 진행하게 된다. 효과적인 에너지 최소화를 위해 합성곱 희소 코드 (Convolutional Sparse Coding)와 Alternating Direction of Multiplier Method(ADMM)이 사용되었고 GPU를 사용하여 빠른 분산 연산이 가능하다. 본 연구는 이전에 사용된 가변형 모델 (deformable model)을 이용한 세포 분할 방식과는 다르게 제시된 알고리즘은 세포 분할을 위해 사전 지식이 필요없이 데이터 기반의 학습을 통해서 쉽고 효율적으로 세포 분할을 진행할 수 있다.

학습을 통한 공작기계부품의 가공방법 및 가공공구 결정에 관한 연구

  • 이충수;노형민
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1994년도 춘계공동학술대회논문집; 창원대학교; 08월 09일 Apr. 1994
    • /
    • pp.198-207
    • /
    • 1994
  • 공작기계부품 가공을 위한 공정표는 가공공정, 공정별 도면 분할, 가공기계 등을 결정하는 공정계획과 한 공정에 대하여 가공방법, 가공공구, 절삭조건, 공수등을 결정하는 작업계획을 통하여 발행된다. 작업계획에서 가공방법과 가공공구의 결정은 절삭조건과 공수에 영향을 주는 중요한 요소이다. 기존의 연구에서는 가공방법과 가공공구를 결정하기 위해 전문가 시스템 쉘(expert system shell)이용한 사례가 많았다. 이 경우, 지식 베이스(knowledge base) 의 구축에 많은 시간이 소요되고, 지식이 변했을 때 수정의 어려움이 있다. 본 연구에서는 표준화되지 않아 변경의 소지가 많은 가공방법과 가공공구 결정에 뉴럴 네트워크(neural network)의 한 종류인 백 프로퍼게이션 (back propagation) 학습 모델을 이용했다. 공정계획 후 분할된 공정별 도면으로부 터 크기 및 정밀도 등과 같은 특징형상(feature) 정보를 추출한 후, 특징형상 의 종류와 크기, 치수공차, 기하공차, 거칠기 등을 입력하여 가공방법 및 가 공공구가 출력되도록 학습패턴을 설정하여 학습시켰다. 학습패턴은 공정설계 전문가와 인터뷰하는 방법과 작업계획 과정을 분석하는 방법을 통하여 설정 했다. 백 프로퍼게이션 모델을 통하여 학습시킨 결과, 학습시킨대로 정확한 가공방법 및 가공공구를 결정할 수 있었다.

분할 정복 알고리즘 학습이 창의적 문제 해결에 미치는 효과 (Effect of Learning a Divide-and-conquer Algorithm on Creative Problem Solving)

  • 김윤영;김영식
    • 컴퓨터교육학회논문지
    • /
    • 제16권2호
    • /
    • pp.9-18
    • /
    • 2013
  • 정보 교과는 정보과학적 사고와 원리를 통해 창의적 문제해결력 함양을 교육목표로 하며, 문제 해결 방법과 절차 단원을 통하여 알고리즘 학습을 강조한다. 알고리즘 학습이 문제해결력 향상에 효과가 있다는 선행연구들을 바탕으로 창의적 문제해결력 향상에도 효과를 입증하는 연구들이 이루어지고 있다. 그러나 이러한 연구들이 알고리즘 내용보다는 CPS와 같은 교수학습 모형이나 콘텐츠에 의존하고 있기 때문에 알고리즘 학습의 중요성이 상대적으로 약해질 수 있다. 본 연구는 일반적인 문제해결과정과 창의적 문제해결과정이 동일하다는 관점에서 알고리즘 학습이 창의적 문제해결력 향상에 효과가 있음을 검증한다. 이를 위하여 일반적인 사고 가운데 창의적인 사고로 간주되는 유추 추론(analogical reasoning)에 대하여 살펴보고, 유추 추론에 필요한 바탕 지식으로 분할 정복 알고리즘을 선택하였다. 퀵 정렬 알고리즘 학습 실험 결과, 분할 정복 알고리즘의 원리 학습한 실험집단과 알고리즘의 절차만 학습한 통제집단이 퀵 정렬 문제를 해결하는 비율에는 차이가 없었으나, 탐색 문제에서는 실험집단이 통제집단 보다 이진 탐색을 사용하는 비율이 더 높았다. 이는 분할 정복과 같은 추상적인 원리를 포함하는 알고리즘 학습이 새로운 영역의 문제를 해결하는 유추 추론에 효과가 있으며, 이는 창의적 문제해결력 향상으로 이어질 수 있음을 의미한다.

  • PDF

사용자 개인정보보호를 위한 음성 데이터 분할 학습 모델 연구 (A Study of the Audio Data Split Learning Model to Protect User Privacy)

  • 장형범;유지현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.168-169
    • /
    • 2023
  • 머신 러닝의 학습을 위한 데이터는 개인정보가 포함된 데이터인 경우가 존재한다. 특히 음성인식 모델을 학습시키기 위해서 사용자의 음성 데이터가 필요하며, 이는 개인의 민감한 정보가 포함될 수 있다. 인공지능 학습을 위해 수집한 음성 데이터에 대한 정보보호 침해 공격이 발생할 수 있고, 해당 데이터에 대한 보호 조치가 필요하다. 본 연구는 음성 데이터를 안전하게 관리하기 위해 분할학습을 이용한 음성 데이터 학습 모델을 제안한다.