• 제목/요약/키워드: 문제 자동생성

검색결과 476건 처리시간 0.027초

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

시험도로 토압계 계측결과 분석 (An Analysis of Soil Pressure Gauge Result from KHC Test Road)

  • 인병억;김지원;이경하;이광호
    • 한국도로학회논문집
    • /
    • 제8권3호
    • /
    • pp.129-141
    • /
    • 2006
  • 아스팔트 포장은 점탄성재료로서 포장체에 발생되는 토압은 차량하중의 크기와 재하속도, 아스팔트 포장층의 온도와 하부층의 재료구성에 따라 크기와 분포 양상이 다르게 발생된다. 본 연구는 이러한 다양한 조건에 따른 포장체 하부의 토압분포를 분석하고, 기층과 보조기층의 지지력을 평가하는 평판재하시험 기준과 실제 계측된 토압과의 비교를 통해 현재 적용되고 있는 지지력기준에 대한 타당성을 검토하고자 한다. 또한 실제 포장단면을 모사한 유한요소해석을 통해 포장체 하부에 발생되는 토압을 예측하고 계측결과와 비교함으로서 포장체의 거동을 예측할 수 있는 모델을 제안 하고자 한다. 이를 위해서 시험도로의 2004년 8, 9, 11월과 2005년 8월에 계측이 수행된 아스팔트 포장 동적재하시험 결과 중 계측기 상태가 양호한 A5, A7, A14, A15 단면에 대해 계측결과의 분석을 수행하였다. 토압계의 분석은 차량하중의 크기와 속도. 아스팔트 포장의 온도, 포장하부의 재료구성에 따른 토압의 크기 변화와 차량하중으로 인한 포장체 내부의 횡방향과 깊이방향 하중의 영향 범위를 분석하였다. 포장체의 유한요소해석은 ABAQUS 프로그램을 활용하였으며, 실제 포장체의 거동을 모사하기 위해 시험도로 포장단면을 그대로 반영하고 계측이 이루어진 당시의 온도계측 자료를 활용해 아스팔트 포장의 물성을 적용하였다. 토압계의 분석결과 차량의 하중이 크고 저속으로 주행 할 때 토압의 크기는 증가하고 아스팔트층의 온도가 높을수록 하중의 영향반경이 작아지고 최대 토압크기는 증가하였다. 또한 실제 포장단면과 물성을 적용한 해석결과 계측결과와 매우 유사한 형태의 토압분포와 크기를 보였다. 그리고 기존 보조기층 및 동상방지층의 다짐관리 기준은 실측된 토압과 비교해 볼때 상당히 높은 수준으로 나타났다.다양한 요구에 의해 변화하는 조건들을 수용하기 쉽기 때문에 이에 중점을 두고 성능 문제를 해결하는 데 초점을 맞추었다. 데이터베이스 시스템의 일련의 처리 과정에 따라 DBMS를 구성하는 개체들과 속성, 그리고 연관 관계들이 모델링된다. 데이터베이스 시스템은 Application / Query / DBMS Level의 3개 레벨에 따라 구조화되며, 본 논문에서는 개체, 속성, 연관 관계 및 데이터베이스 튜닝에 사용되는 Rule of thumb들을 분석하여 튜닝 원칙을 포함한 지식의 형태로 변환하였다. 튜닝 원칙은 데이터베이스 시스템에서 발생하는 문제를 해결할 수 있게 하는 일종의 황금률로써 지식 도매인의 바탕이 되는 사실(Fact)과 룰(Rule) 로써 표현된다. Fact는 모델링된 시스템을 지식 도매인의 하나의 지식 개체로 표현하는 방식이고, Rule 은 Fact에 기반을 두어 튜닝 원칙을 지식의 형태로 표현한 것이다. Rule은 다시 시스템 모델링을 통해 사전에 정의되는 Rule와 튜닝 원칙을 추론하기 위해 사용되는 Rule의 두 가지 타업으로 나뉘며, 대부분의 Rule은 입력되는 값에 따라 다른 솔루션을 취하게 하는 분기의 역할을 수행한다. 사용자는 제한적으로 자동 생성된 Fact와 Rule을 통해 튜닝 원칙을 추론하여 데이터베이스 시스템에 적용할 수 있으며, 요구나 필요에 따라 GUI를 통해 상황에 맞는 Fact와 Rule을 수동으로 추가할 수도 었다. 지식 도매인에서 튜닝 원칙을 추론하기 위해 JAVA 기반의 추론 엔진인 JESS가 사용된다. JESS는 스크립트 언어를 사용하는 전문가 시스템[7]으로 선언적 룰(Declarative Rule)을 이용하여 지식을 표현 하고 추론을 수행하는 추론 엔진의 한 종류이다. JESS의 지식 표현 방식은 튜닝 원칙을

  • PDF

ART2 기반 RBF 네트워크와 얼굴 인증을 이용한 주민등록증 인식 (Recognition of Resident Registration Card using ART2-based RBF Network and face Verification)

  • 김광백;김영주
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2006
  • 우리나라의 주민등록증은 주소지, 주민등록번호, 얼굴사진, 지문 등 개인의 다양한 정보를 가진다. 현재의 플라스틱형 주민등록증은 위조 및 변조가 쉽고 그 수법이 날로 전문화 되어가고 있다. 따라서 육안으로 위조 및 변조 사실을 쉽게 확인하기가 어려워 사회적으로 문제를 일으키고 있다. 이에 본 논문에서는 개선된 ART2 기반 RBF 네트워크에 이용한 주민등록번호 인식과 얼굴 인증을 통한 주민등록증 자동 인식 방법을 제안한다. 제안된 방법은 주민등록증 영상으로부터 주민등록번호와 발행일을 추출하기 위하여 주민등록증 영상에 소벨 마스킹와 미디언 필터링을 적용한 후에 수평 스미어링을 적용하여 주민등록번호와 발행일 영역을 추출한다. 그리고 원영상에 대해 고주파 필터링을 적용하여 영상 전체를 이진화하고, 이진화된 영상에 CDM 마스크를 적용하여 주민등록번호와 발행일 코드를 복원한 다음, 검출된 각 영역에 대해 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 문자를 추출한다. 추출된 주민등록번호 등의 개별 문자를 인식하기 위해 개선된 ART2 기반 RBF 네트워크를 제안하고 인식에 적용한다. 제안된 ART2 기반 RBF 네트워크는 학습 성능을 개선하기 위하여 중간층과 출력층의 학습에 퍼지 제어 기법을 적용하여 학습률을 동적으로 조정한다. 얼굴 인증은 템플릿 매칭 알고리즘을 이용하여 얼굴 템플릿 데이터베이스를 구축하고 주민등록증에서 추출된 얼굴 영역과의 유사도를 측정하여 주민등록증 얼굴 영역의 위조여부를 판별한다. 제안된 주민등록증 인식 방법의 성능을 평가하기 위해 원본 주민등록증 영상에 대해 얼굴 영역 위조, 노이즈추가, 대비 증감, 밝기 증감 그리고 영상 흐리기 등의 변형된 영상들을 생성하여 실험한 결과, 제안된 방법이 주민등록번호 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다

  • PDF

프렌차이점에서 사용되는 튀김류의 산패도 및 트랜스지방의 함량 비교

  • 김영성
    • 대한위생학회:학술대회논문집
    • /
    • 대한위생학회 2005년도 정기학술심포지움
    • /
    • pp.76-97
    • /
    • 2005
  • 사회가 고도화 되어가면서 소비자의 식품 안전성에 대한 인식의고급화가 새로운 식품산업의 장을 역고 있다. 좀더 건강하게 오래살기 위한 무한의 욕망을 안고 식품 소재의 차별화 붐이 일고 있는 것이다. 본 연구에서는 가장 쉽게 찾을 수 있고 또 많은 소비자가 찾는 유명제품의 후라이드치킨을 대상으로 하여 사용하고 있는 튀김유지의 안전성을 확보하고자 20여곳의 튀김유지를 수거하여 이화학적 성분 검사 및 지방산 분석을 실시하였다. 그 결과 너무나도 놀라운 아니 알면서도 모르는척 넘어가고자 했던 여러 사실들을 다시한번 상기시키는 계기가 되었다. 대상 제품으로는 A사를 제외한 B사,C사,D사,E사,G사의 총 7개 업소의 20개 시유을 수거, 분석한 결과 A사의 유지에서는 산패의 진행이 거의 미비한 안정한 상태를 나타내었으나 C사, B사는 산패가 어느정도 진행하고 있는 결과를 나타내었다. 그러나 D사는 산패가 상당히 진행되거나 일반 식용유가 아닌 경화유를 사용하는 것으로 나타났다. 사용할수 없는 기름이란 오랜시간 튀김으로 인하여 뜨거운 기름이 너무 거품을 낼때, 연기가 많이 날 때(대개 오래 끓임으로 해서 저급지방이 되었을때), 좋지 않은 맛이나 검은색을 나타낼때는 말을 하는데 A사 시유를 제외하고는 대부분의 시유에서 이러한 현상이 나타났다. 튀김의 역할이란 풍미, 식감, 외관등이 향상되며 영양가가 증가되는 것을 말하는데 역으로 오히려 건강을 해치는 식품을 접하게 되는 것이다. 튀김에 요구하는 성질로 가열안정성, 자동산화에 대한 보존안정성, 색과 풍미 등을 들수있는데 A사에서 사용하는 올리브유는 바로 이러한 조건을 만족하면서 제품의 맛과 국민의 건강까지 고려하였다 볼 수 있다.량은 5,656 kg/ha, TDN 수량은 3,531 kg/ha 많았다. 한편 관행 및 유기 여름사료작물의 생산비에서는 면적당 생산비는 관행이 많았으나 건물 TDN 1kg 당 생산비는 유기 여름사료작물이 관행보다 건물은 66원, TDN은 100원 많이 소요되었다. 이상의 연구결과를 종합해볼 때 관행 생산 여름 사료작물이 유기생산보다 생산량과 단위면적당 생산비는 많았으나 kg당 생산비는 유기 생산이관행보다 많이 소요되었다. 생산비 중에서 가장 많은 비중을 차지한 것은 지대(땅값)였으며, 다음은 퇴비와 노동력이 가장 많은 비중을 차지하여 농가의 낙농경영에 가장 어려운 문제는 땅값, 퇴비생산, 노동력으로 평가되었다.y 처리 공정에 이용될 수 있는데 이것은 그 처리로 인해 새로운 알러젠이 생성될 수도 있다. 또한 복합처리로 allergy를 감소시키면 연속적이고 동시적으로 하기 때문에 원가를 절감할 수 있다.환경현안에 대한 정치경제적 접근을 외면하지 말고 교과서 저작의 소재로 삼을 수 있어야 하며, 이는 '환경관리주의'와 '녹색소비'에 머물러 있는 '환경 지식교육'과 실천을 한단계 진전시키는 작업으로 이어질 것이다. 이후 10년의 환경교육은 바로 '생태적 합리성'과 '환경정의'라는 두 '화두'에 터하여 세워져야 한다.배액에서 약해를 보였으나, 25% 야자지방산의 경우 50 ${\sim}$ 100배액 어디에서도 액해를 보이지 않았다. 별도로 적용한 시험에서, 토마토의 경우에도 25% 야자지방산 비누 50 ${\sim}$ 100배액 모두 약해를 발생하지 않았으나, 오이에서는 25% 야자지방산 비누 100배액에도 약해를 나타내었다. 12. 이상의 결과

  • PDF

IT 센싱 기술을 이용한 전통주 발효의 품질관리 연구 (Study of Quality Control of Traditional Wine Using IT Sensing Technology)

  • 송혜지;최지희;박찬원;신동범;강성수;오성훈;황권택
    • 한국식품영양과학회지
    • /
    • 제44권6호
    • /
    • pp.904-911
    • /
    • 2015
  • 전통주는 성장할 수 있는 전기를 맞이하고 있으나 전통적인 생산방식으로 인한 표준화, 품질관리의 문제점을 안고 있다. 이에 sensor 기술과 RFID 기술을 이용하여 품질관리와 표준화문제에 접근하고자 하였다. RFID 기술은 원거리 Sensing과 즉각적인 제어로서 표준화와 품질의 고급화를 이룰 수 있는 최적화 기술이다. 본 실험에서 3차에 걸친 발효과정을 측정하였는데 발효조의 내부온도에 따라 발효종말점이 14, 17, 20일까지 달랐다. pH의 경우 발효 초기 pH가 7.89, 7.95, 7.68에서 최종 pH 3.31에서 2.96까지 급격한 pH의 강하가 이뤄졌고 이후 서서히 상승으로 진행하다 최종에 pH 3.34에 도달하였다. 총산의 경우 발효 초기 0.1, 0.2, 0.1%에서 3~4일까지 급격히 총산이 증가하였고 이후 완만한 상승이 이어지다 최종에 pH 2.3~2까지 낮아졌다. 이는 발효 기간 중에 생성된 유기산과 밀접한 관계가 있다. 당도의 측정은 발효기에 부착한 sensor를 통하여 자료를 얻었는데 발효에서 당도의 변화는 초기 급격한 상승을 이룬 다음 중간 발효에서는 점차 낮아졌고 발효 후기에 갈수록 점차 증가하는 경향을 보였다. 알코올의 측정과 총당의 측정은 아직까지 자동으로 검출이 어려워 manual 방식으로 측정하였는데, 알코올 함량은 초기에 급격히 증가하다가 발효 5일째서부터 대부분 완만한 증가를 보였고 1차 발효에서는 17.3%, 2차 발효에서는 16.7%, 3차 발효에서는 17.1%에서 발효가 완료되었다. 유리당은 1일째 4,171.44 mg%를 나타내다 초기에 급격한 감소를 보였고 10일을 전후하여 증가폭의 변화가 둔화되었다. 전체 중에 glucose가 제일 많은 함량이었고, 다음으로 sucrose, fructose 순이었다. 유기산의 경우 초기에 전체 61.48 mg%를 보이면서 발효 11일째까지 88.09 mg%를 보여 아주 완만한 상승이었는데, 이후 급격한 상승을 보였고 14일째 266.21 mg%에서 정점을 찍고 이후 완만한 진행을 보였다. 전통주의 발효에서 품질관리를 통한 전통주의 고급화 방법의 하나로 RFID 기술을 도입하여 이상발효의 차단과 적정한 sensor를 이용하여 지표로 활용, 정확한 발효과정을 판단할 필요가 있다. pH, 총산, 알코올 그리고 총당은 전통주 품질관리의 지표로 활용 가능한 바, 전통주 발효 전 과정을 monitering 하여 이상발효 유무의 중요한 지표로 활용이 가능할 것이다.

문서 요약 기법이 가짜 뉴스 탐지 모형에 미치는 영향에 관한 연구 (A Study on the Effect of the Document Summarization Technique on the Fake News Detection Model)

  • 심재승;원하람;안현철
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.201-220
    • /
    • 2019
  • 가짜뉴스가 전세계적 이슈로 부상한 최근 수년간 가짜뉴스 문제 해결을 위한 논의와 연구가 지속되고 있다. 특히 인공지능과 텍스트 분석을 이용한 자동화 가짜 뉴스 탐지에 대한 연구가 주목을 받고 있는데, 대부분 문서 분류 기법을 이용한 연구들이 주를 이루고 있는 가운데 문서 요약 기법은 지금까지 거의 활용되지 않았다. 그러나 최근 가짜뉴스 탐지 연구에 생성 요약 기법을 적용하여 성능 개선을 이끌어낸 사례가 해외에서 보고된 바 있으며, 추출 요약 기법 기반의 뉴스 자동 요약 서비스가 대중화된 현재, 요약된 뉴스 정보가 국내 가짜뉴스 탐지 모형의 성능 제고에 긍정적인 영향을 미치는지 확인해 볼 필요가 있다. 이에 본 연구에서는 국내 가짜뉴스에 요약 기법을 적용했을 때 정보 손실이 일어나는지, 혹은 정보가 그대로 보전되거나 혹은 잡음 제거를 통한 정보 획득 효과가 발생하는지 알아보기 위해 국내 뉴스 데이터에 추출 요약 기법을 적용하여 '본문 기반 가짜뉴스 탐지 모형'과 '요약문 기반 가짜뉴스 탐지 모형'을 구축하고, 다수의 기계학습 알고리즘을 적용하여 두 모형의 성능을 비교하는 실험을 수행하였다. 그 결과 BPN(Back Propagation Neural Network)과 SVM(Support Vector Machine)의 경우 큰 성능 차이가 발생하지 않았지만 DT(Decision Tree)의 경우 본문 기반 모델이, LR(Logistic Regression)의 경우 요약문 기반 모델이 다소 우세한 성능을 보였음을 확인하였다. 결과를 검증하는 과정에서 통계적으로 유의미한 수준으로는 요약문 기반 모델과 본문 기반 모델간의 차이가 확인되지는 않았지만, 요약을 적용하였을 경우 가짜뉴스 판별에 도움이 되는 핵심 정보는 최소한 보전되며 LR의 경우 성능 향상의 가능성이 있음을 확인하였다. 본 연구는 추출요약 기법을 국내 가짜뉴스 탐지 연구에 처음으로 적용해 본 도전적인 연구라는 점에서 의의가 있다. 하지만 한계점으로는 비교적 적은 데이터로 실험이 수행되었다는 점과 한 가지 문서요약기법만 사용되었다는 점을 제시할 수 있다. 향후 대규모의 데이터에서도 같은 맥락의 실험결과가 도출되는지 검증하고, 보다 다양한 문서요약기법을 적용해 봄으로써 요약 기법 간 차이를 규명하는 확장된 연구가 추후 수행되어야 할 것이다.